Pular para o conteĂºdo principal

WikiData Overview

Alguns vĂ­deos

https://youtu.be/m_9_23jXPoE
https://youtu.be/Oips1aW738Q
https://youtu.be/1jHoUkj_mKw
https://youtu.be/TXdjxnjCvng
https://youtu.be/GFh9gVUgbuA
https://youtu.be/YwhDkxDwsbA
https://youtu.be/iZVrhkoj6BM
https://youtu.be/he_ezHMVtO8

Wikidata Ă© Linked Data, Machine and Human readable. 

As an encyclopedia is to people – a cross-referenced collection of information people can use to learn and to verify knowledge – a knowledge base is to machines. Knowledge bases can be used to drive machine learning and other AI techniques to provide core data to feed software projects, and as tools for cross-integration and cross-validation of databases, among many other uses.

It is important to have some sort of repository of knowledge that is structured to be reused within and across such projects, and this is Wikidata’s primary role. 

A Wikipedia Infobox is a summary description of a person, place, or thing in some sort of structure that allows it to be collected or contrasted with other similar things. The structure is edited by a Wikipedia editor as a set of attributes and values. 

Perguntas complexas: Quais as universidades do Reino Unido? 

Open Knowledge Graph. OPEN = cc0 license permite qualquer uso


A informaĂ§Ă£o Ă© atualizada em todas as 400+ lĂ­nguas independente da lĂ­ngua onde foi criada ou editada. 

Schema.org > 30% dos dados publicados na Web seguem esse esquema

> 8,5 milhões de queries SPARQLs por dia

wdt: Ă© o prefixo usado comumente para WikiData. 

As propriedades do schema Wikidata seguem o padrĂ£o P<99999> (exemplo P21 Ă© gĂªnero) e os itens (entidades) dos sujeitos e objetos das declarações seguem o padrĂ£o Q<999999> (exemplo Q6501072 Ă© Feminino, Q34851 Ă© Elizabeth Taylor, atriz )

Identificadores Ăºnicos (Q ID) para todos os itens criados. 

QIDs e PIDs sĂ£o justificados pq sĂ£o universais para qq lĂ­ngua, sĂ£o estĂ¡veis (rĂ³tulos human readable podem mudar), nĂ£o sĂ£o reusados, sĂ£o pequenos (curtos)

Os itens (entidades) podem ser conceitos concretos ou abstratos. Pessoas, Lugares, Instituições, Livros, Planetas, Elementos da Natureza, ... e também sentimentos, emoções, assuntos/temas, ...

A visĂ£o do WikiData como um documento para cada item possui: ID, Label (como se fosse o tĂ­tulo), DescriĂ§Ă£o, Lista de Aliases, na lingua de preferĂªncia,  Statements / Declarações com propriedades e valor da propriedade ou a relaĂ§Ă£o com outra entidade e o Label da Entidade em outras lĂ­nguas.

Os aliases sĂ£o rĂ³tulos alternativos para referenciar uma entidade, sĂ£o equivalentes quando tratados como parĂ¢metro de busca. 

Wikidata is structured as a repository of items. An item is, in common knowledge base terms, a thing, an entity, a concept. In short, whatever can be described. A repository has properties, the most important of which in Wikidata terms are the label and description. An item might also have one or more aliases, alternative labels.

Each item has a unique identifier. It is always in the form of a letter Q followed by a number. Each property also has an identifier, a P followed by a number. A statement is the triple of an item ID, a property ID, and a value. A value can be another item, which is called a reference to another item

As declarações / statements (arestas direcionadas do grafo) possuem qualificadores como data de inĂ­cio e fim para melhor contextualizar a informaĂ§Ă£o, ou seja, sĂ£o anotadas com pares de propriedade-valor

NĂ£o tem curadoria, nĂ£o se colocam como a fonte primĂ¡ria das informações, nĂ£o se preocupam com a veracidade mas com o que diversas fontes dizem sobre o assunto. O link entre as fontes de dados e cada declaraĂ§Ă£o deve ser especificado como qualificador para direcionar para autoridades no assunto.  

Notice where it says “O references.” Wikipedia and related sites strongly encourage contributors to cite sources. This goes for structured data as well.

Cada propriedade possui um tipo de dados como objeto: entidades de um tipo especĂ­fico, quantidades, pontos no tempo, URLs, texto em determinada lĂ­ngua, etc .... Uma vez associados a um tipo isso nĂ£o pode ser mudado. As propriedades tambĂ©m possuem restrições/constraints que podem ser aplicadas online ou offline

There is actually a defined constraint on this property that values must be “administrative territorial entity” items, which would normally be enough to automatically catch this “Chao Zhongxun” issue, but unlike in most databases and much software, Wikidata constraints are not automatically enforced. You can have bots run consistency checks on the data, and the idea is that errors are allowed. Never forget that the Wikimedia projects are all about human curation, even in the case of Wikidata, the most machine-oriented.

Multi-grafo pq a mesma aresta pode ocorrer mais de uma vez com diferentes anotações

No Wikidata Query Service (WDQS) tem exemplos de queries que podem ser respondidas com o KB. VĂ¡rias formas de visualizaĂ§Ă£o dos dados como Timeline, Mapa, GrĂ¡fico de Barras, etc... 

https://query.wikidata.org                ..........    WDQS
https://tools.wmflabs.org/sqid/#/

Freebase era do Google e foi encerrado em 2015.

Wikidata surgiu em 2012 para estruturar as informações disponíveis nos verbetes da Wikipedia.

QUERY LINKS (Histropedia - Timeline): - 

Women educated at the university of Edinburgh (simple version) : http://tinyurl.com/hvp7kjk

Women educated at the university of Edinburgh (improved version): http://tinyurl.com/jcvnw6g

Women educated at the university of Edinburgh (timeline of improved version): http://tinyurl.com/j97j3xz

É mandatĂ³rio especificar a lĂ­ngua dos rĂ³tulos que se deseja obter ao realizar as consultas e acrescentar o sufixo "Label" nas variĂ¡veis para retornar o rĂ³tulo ao invĂ©s do ID da Entidade.

Como aumentar o conteĂºdo da Wikipedia dentro da WikiData? Informações redundantes fazem sentido para representaĂ§Ă£o para humanos em linguagem natural. 

WikiData nĂ£o tem inferĂªncia, sĂ³ contĂ©m fatos mas Ă© possĂ­vel colocar uma mĂ¡quina de inferĂªncia sobre ela para deduzir a partir dos fatos e responder a perguntas de senso comum como "Podem as vacas voar?".

Tutorial para acessar WikiData com jupyter notebook -> https://youtu.be/j5KwP4ifHWs

How to search entities in wikidata database and get a short description about them using Wikidata API. 

Code here: https://gist.github.com/nikhilkumarsi... https://www.wikidata.org/w/api.php

IRI para recuperar entidades da Wikidata
 
http://www.wikidata.org/entity/Q5 redirects permanently (301) to https://www.wikidata.org/entity/Q5, which redirects (303) to https://www.wikidata.org/wiki/Special:EntityData/Q5, which by default redirects (303) to a JSON document https://www.wikidata.org/wiki/Special:EntityData/Q5.json.
 
curl -L -H "Accept: text/turtle" http://www.wikidata.org/entity/Q5
 
Curso sobre KG que cobre Wikidata -> https://iccl.inf.tu-dresden.de/web/Knowledge_Graphs_(WS2020)/en
Canal do YouTube -> https://www.youtube.com/channel/UCCvDWNsR8YlQrB1tSj9Xqsw/videos

Recursos que podem ser interessantes explorar

https://github.com/nichtich/wikidata-taxonomy

@dataset{benno_funfstuck_2020_3701865,
  author       = {Benno FĂ¼nfstĂ¼ck},
  title        = {Wikidata Dump Taxonomy},
  month        = mar,
  year         = 2020,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.3701865},
  url          = {https://doi.org/10.5281/zenodo.3701865}
}

http://wikifier.org/info.html ..... tem post sobre aqui no Blog

Graph Database que suporta a WDQS -> https://blazegraph.com/

ComentĂ¡rios

  1. Descobri que no DBLP Ă© possĂ­vel acessar a referĂªncia de um autor no Wikidata. Vou verificar se o mesmo acontece para Revistas, ConferĂªncias e Artigos

    ResponderExcluir
  2. NĂ£o tem curadoria para Qnodes mas tem para Pnodes (propriedades)

    ResponderExcluir
  3. Wikibase stores data internally as JSON and makes that data available in various formats including, but not limited to, RDF.

    Wikibase stores data in JSON instead of RDF because Wikibase’s data model is considerably more complex than a simple triple -- users may add references, qualifiers and ranks.

    A descriĂ§Ă£o do JSON estĂ¡ aqui -> https://doc.wikimedia.org/Wikibase/master/php/md_docs_topics_json.html

    ResponderExcluir
    Respostas
    1. O modelo de dados WD -> https://www.mediawiki.org/wiki/Wikibase/DataModel

      Tentar entender melhor esse conceito de snack

      Excluir

Postar um comentĂ¡rio

Sinta-se a vontade para comentar. CrĂ­ticas construtivas sĂ£o sempre bem vindas.

Postagens mais visitadas deste blog

Connected Papers: Uma abordagem alternativa para revisĂ£o da literatura

Durante um projeto de pesquisa podemos encontrar um artigo que nos identificamos em termos de problema de pesquisa e tambĂ©m de soluĂ§Ă£o. EntĂ£o surge a vontade de saber como essa Ă¡rea de pesquisa se desenvolveu atĂ© chegar a esse ponto ou quais desdobramentos ocorreram a partir dessa soluĂ§Ă£o proposta para identificar o estado da arte nesse tema. Podemos seguir duas abordagens:  realizar uma revisĂ£o sistemĂ¡tica usando palavras chaves que melhor caracterizam o tema em bibliotecas digitais de referĂªncia para encontrar artigos relacionados ou realizar snowballing ancorado nesse artigo que identificamos previamente, explorando os artigos citados (backward) ou os artigos que o citam (forward)  Mas a ferramenta Connected Papers propõe uma abordagem alternativa para essa busca. O problema inicial Ă© dado um artigo de interesse, precisamos encontrar outros artigos relacionados de "certa forma". Find different methods and approaches to the same subject Track down the state of the art rese...

Knowledge Graph Embedding with Triple Context - Leitura de Abstract

  Jun Shi, Huan Gao, Guilin Qi, and Zhangquan Zhou. 2017. Knowledge Graph Embedding with Triple Context. In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17). Association for Computing Machinery, New York, NY, USA, 2299–2302. https://doi.org/10.1145/3132847.3133119 ABSTRACT Knowledge graph embedding, which aims to represent entities and relations in vector spaces, has shown outstanding performance on a few knowledge graph completion tasks. Most existing methods are based on the assumption that a knowledge graph is a set of separate triples, ignoring rich graph features, i.e., structural information in the graph. In this paper, we take advantages of structures in knowledge graphs, especially local structures around a triple, which we refer to as triple context. We then propose a Triple-Context-based knowledge Embedding model (TCE). For each triple, two kinds of structure information are considered as its context in the graph; one is the out...

KnOD 2021

Beyond Facts: Online Discourse and Knowledge Graphs A preface to the proceedings of the 1st International Workshop on Knowledge Graphs for Online Discourse Analysis (KnOD 2021, co-located with TheWebConf’21) https://ceur-ws.org/Vol-2877/preface.pdf https://knod2021.wordpress.com/   ABSTRACT Expressing opinions and interacting with others on the Web has led to the production of an abundance of online discourse data, such as claims and viewpoints on controversial topics, their sources and contexts . This data constitutes a valuable source of insights for studies into misinformation spread, bias reinforcement, echo chambers or political agenda setting. While knowledge graphs promise to provide the key to a Web of structured information, they are mainly focused on facts without keeping track of the diversity, connection or temporal evolution of online discourse data. As opposed to facts, claims are inherently more complex. Their interpretation strongly depends on the context and a vari...