Pular para o conteúdo principal

ORKG Open Knowledge Research Graph

Home -> https://projects.tib.eu/orkg/

Vídeo explicativo introdutório -> https://youtu.be/mbe-cVyW_us

Nova abordagem para Scholarly Knowledge Communication 

Ideias, Abordagens, Métodos e Resultados presentes em diferentes publicações científicas são elementos no ORKG e isso permite a comparação da literatura em diversas dimensões de modo a facilitar ao pesquisador a descrição resumida do estado da arte em um determinado campo/tema de pesquisa, principalmente para questões interdisciplinares. 

Os artigos para comparação podem ser sugeridos pela plataforma (com base na similaridade) ou selecionados pelo usuário.

Em 25/02/2021 essa era o tamanho da base de dados:

 

Em 29/04/2021 peguei dados mais recentes sobre o tamanho do KG


Os trabalhos devem ser incluídos pelos autores na plataforma, nesse link estão as instruções sobre os metadados que devem ser usados na catalogação -> https://projects.tib.eu/orkg/documentation/ 

A ferramenta permite inclusive a especificação de templates de metadados e extrai metadados de outras plataformas (ao se informar o DOI do artigo).

Nesse link tem uma vídeo demonstração da catalogação e a inclusão de características de cada contribuição no modelo triplificado <s, p, o>, ou seja, o usuário seleciona os predicados existentes ou sugere novos, inclui valores para os dataproperties (literals) ou cria/relaciona objetos relativos aos object properties (URI) -> https://youtu.be/BhI-gngCl0k

Os dados do ORKG podem ser visualizados em formato tabular e grafo. 

 


Existem grupos de curadores temáticos para acompanhar o conteúdo que está sendo adicionado ao grafo e garantir mais qualidade aos dados descritos. Esses curadores criam comparações em problemas de pesquisa de interesse como por exemplo:

Graph-based author name disambiguation .... https://www.orkg.org/orkg/comparison/R6751
Supervised author name disambiguation ....... https://www.orkg.org/orkg/comparison/R6949
Unsupervised author name disambiguation ... https://www.orkg.org/orkg/comparison/R6950

A ferramenta possui interface através de API e biblioteca em python para que os dados sejam reusados em outras aplicações. 

Código no GitLab -> https://gitlab.com/TIBHannover/orkg 

Biblioteca python para a API -> https://pypi.org/project/orkg/#files        pip install orkg

REST API de Consulta e Atualização de dados -> https://www.orkg.org/orkg/doc/api/#overview

EndPoint de consulta via SPARQL (Virtuoso) -> https://www.orkg.org/orkg/triplestore

Dump para download -> https://orkg.org/orkg/api/rdf/dump

Publicação científica sobre o projeto

Mohamad Yaser Jaradeh, Allard Oelen, Kheir Eddine Farfar, Manuel Prinz, Jennifer D’Souza, Gábor Kismihók, Markus Stocker, and Sören Auer (2019). Open Research Knowledge Graph: Next Generation Infrastructure for Semantic Scholarly Knowledge. In Proceedings of the 10th International Conference on Knowledge Capture (K-CAP ’19), November 19–21, 2019, Marina Del Rey, CA, USA. ACM, New York, NY, USA, 4 pages. https://doi.org/10.1145/3360901.3364435

https://tib.flowcenter.de/mfc/medialink/3/def45fe1198a3053b6a7901313346663c47812e285c148773a6760b3c11890cd27/201905_Auer_Soeren_Antrittsvorlesung.mp4

 

Atualização das estatísticas do grafo em 01/07/2021


Comentários

  1. Contribuições e Problemas de Pesquisa não estão contemplados no MAG mas aqui quem tem que catalogar o artigo é o autor. Na Wikidata seria possível avaliar se existem predicados para essas informações (Contribuições e Problemas de Pesquisa) e se, não houver, solicitar a criação.

    ResponderExcluir
  2. Em resumo

    O Open Research Knowledge Graph (ORKG) tem como objetivo descrever os artigos de pesquisa de uma maneira estruturada para que as atividades de busca e comparação de artigos seria facilitada. Trata-se de uma nova abordagem para Scholarly Knowledge Communication.

    O projeto parte do problema que o conhecimento científico continua confinado ao documento, ele é escrito por humanos para humanos.

    Os trabalhos devem ser incluídos pelos próprios autores na plataforma, diferente do MAG e similar ao Wikidata (crowdsourcing). Porém no ORKG novos predicados podem ser criados em tempo de catalogação (no Wikidata os predicados sugeridos passam por um processo de curadoria). Os predicados também são referenciados por um identificador P<9999>, por exemplo P3 é "is a" e P9 é o ORCID do autor.

    O projeto está no GitLab mas não achei uma exportação dos dados deles para uso local.

    Encontrei algumas publicações científica sobre o projeto no DBLP (2019 a 2021).

    ResponderExcluir
  3. Como é caracterizada a similaridade entre contribuições?

    Contribution similarity is a feature used to explore related
    work, find or recommend comparable research contributions. The
    sub-graphs G(ri )for each research contribution ri ∈ R are con-
    verted into document D by concatenating the labels of subject s,
    predicate p, and object o, of all statements (s,p,o)∈G(ri ). We then
    use T F /iDF [22] to index and retrieve the most similar contribu-
    tions with respect to some query q. Queries are constructed in the
    same manner as documents D.

    ResponderExcluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Aula 12: WordNet | Introdução à Linguagem de Programação Python *** com NLTK

 Fonte -> https://youtu.be/0OCq31jQ9E4 A WordNet do Brasil -> http://www.nilc.icmc.usp.br/wordnetbr/ NLTK  synsets = dada uma palavra acha todos os significados, pode informar a língua e a classe gramatical da palavra (substantivo, verbo, advérbio) from nltk.corpus import wordnet as wn wordnet.synset(xxxxxx).definition() = descrição do significado É possível extrair hipernimia, hiponimia, antonimos e os lemas (diferentes palavras/expressões com o mesmo significado) formando uma REDE LEXICAL. Com isso é possível calcular a distância entre 2 synset dentro do grafo.  Veja trecho de código abaixo: texto = 'útil' print('NOUN:', wordnet.synsets(texto, lang='por', pos=wordnet.NOUN)) texto = 'útil' print('ADJ:', wordnet.synsets(texto, lang='por', pos=wordnet.ADJ)) print(wordnet.synset('handy.s.01').definition()) texto = 'computador' for synset in wn.synsets(texto, lang='por', pos=wn.NOUN):     print('DEF:',s

truth makers AND truth bearers - Palestra Giancarlo no SBBD

Dando uma googada https://iep.utm.edu/truth/ There are two commonly accepted constraints on truth and falsehood:     Every proposition is true or false.         [Law of the Excluded Middle.]     No proposition is both true and false.         [Law of Non-contradiction.] What is the difference between a truth-maker and a truth bearer? Truth-bearers are either true or false; truth-makers are not since, not being representations, they cannot be said to be true, nor can they be said to be false . That's a second difference. Truth-bearers are 'bipolar,' either true or false; truth-makers are 'unipolar': all of them obtain. What are considered truth bearers?   A variety of truth bearers are considered – statements, beliefs, claims, assumptions, hypotheses, propositions, sentences, and utterances . When I speak of a fact . . . I mean the kind of thing that makes a proposition true or false. (Russell, 1972, p. 36.) “Truthmaker theories” hold that in order for any truthbe

DGL-KE : Deep Graph Library (DGL)

Fonte: https://towardsdatascience.com/introduction-to-knowledge-graph-embedding-with-dgl-ke-77ace6fb60ef Amazon recently launched DGL-KE, a software package that simplifies this process with simple command-line scripts. With DGL-KE , users can generate embeddings for very large graphs 2–5x faster than competing techniques. DGL-KE provides users the flexibility to select models used to generate embeddings and optimize performance by configuring hardware, data sampling parameters, and the loss function. To use this package effectively, however, it is important to understand how embeddings work and the optimizations available to compute them. This two-part blog series is designed to provide this information and get you ready to start taking advantage of DGL-KE . Finally, another class of graphs that is especially important for knowledge graphs are multigraphs . These are graphs that can have multiple (directed) edges between the same pair of nodes and can also contain loops. The