Pular para o conteúdo principal

WikiCite track on WikiDataCon 2021 - 31/10/2021

State of WikiCite in 2021

Slides em -> https://doi.org/10.5281/zenodo.5587147

Comentários em -> https://etherpad.wikimedia.org/p/WikidataCon2021-StateofWikiCitein2021

WikiCite is ... A home for the community and projects focused on a collaborative approach to representing, curating, using and sharing open bibliographic and citation metadata in alignment with Wikimedia projects

The WikiLibrary Manifesto

The WikiLibrary Manifesto aims at connecting libraries and Wikimedia projects such as Wikibase in an international network of knowledge. Our goal: The creation and implementation of a single linked open data network for art, culture and science. 

... as a solid base for FAIR knowledge. Yet fully applying the FAIR data principles to knowledge requires a shared framework. The signers of the Wikimedia Library Manifesto will work together to achieve the vision of a common knowledge graph embedded in a shared framework.
 
Apresentaram o volume de dados bibliográficos e de citação das bases envolvidas em relação a outras informações como formação escolar, filiação e ORCID dos autores. Existe uma propriedade "cites", outra chamada "stated in", ... .  
 
Citation Ontology para descrever o tipo de citação.  
 
Data models for more types of entities that can be cited, e.g. datasets, software, specimen 

> 30% são dados de artigos científicos ... na outra apresentação sobre o WDQS informarem ser 40% da base e somente 2% das consultas

Qual seria o impacto de separar esse conteúdo de dentro da Wikidata e manter somente no WikiCite? Quais implicações para a comunidade, para o conteúdo do KG e para workflows colaborativos? 

WikiCite suporta anotação de tópicos? O apresentador não sabia responder .... 

Existem grupos usando WikiCite corpus em levantamentos bibliográficos?  O apresentador disse que provavelmente não ... em algumas áreas existem itens indexados e outras não.

Scholia updates 2021 

the current state of Scholia, a tool to visualize Wikidata-based information about WikiCite-related data, inside the WikiCite ecosystem

Statistics: https://scholia.toolforge.org/statistics ... no rodapé tem o link para o WDQS com a query usada para extrair esses valores ou aqui ... as demais páginas do Scholia possuem as duas opções: abrir o WDQS e abrir a query SPARQL no fonte (do GitHub)

 
Integration with Author Disambiguator via curation pages: https://scholia.toolforge.org/topic/Q1659584/curation ... como lidar com dados faltantes ou não especificados de modo estruturado como nomes de autores ambíguos
 
Redirects: https://scholia.toolforge.org/doi/10.1186/S13321-016-0161-3 redirects automatically to https://scholia.toolforge.org/work/Q26899110 ... redirecionamento usando atributos como identificadores externos que são únicos (relação 1:1 com o Q node)
 
 
Statements based on work: https://scholia.toolforge.org/work/Q24319057 ...
Statements referencing this article, fatos/afirmações que usam o artigo como referência. (supports the folowing statements - nome da seção no Scholia)

Citation support: https://scholia.toolforge.org/work/Q24319057/export ... exportar como BibTeX

CiTO support: https://scholia.toolforge.org/cito/ ... Ontologia que estabelece como cada trabalho é citado (para comparação, para informar que usam os mesmos dados, usam os mesmos métodos, ...) 
"The Citation Typing Ontology (CiTO) is an ontology that enablecharacterization of the nature or type of citations, both factually and rhetorically."... parte do SPAR Community (Semantic Publishing) 

Planos para os futuros: robustez, tratar query timeout, adicionar funcionalidades e tornar o scholia mais fácil para ser instalado localmente e acessar instâncias locais Wikibase

... ainda não sabem como ficaria se houver o "split of" do WikiCite, vê dificuldade em fazer o recorte do grafo sem interdependências.
 
Documentation on GitHub: https://github.com/WDscholia/scholia

Essa função do Scholia permite que dado abstract (que pode ser qq texto também) fornecer os tópicos associados .... https://scholia.toolforge.org/text-to-topics. Mas abstracts nem sempre estão abertos / públicos

Making Scholarly Articles Findable: Towards Ensuring F of FAIR Data Principles

Wikidata currently documents 37 million scholarly articles (Q13442814, Q10885494, Q580922), and the number keeps increasing. It is hard to understand and analyze the main subjects and domains of these articles. Though Wikidata has a property P921 (main subject) which can help find relevant scientific articles of different domains on diverse topics, its current usage is limited to around 17 million (Scholia statistics). 
 
This talk focuses on the ongoing work on improving the links between scholarly articles and existing Wikidata items using P921, its advantages, and limitations.
 
 
37M itens do tipo "Scholarly articles" onde 17M possui a ligação "main subject" com algum item (qnode) 

Basta associar a um item de acordo com os conceitos que aparecem no título? Em que nível de especialização / generalização da hierarquia de conceitos? 
 
Machine Learning
... Declarative Machine Learning
... Machine Learning Systems
 
Busca pode ser feita por API: Wikidata Mediawiki Search API
 
ItemSubjector: adicionar a ligação com o "main subject"
https://github.com/dpriskorn/ItemSubjector
The purpose of this command-line tool is to add main subject statements to Wikidata items based on a heuristic matching the subject with the title of the item.

Para ir além da associação com itens encontrados no título dos artigos:

Initiative for Open Abstracts  
https://i4oa.org/#openabstracts

WikiCite panel: Should we split scholarly articles out of the Wikidata graph? 

Nessa página tem um mapa com as quatro direções possíveis e os prós e contras de cada uma.
 
https://www.wikidata.org/wiki/Wikidata:WikiCite/Roadmap#Four_scenarios_for_the_future_of_WikiCite
  1. Centralizado no WD (atual)
  2. Namespace dentro do WD
  3. Mover para um projeto Wikibase-based (como o WikiCite)
  4. Criar uma federação de Wikibases (sem curadoria central)  

 Nesse outra página existem estatísticas relacionadas ao subgrafo, cobrindo itens (qnodes), predicados (pnodes), triplas, statements, queries, ... para dar suporte a escolha da estratégia

https://wikitech.wikimedia.org/wiki/User:AKhatun/Wikidata_Scholarly_Articles_Subgraph_Analysis

Os QNodes de artigos estão ligados a QNodes de outros tipos tanto através do Assunto (main subject) quanto por referência de suporte aos statements. 

 

 

 


 

Comentários

  1. Wikicite / Shared Citations: This is a proposal for the Wikimedia Foundation to create a database of Wikimedia citation records; and associated improvements to cross-wiki monitoring and editing. These two pillars would empower community-managed workflows and tools to:
    Make citations easier for the editor, more useful for the reader, and more efficient for our architecture.

    ResponderExcluir
  2. Para associar tópicos WD a textos -> https://scholia.toolforge.org/text-to-topics

    ResponderExcluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Aula 12: WordNet | Introdução à Linguagem de Programação Python *** com NLTK

 Fonte -> https://youtu.be/0OCq31jQ9E4 A WordNet do Brasil -> http://www.nilc.icmc.usp.br/wordnetbr/ NLTK  synsets = dada uma palavra acha todos os significados, pode informar a língua e a classe gramatical da palavra (substantivo, verbo, advérbio) from nltk.corpus import wordnet as wn wordnet.synset(xxxxxx).definition() = descrição do significado É possível extrair hipernimia, hiponimia, antonimos e os lemas (diferentes palavras/expressões com o mesmo significado) formando uma REDE LEXICAL. Com isso é possível calcular a distância entre 2 synset dentro do grafo.  Veja trecho de código abaixo: texto = 'útil' print('NOUN:', wordnet.synsets(texto, lang='por', pos=wordnet.NOUN)) texto = 'útil' print('ADJ:', wordnet.synsets(texto, lang='por', pos=wordnet.ADJ)) print(wordnet.synset('handy.s.01').definition()) texto = 'computador' for synset in wn.synsets(texto, lang='por', pos=wn.NOUN):     print('DEF:',s

truth makers AND truth bearers - Palestra Giancarlo no SBBD

Dando uma googada https://iep.utm.edu/truth/ There are two commonly accepted constraints on truth and falsehood:     Every proposition is true or false.         [Law of the Excluded Middle.]     No proposition is both true and false.         [Law of Non-contradiction.] What is the difference between a truth-maker and a truth bearer? Truth-bearers are either true or false; truth-makers are not since, not being representations, they cannot be said to be true, nor can they be said to be false . That's a second difference. Truth-bearers are 'bipolar,' either true or false; truth-makers are 'unipolar': all of them obtain. What are considered truth bearers?   A variety of truth bearers are considered – statements, beliefs, claims, assumptions, hypotheses, propositions, sentences, and utterances . When I speak of a fact . . . I mean the kind of thing that makes a proposition true or false. (Russell, 1972, p. 36.) “Truthmaker theories” hold that in order for any truthbe

DGL-KE : Deep Graph Library (DGL)

Fonte: https://towardsdatascience.com/introduction-to-knowledge-graph-embedding-with-dgl-ke-77ace6fb60ef Amazon recently launched DGL-KE, a software package that simplifies this process with simple command-line scripts. With DGL-KE , users can generate embeddings for very large graphs 2–5x faster than competing techniques. DGL-KE provides users the flexibility to select models used to generate embeddings and optimize performance by configuring hardware, data sampling parameters, and the loss function. To use this package effectively, however, it is important to understand how embeddings work and the optimizations available to compute them. This two-part blog series is designed to provide this information and get you ready to start taking advantage of DGL-KE . Finally, another class of graphs that is especially important for knowledge graphs are multigraphs . These are graphs that can have multiple (directed) edges between the same pair of nodes and can also contain loops. The