Pular para o conteúdo principal

WikiCite track on WikiDataCon 2021 - 31/10/2021

State of WikiCite in 2021

Slides em -> https://doi.org/10.5281/zenodo.5587147

Comentários em -> https://etherpad.wikimedia.org/p/WikidataCon2021-StateofWikiCitein2021

WikiCite is ... A home for the community and projects focused on a collaborative approach to representing, curating, using and sharing open bibliographic and citation metadata in alignment with Wikimedia projects

The WikiLibrary Manifesto

The WikiLibrary Manifesto aims at connecting libraries and Wikimedia projects such as Wikibase in an international network of knowledge. Our goal: The creation and implementation of a single linked open data network for art, culture and science. 

... as a solid base for FAIR knowledge. Yet fully applying the FAIR data principles to knowledge requires a shared framework. The signers of the Wikimedia Library Manifesto will work together to achieve the vision of a common knowledge graph embedded in a shared framework.
 
Apresentaram o volume de dados bibliográficos e de citação das bases envolvidas em relação a outras informações como formação escolar, filiação e ORCID dos autores. Existe uma propriedade "cites", outra chamada "stated in", ... .  
 
Citation Ontology para descrever o tipo de citação.  
 
Data models for more types of entities that can be cited, e.g. datasets, software, specimen 

> 30% são dados de artigos científicos ... na outra apresentação sobre o WDQS informarem ser 40% da base e somente 2% das consultas

Qual seria o impacto de separar esse conteúdo de dentro da Wikidata e manter somente no WikiCite? Quais implicações para a comunidade, para o conteúdo do KG e para workflows colaborativos? 

WikiCite suporta anotação de tópicos? O apresentador não sabia responder .... 

Existem grupos usando WikiCite corpus em levantamentos bibliográficos?  O apresentador disse que provavelmente não ... em algumas áreas existem itens indexados e outras não.

Scholia updates 2021 

the current state of Scholia, a tool to visualize Wikidata-based information about WikiCite-related data, inside the WikiCite ecosystem

Statistics: https://scholia.toolforge.org/statistics ... no rodapé tem o link para o WDQS com a query usada para extrair esses valores ou aqui ... as demais páginas do Scholia possuem as duas opções: abrir o WDQS e abrir a query SPARQL no fonte (do GitHub)

 
Integration with Author Disambiguator via curation pages: https://scholia.toolforge.org/topic/Q1659584/curation ... como lidar com dados faltantes ou não especificados de modo estruturado como nomes de autores ambíguos
 
Redirects: https://scholia.toolforge.org/doi/10.1186/S13321-016-0161-3 redirects automatically to https://scholia.toolforge.org/work/Q26899110 ... redirecionamento usando atributos como identificadores externos que são únicos (relação 1:1 com o Q node)
 
 
Statements based on work: https://scholia.toolforge.org/work/Q24319057 ...
Statements referencing this article, fatos/afirmações que usam o artigo como referência. (supports the folowing statements - nome da seção no Scholia)

Citation support: https://scholia.toolforge.org/work/Q24319057/export ... exportar como BibTeX

CiTO support: https://scholia.toolforge.org/cito/ ... Ontologia que estabelece como cada trabalho é citado (para comparação, para informar que usam os mesmos dados, usam os mesmos métodos, ...) 
"The Citation Typing Ontology (CiTO) is an ontology that enablecharacterization of the nature or type of citations, both factually and rhetorically."... parte do SPAR Community (Semantic Publishing) 

Planos para os futuros: robustez, tratar query timeout, adicionar funcionalidades e tornar o scholia mais fácil para ser instalado localmente e acessar instâncias locais Wikibase

... ainda não sabem como ficaria se houver o "split of" do WikiCite, vê dificuldade em fazer o recorte do grafo sem interdependências.
 
Documentation on GitHub: https://github.com/WDscholia/scholia

Essa função do Scholia permite que dado abstract (que pode ser qq texto também) fornecer os tópicos associados .... https://scholia.toolforge.org/text-to-topics. Mas abstracts nem sempre estão abertos / públicos

Making Scholarly Articles Findable: Towards Ensuring F of FAIR Data Principles

Wikidata currently documents 37 million scholarly articles (Q13442814, Q10885494, Q580922), and the number keeps increasing. It is hard to understand and analyze the main subjects and domains of these articles. Though Wikidata has a property P921 (main subject) which can help find relevant scientific articles of different domains on diverse topics, its current usage is limited to around 17 million (Scholia statistics). 
 
This talk focuses on the ongoing work on improving the links between scholarly articles and existing Wikidata items using P921, its advantages, and limitations.
 
 
37M itens do tipo "Scholarly articles" onde 17M possui a ligação "main subject" com algum item (qnode) 

Basta associar a um item de acordo com os conceitos que aparecem no título? Em que nível de especialização / generalização da hierarquia de conceitos? 
 
Machine Learning
... Declarative Machine Learning
... Machine Learning Systems
 
Busca pode ser feita por API: Wikidata Mediawiki Search API
 
ItemSubjector: adicionar a ligação com o "main subject"
https://github.com/dpriskorn/ItemSubjector
The purpose of this command-line tool is to add main subject statements to Wikidata items based on a heuristic matching the subject with the title of the item.

Para ir além da associação com itens encontrados no título dos artigos:

Initiative for Open Abstracts  
https://i4oa.org/#openabstracts

WikiCite panel: Should we split scholarly articles out of the Wikidata graph? 

Nessa página tem um mapa com as quatro direções possíveis e os prós e contras de cada uma.
 
https://www.wikidata.org/wiki/Wikidata:WikiCite/Roadmap#Four_scenarios_for_the_future_of_WikiCite
  1. Centralizado no WD (atual)
  2. Namespace dentro do WD
  3. Mover para um projeto Wikibase-based (como o WikiCite)
  4. Criar uma federação de Wikibases (sem curadoria central)  

 Nesse outra página existem estatísticas relacionadas ao subgrafo, cobrindo itens (qnodes), predicados (pnodes), triplas, statements, queries, ... para dar suporte a escolha da estratégia

https://wikitech.wikimedia.org/wiki/User:AKhatun/Wikidata_Scholarly_Articles_Subgraph_Analysis

Os QNodes de artigos estão ligados a QNodes de outros tipos tanto através do Assunto (main subject) quanto por referência de suporte aos statements. 

 

 

 


 

Comentários

  1. Wikicite / Shared Citations: This is a proposal for the Wikimedia Foundation to create a database of Wikimedia citation records; and associated improvements to cross-wiki monitoring and editing. These two pillars would empower community-managed workflows and tools to:
    Make citations easier for the editor, more useful for the reader, and more efficient for our architecture.

    ResponderExcluir
  2. Para associar tópicos WD a textos -> https://scholia.toolforge.org/text-to-topics

    ResponderExcluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Connected Papers: Uma abordagem alternativa para revisão da literatura

Durante um projeto de pesquisa podemos encontrar um artigo que nos identificamos em termos de problema de pesquisa e também de solução. Então surge a vontade de saber como essa área de pesquisa se desenvolveu até chegar a esse ponto ou quais desdobramentos ocorreram a partir dessa solução proposta para identificar o estado da arte nesse tema. Podemos seguir duas abordagens:  realizar uma revisão sistemática usando palavras chaves que melhor caracterizam o tema em bibliotecas digitais de referência para encontrar artigos relacionados ou realizar snowballing ancorado nesse artigo que identificamos previamente, explorando os artigos citados (backward) ou os artigos que o citam (forward)  Mas a ferramenta Connected Papers propõe uma abordagem alternativa para essa busca. O problema inicial é dado um artigo de interesse, precisamos encontrar outros artigos relacionados de "certa forma". Find different methods and approaches to the same subject Track down the state of the art rese...

Knowledge Graph Embedding with Triple Context - Leitura de Abstract

  Jun Shi, Huan Gao, Guilin Qi, and Zhangquan Zhou. 2017. Knowledge Graph Embedding with Triple Context. In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17). Association for Computing Machinery, New York, NY, USA, 2299–2302. https://doi.org/10.1145/3132847.3133119 ABSTRACT Knowledge graph embedding, which aims to represent entities and relations in vector spaces, has shown outstanding performance on a few knowledge graph completion tasks. Most existing methods are based on the assumption that a knowledge graph is a set of separate triples, ignoring rich graph features, i.e., structural information in the graph. In this paper, we take advantages of structures in knowledge graphs, especially local structures around a triple, which we refer to as triple context. We then propose a Triple-Context-based knowledge Embedding model (TCE). For each triple, two kinds of structure information are considered as its context in the graph; one is the out...

KnOD 2021

Beyond Facts: Online Discourse and Knowledge Graphs A preface to the proceedings of the 1st International Workshop on Knowledge Graphs for Online Discourse Analysis (KnOD 2021, co-located with TheWebConf’21) https://ceur-ws.org/Vol-2877/preface.pdf https://knod2021.wordpress.com/   ABSTRACT Expressing opinions and interacting with others on the Web has led to the production of an abundance of online discourse data, such as claims and viewpoints on controversial topics, their sources and contexts . This data constitutes a valuable source of insights for studies into misinformation spread, bias reinforcement, echo chambers or political agenda setting. While knowledge graphs promise to provide the key to a Web of structured information, they are mainly focused on facts without keeping track of the diversity, connection or temporal evolution of online discourse data. As opposed to facts, claims are inherently more complex. Their interpretation strongly depends on the context and a vari...