Lattes2Wikidata - Busca Textual por propriedades

Problema: mapear elementos e atributos do XML Schema (XSD) do Lattes respectivamente em Itens (Q nodes) e Propriedades (P nodes) da Wikidata

Dificuldade 1

Wikidata não tem Full Text Search por nome da propriedade, somente por nome de entidade (EntitySearch)

https://www.mediawiki.org/wiki/Wikidata_Query_Service/User_Manual/MWAPI

Solução de contorno

Baixar a lista de propriedades e realizar a busca localmente

A seguinte query foi executada no WQS e o resultado exportado em um arquivo TSV

SELECT ?property ?propertyType ?propertyLabel ?propertyDescription ?propertyAltLabel ?propertyOf ?propertyOfLabel ?propertyOfDescription WHERE { ?property wikibase:propertyType ?propertyType . optional {?propertyOf wdt:P1963 ?property} .

SERVICE wikibase:label { bd:serviceParam wikibase:language "pt-br, pt, en". } } ORDER BY ASC(xsd:integer(STRAFTER(STR(?property), 'P')))

Além das propriedades em si, recuperei os itens onde essas propriedades são usadas para descrever entidades dessa classe / tipo

P1963: quando este sujeito é usado como objeto de "instância de", as seguintes propriedades geralmente se aplicam

A minha primeira tentativa vai ser importar o TSV no pandas e fazer a busca do rótulo dos elementos e atributos do Lattes usando o jupyter notebook

Comentários

Veronica dos Santos29 de junho de 2021 às 16:00
Acabei fazendo a busca local no arquivo sem usar outro recurso de indexação.
ResponderExcluir
Respostas
Veronica dos Santos17 de setembro de 2023 às 16:12
Usando o kgtk query e o dump do ISI seria possível refazer este mapeamento localizando as propriedades (PNodes) pelos alias
ResponderExcluir
Respostas

Adicionar comentário

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Pesquisa de Doutorado da Veronica

Pesquisar este blog

Lattes2Wikidata - Busca Textual por propriedades

Problema: mapear elementos e atributos do XML Schema (XSD) do Lattes respectivamente em Itens (Q nodes) e Propriedades (P nodes) da Wikidata

Dificuldade 1

Solução de contorno

Marcadores

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Aprendizado de Máquina Relacional

Connected Papers: Uma abordagem alternativa para revisão da literatura

Knowledge Graph Embedding with Triple Context - Leitura de Abstract