Problema: mapear elementos e atributos do XML Schema (XSD) do Lattes respectivamente em Itens (Q nodes) e Propriedades (P nodes) da Wikidata
Dificuldade 1
Wikidata não tem Full Text Search por nome da propriedade, somente por nome de entidade (EntitySearch)
https://www.mediawiki.org/wiki/Wikidata_Query_Service/User_Manual/MWAPI
Solução de contorno
Baixar a lista de propriedades e realizar a busca localmente
A seguinte query foi executada no WQS e o resultado exportado em um arquivo TSV
SELECT ?property ?propertyType ?propertyLabel ?propertyDescription ?propertyAltLabel ?propertyOf ?propertyOfLabel ?propertyOfDescription WHERE { ?property wikibase:propertyType ?propertyType . optional {?propertyOf wdt:P1963 ?property} .
SERVICE wikibase:label { bd:serviceParam wikibase:language "pt-br, pt, en". } } ORDER BY ASC(xsd:integer(STRAFTER(STR(?property), 'P')))
Além das propriedades em si, recuperei os itens onde essas propriedades são usadas para descrever entidades dessa classe / tipo
P1963: quando este sujeito é usado como objeto de "instância de", as seguintes propriedades geralmente se aplicam
A minha primeira tentativa vai ser importar o TSV no pandas e fazer a busca do rótulo dos elementos e atributos do Lattes usando o jupyter notebook
Acabei fazendo a busca local no arquivo sem usar outro recurso de indexação.
ResponderExcluirUsando o kgtk query e o dump do ISI seria possível refazer este mapeamento localizando as propriedades (PNodes) pelos alias
ResponderExcluir