Mapeamento do Lattes para o Wikidata usando esquemas
Diretorio de Esquemas de Wikidata
https://www.wikidata.org/wiki/Wikidata:Database_reports/EntitySchema_directory
O que é um Esquema na Wikidata
https://www.wikidata.org/wiki/Wikidata:Schemas
The schemas are linked to the Wikidata item for that class by a statement (e.g.human (Q5) --> Wikidata Schema --> E10). Note: this is not yet available, the property proposal is on hold waiting for this Phabricator ticket.
Nesse link tem explicações de como o Scholia mapeia os dados das produções e pesquisadores mas não indica quais esquemas acima são usados
https://finnaarupnielsen.wordpress.com/2016/09/30/the-wikidata-scholarly-profile-page/comment-page-1/?unapproved=4773&moderation-hash=be3bcea852d8d1080a9d73e03d4fcafa#comment-4773
Comecei um mapeamento manual usando alguns esquemas que cobrem o domínio mas pela quantidades de objetos a serem mapeados vou tentar uma abordagem semi automática
Pesquisador (esquema E153 Researcher)
Wikidata | Lattes | Observações | |||
---|---|---|---|---|---|
Property Label | Property ID | Item Label | Item ID | Elemento XSD | |
instance of | P31 | Human | Q5 | ../DADOS-GERAIS | |
sex or gender | P21 | q? | ../DADOS-GERAIS@SEXO | ||
country of citizenship | P27 | q? | ../DADOS-GERAIS@PAIS-DE-NASCIMENTO | ||
date of birth | P569 | xsd:datetime | ../DADOS-GERAIS@DATA-NASCIMENTO | Converter formato | |
place of birth | P19 | ?q | ../DADOS-GERAIS@UF-NASCIMENTO | ||
occupation | P106 | researcher | Q1650915 | ||
employer | P108 | PUC-Rio | Q1857293 | ||
educated at | P69 | ||||
alma mater | P69 | ||||
affiliation | P1416 | ||||
id lattes | P1007 | CURRICULO-VITAE@NUMERO-IDENTIFICADOR | |||
ORCID-id | P496 | ../DADOS-GERAIS@ORCID-ID | |||
field of work | P101 | P31 [Q11862829 ] | |||
não ficou claro se houveram lacunas no mapeamento do Lattes, i.e., tem algum campo sem equivalente no WD?
ResponderExcluirAinda estou em uma fase bem inicial mas até agora não encontrei nenhum caso sem equivalência. Estou pensando em montar uma abordagem semiautomática usando o esquema do Lattes (um arquivo XSD) para acelerar um pouco.
ExcluirSobre " n ficou claro para mim se vc precisa passar por RDF (a n ser pelo fato de já ter feito este mapeamento para o Busc@Nima). Me parece mais direto pegar o XSD do Lattes e mapear direto para o esquema do WD. O detalhe é gerenciar os QNodes para reusar os que já porventura existam no WD, e criar novos caso contrário (aliás, isto é verdade tb para o rdf…).
ExcluirSe for seguir este caminho, na verdade, vc inclusive já poderia gerar direto no formato KGTK, tabular, não?"
O resultado desse mapeamento será gerado em formato KGTK mesmo. Os testes que estou fazendo em paralelo usando os dados exportados em Ntriples é só para avaliar as funcionalidades do toolkit com um pouco mais de volume e variedade.
O XSD do Lattes é bem grande, eu devo trabalhar separando em blocos para mapear e depois converter.
Eu abri uma issue de dúvida no Git do Scholia para saber que existem esquemas definidos para os dados usados atualmente
ResponderExcluir-> https://github.com/fnielsen/scholia/issues/1446
E a resposta foi negativa
we do not have ShEx for all aspects yet. We have been talking for some time to develop these, for example, by generating them from the SPARQL queries we use.