1) Extrair referencia da WD (não tem no conjunto de dados do kgtk) Existem triplas específicas para representar as referência na WD: ?statement prov:wasDerivedFrom ?ref . Baixei os dados de referência da WD em 24/01/2023 com o wdq (base) root@vm096:/home/cloud-di# ls -laht /app/wdq/data/ref* -rw-r--r-- 1 root root 7.1G Jan 25 01:12 /app/wdq/data/references.tsv Converti para ntriples e depois para o kgtk sed -i '/node1/d' /app/kgtk/data/WD5/wdq_references.tsv sed 's/$/ ./' /app/kgtk/data/WD5/wdq_references.tsv > /app/kgtk/data/WD5/wdq_references.nt nohup kgtk --debug import-ntriples --verbose --validate=True \ -i /app/kgtk/data/WD5/wdq_references.nt \ -o /app/kgtk/data/WD5/references.tsv.gz \ --reject-file /app/kgtk/data/WD5/reject-references.tsv.gz & 2) Estatísticas Foram recuperadas 35,670,197 triplas que compõem 13,614,241 referências associadas a 31,601,286 statements. Nestas triplas foram usados 5080 propriedades distintas nas referências