ConceptNet: é uma KB
multilíngue, representando palavras e frases que as pessoas usam e as
relações de senso comum entre elas. O conhecimento no ConceptNet é
coletado de uma variedade de recursos, incluindo recursos de
crowdsourcing (como Wikcionário e Open Mind Common Sense), jogos com uma
finalidade (como Verbosity e nadya.jp) e recursos criados por
especialistas (como WordNet e JMDict). É um KG de coisas que as pessoas
sabem e os computadores deveriam saber, expresso em várias linguagens
naturais. É uma rede semântica disponível gratuitamente, projetada para
ajudar os computadores a entender o significado das palavras que as
pessoas usam.
FAQ: https://github.com/commonsense/conceptnet5/wiki/FAQ
Comparação com outros KGs (menos Wikidata).
Precisa de 300G de espaço em disco para uma cópia local e 10G da RAM para rodar o PostgreSQL onde o dado deve ser carregado. Não está disponível em formato RDF. Pode ser consultado através de uma API que retorna os dados em formato JSON-LD
ConceptNet tem uma preocupação em reduzir o viés de word embeddings
https://github.com/commonsense/conceptnet-numberbatch
https://blog.conceptnet.io/posts/2017/conceptnet-numberbatch-17-04-better-less-stereotyped-word-vectors/
Este comentário foi removido pelo autor.
ResponderExcluirKG Multilingue
ResponderExcluir