The similarity API is here: https://github.com/usc-isi-i2/kgtk-similarity
The actual code for class sim is here: https://github.com/usc-isi-i2/kgtk-similarity/blob/main/semantic_similarity/semantic_similarity.py
Pelo
que entendi da documentação é uma API para chamada remota que calcula 4
tipos de similaridade entre dois Qnodes da Wikidata (e não achei um
comando equivalente do toolkit do KGTK para ser executado localmente em
relação a um KG qualquer)
Pelo que entendi do código ...
a similaridade é calculada de acordo com o tipo de embeddings (Complex, TransE ou Text) usando a similaridade do cosseno (from sklearn.metrics.pairwise import cosine_similarity) entre os arrays depois de um "reshape" (entre -1 e 1)
ou
a similaridade é entre as "classes" e é calculada pelo coeficiente de Jaccard (interseção/união) das features de cada nó.
Essa procura levar em conta tb a hierarquia de classes/subclasse
Essa procura levar em conta tb a hierarquia de classes/subclasse
Outras opções do KGTK a serem exploradas
ResponderExcluirhttps://kgtk.isi.edu/search/
https://kgtk.isi.edu/browser/
Além do novo link para o Similarity
https://dwd.isi.edu/similarity/