Análise para o artigo
1 - Qtas propriedades tem restrições (do nosso tipo de interesse) formuladas, e quais os percentuais em relação ao total de predicados isto corresponde.Tb incluir Qtos statements (claims) envolvem estas propriedades
363 propriedades com required qualifier (311 obrigatórias e 63 sugeridas)
22,832,759 Statements (do total de 559,038,971 ) associados a propriedades com required qualifier (17,934,765 obrigatórias e 7,824,405 sugeridas)
1.a - Top K propriedades q tem restrições, em numero de claims
Ainda estou calculando
2 - Quais (Quantos) os qualificadores das restrições em 1.
104 qualificadores associados a propriedades com required qualifier (94 obrigatórias e 29 sugeridas)
2.a - Top K qualificadores de 2, em numero de statements
Ainda estou calculando
Isto
nos dará uma indicação de quão representativa/abrangente é a abordagem
“bottom up” para definir as propriedades que formam contextos
Bottom no sentido do esquema existente para mapear no CKG, certo?
Feito isto, podemos avaliar quão eficazes são estas restrições, na
prática. Para isto, incluímos as estatísticas de violação de constraints
(do nosso tipo de interesse), tanto no total qto para as propriedades
multiple valued - total, %em rel ao total e em rel. a categoria multiple
valued, mandatório x sugested, as top K restrições violadas e os top K
qualificadores presentes nestas restrições.
Estas já temos na planilha para a constraint de required qualifier.
Ainda estou tentando gerar para a constraint allowed qualifier.
Pelo que entendi
na planilha todos os percentuais são bem baixos, o que me leva a
concluir que o mecanismo de restrições, como está atualmente, n funciona
como seria o desejável.
O percentual de predicados com restrições de required qualifier é baixo (por volta de 4%).
Portanto, teríamos tb
um argumento para a necessidade/adequação de permitir especificação
manual (pelo engenheiro de conhecimento) em adição às propriedades
extraídas automaticamente.
Para tanto, precisamos de alguns
exemplos de multiple valued properties que não tem restrição, mas
semanticamente deveriam ter contexto
Exemplos
https://kgtk.isi.edu/browser/Q7604786
https://kgtk.isi.edu/browser/Q11523819
"applies to jurisdiction" (P1001) possuem instâncias com qualificadores temporais start time e end time mas não possui constraints de required qualifier e nem allowed qualifier.
Aqui também poderia ser Bottom-Up no sentido das instâncias do KG para mapear no CKG, certo?
Comentários
Postar um comentário
Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.