Pular para o conteúdo principal

Defesa Proposta de Tese em 16 Novembro 2022

 

Apresentação


Vídeo da Apresentação

 

Comentários da banca

Professor Altigram

Sibyl caiu do nada! Cuidado na escrita.

A pesquisa cobre uma lacuna na literatura sobre Busca em KG. A abordagem é promissora, é um trabalho de doutorado que vale a pena.

Contextual KG não existem na literatura, não existe uma estrutura semântica. O problema de construir o CKG não seria tão importante quanto realizar a Busca Exploratória? 

Já existem KG com contexto mas não está explícito assim como podem existir KG sem contexto. 

Daniel: Wikidata já tem a meta informação de contexto representada. Então seria o caso de criar uma visão sobre os dados existentes para explorar os aspectos contextuais. 

Ou seja, já existem as premissas. É razoável assumir que com o que já existe é possível acrescentar a camada semântica para a exploração. 

Se algum dia a busca vai funcionar para KG, tem que ser a Busca Exploratória.

A comparação com o estado da arte não seria quantitativa pq não existe um baseline. A avaliação deverá ser mais qualitativa e comparar com outros trabalhos relevantes e argumentar em prol do uso do contexto. 

Duas referências que ele indicou: 

1) Qual a resposta correta mais provável

Xin Luna Dong, Laure Berti-Équille, Divesh Srivastava: Data Fusion: Resolving Conflicts from Multiple Sources. CoRR abs/1503.00310 (2015) - Tem outros artigos também

2) Controvérsias na Wikipedia, como resolver

Hoda Sepehri Rad, Denilson Barbosa: Identifying Controversial Wikipedia Articles Using Editor Collaboration Networks. ACM Trans. Intell. Syst. Technol. 6(1): 5:1-5:24 (2015)

O workload de consultas precisa ser rico para exemplificar a aplicação do contexto no caso de controversas. O objetivo não é resolver as controvérsias e sim reconhecer que outra camada do usuário irá lidar com isso de acordo com os seus requisitos e com a sua tarefa. O sistema resolver pode introduzir bias e restringir o poder de decisão do usuário. 

Onde será publicado? Web Semântica (ISWC), KG, BD (ainda não seria o local mais adequado ou não argumentamos o suficiente), IR (ainda é uma comunidade muito quantitativa)

Nível de risco com prêmio em potencial no final, com uma prova de conceito bem estruturada. 

Sérgio: Sobre a necessidade de comparação, se fugir muito do padrão pode não ser possível comparar, então quando se abre uma frente é um risco por ser inovador mas justifica um doutorado.

Professor Hermann 

Algumas abordagens de construção de ontologias levavam em consideração do contexto como SUMO, Upper Ontology. Se não tem em KG, use Ontologias para comparar uma vez que Ontologias também são KB. 

Sobre o texto. (1) "Informação é Conhecimento em Potencial" falta referência. (2) "... problema ..." tarefa não é problema, ser mais preciso neste aspecto, qual é o problema afinal? (3) Não definiu Informação, Conhecimento e Problema, o texto fica solto. 

Conhecimento pode ser confundido com Verdade e também com Competência (saber fazer). Como provar que tem o conhecimento? Como provar que o conhecimento foi adquirido? 

Crença não precisa de justificativa. A pessoa pode acreditar em coisas falsas mas não pode saber coisas falsas. 

Prova é baseada em justificativas. Convencer o interlocutor de que conhece algo.

Pierce é um pragmatista, a definição de Verdade dele é particular e polêmica mas a abordagem de construção do conhecimento é muito interessante. ABDUÇÃO é a lógica do descobrimento, da investigação, parte do concreto e da evidência. É diferente da DEDUÇÃO que parte do geral para o mais específico com regras. 

"Verdades" com contexto para acomodar visões diferentes de mundo. 

Teoria da Coerência, existe A VERDADE e não verdades. Seria o TODO. Não é prático. 

OWA e CWA. Em BD tudo que está contido lá é Verdadeiro e o que está fora é Falso. Em um modelo tudo que está lá é uma proposição, e o que não está a negação da proposição está.

Em Teorias, existem teorias que não são provadas como Verdades e também não são provadas como Falsas mas são aceitas como Verdades por uma comunidade. 

Sugiro trocar OWA e CWA por Incompleto e Completo. 

Daniel: a ideia de Verdade é o uso da Informação para executar uma ação, não seria Lógica ou Filosófica. Na perspectiva de uso e representação computacional. A diferença entre Informação e Conhecimento seria o uso.

Seriam dois níveis de Verdade se não é possível confiar no que está registrado: Verdade e Crença.  Haveria um valor lógico para o grau de credibilidade de cada sentença. 

Daniel: mas esse valor deveria ser discretizado para ser usado para a ação, lógica clássica bivalente. O processo de ABDUÇÃO seria o mais adequado para a Busca Exploratória. 

Recomendou a leitura da Enciclopédia de Filosofia para Verdade. 

Comunidade é relevante sempre que vc participa dela. E no final todas as justificativas estão ancoradas em Crenças. 

Na construção de ciência é diferente pq é preciso ter "um enunciado falsificável" logo já se acolhem diferentes perspectivas (Karl Popper) mas na prática nem sempre se observa essa preocupação. 

Quando a Ciência só explica o passado e não consegue ser preditivo (como História e Economia) é questionável se é Ciência. 

Referencias para leitura

é a página sobre Theorias sobre Truth
https://plato.stanford.edu/entries/truth/#CorThe

sobre ontologias contextualizdas
https://doi.org/10.1017/S0269888914000046

Sobre abducao (SEP tb)
https://plato.stanford.edu/entries/ababductionduction/peirce.html

Evolucao do conceito de abducao (artigo importante)
https://www.jstor.org/stable/40320131

Comentários

  1. Mudança de links

    https://plato.stanford.edu/entries/abduction/peirce.html

    https://plato.stanford.edu/entries/abduction/

    ResponderExcluir
  2. If we claim a knowledge graph is representing knowledge in the graph form, the earliest, primitive form of such representation is called existential graph (Charles Sanders Peirce, late 1800s). 

    "The Existential Graphs of Charles S. Perice": a book published in 1973 by Don Roberts.

    O mesmo Peirce de ABDUÇÃO!!! Mas este conceito de Grafo Existencial (GE) não parece ajudar para a pesquisa de KG

    ResponderExcluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Connected Papers: Uma abordagem alternativa para revisão da literatura

Durante um projeto de pesquisa podemos encontrar um artigo que nos identificamos em termos de problema de pesquisa e também de solução. Então surge a vontade de saber como essa área de pesquisa se desenvolveu até chegar a esse ponto ou quais desdobramentos ocorreram a partir dessa solução proposta para identificar o estado da arte nesse tema. Podemos seguir duas abordagens:  realizar uma revisão sistemática usando palavras chaves que melhor caracterizam o tema em bibliotecas digitais de referência para encontrar artigos relacionados ou realizar snowballing ancorado nesse artigo que identificamos previamente, explorando os artigos citados (backward) ou os artigos que o citam (forward)  Mas a ferramenta Connected Papers propõe uma abordagem alternativa para essa busca. O problema inicial é dado um artigo de interesse, precisamos encontrar outros artigos relacionados de "certa forma". Find different methods and approaches to the same subject Track down the state of the art rese...

Knowledge Graphs as a source of trust for LLM-powered enterprise question answering - Leitura de Artigo

J. Sequeda, D. Allemang and B. Jacob, Knowledge Graphs as a source of trust for LLM-powered enterprise question answering, Web Semantics: Science, Services and Agents on the World Wide Web (2025), doi: https://doi.org/10.1016/j.websem.2024.100858. 1. Introduction These question answering systems that enable to chat with your structured data hold tremendous potential for transforming the way self service and data-driven decision making is executed within enterprises. Self service and data-driven decision making in organizations today is largly made through Business Intelligence (BI) and analytics reporting. Data teams gather the original data, integrate the data, build a SQL data warehouse (i.e. star schemas), and create BI dashboards and reports that are then used by business users and analysts to answer specific questions (i.e. metrics, KPIs) and make decisions. The bottleneck of this approach is that business users are only able to answer questions given the views of existing dashboa...

Knowledge Graph Toolkit (KGTK)

https://kgtk.readthedocs.io/en/latest/ KGTK represents KGs using TSV files with 4 columns labeled id, node1, label and node2. The id column is a symbol representing an identifier of an edge, corresponding to the orange circles in the diagram above. node1 represents the source of the edge, node2 represents the destination of the edge, and label represents the relation between node1 and node2. >> Quad do RDF, definir cada tripla como um grafo   KGTK defines knowledge graphs (or more generally any attributed graph or hypergraph ) as a set of nodes and a set of edges between those nodes. KGTK represents everything of meaning via an edge. Edges themselves can be attributed by having edges asserted about them, thus, KGTK can in fact represent arbitrary hypergraphs. KGTK intentionally does not distinguish attributes or qualifiers on nodes and edges from full-fledged edges, tools operating on KGTK graphs can instead interpret edges differently if they so desire. In KGTK, e...