Pular para o conteúdo principal

Mapa Mental e Desdobramentos - reunião Sérgio 13/07/2023 Research Themes

https://mm.tt/app/map/2853104454?t=2BzVj6Magp

Reunião com o Sérgio em 13/07/2023 usando o mapa e focado no ramo "Research Themes"

KG

Abordagem se aplica a conhecimento de três tipos: (1) Factual (que deve estar associado ao contexto da proveniência), (2) Contextual (que pode ser associado a contextos específicos, além da proveniência) e (3) Counterfactual (que deve ser associado a contextos específicos, além da proveniência, deixando claro que existem diferentes perspectivas e circunstâncias onde a veracidade e a utilidade da informação pode ser avaliada, cabendo a arbitragem).

Mas os exemplos de Terra Plana, Urna Eletrônica, Vacinas e outros temas que acabam sendo alvo de Fake News me parecem associados a categoria Narrative que seriam suportados por um conjunto de alegações. Mas neste caso não sei se tornar o Contexto explícito seria o suficiente para confrontar as narrativas e permitir decidir qual seria "a Verdade" em abordagens de Fact Checking.

Tarefa: investir no exemplo das Urnas Eletrônicas

Axiomas em um KG seria informações Factuais, que não precisam ser justificadas, mas ainda assim requer contexto de Proveniência. 

Alegações que representam Narrativas devem ser justificadas com Axiomas ou com outras Alegações justificadas. Alegações sem justificativas são baseadas em Crenças.  

Contexto e DOWA

DOWA é sobre Verdade Relativa, sobre conhecimento nem sempre ser Factual. 

Lei é Proveniência, obedecer a lei é sobre Crenças e Valores

Podemos conhecer somente o que é Verdadeiro mas acreditar no que é Verdadeiro ou Falso. 

OWA x CWA em relação a KB x BD já foram explorados aqui -> https://versant-pesquisadedoutorado.blogspot.com/2022/05/db-x-kb-cwa-x-owa.html

"The CWA assumes that unobserved facts are false. By contrast, the OWA has a relaxed assumption that unobserved ones can be either missing or false. Generally, OWA has an advantage over CWA because of the incompleteness nature of knowledge graphs.

"Relational Approach - Closed World Assumption (CWA) - That which is not known to be true is presumed to be false; it needs to be explicitly stated as true. Negation as failure (NAF) is a related assumption, since it assumes as false every predicate that cannot be proven to be true. Under CWA, any statement not known to be true is false. Everything is prohibited until it is permitted.

(Open) Semantic Web Approach - Open World Assumption (OWA) - The lack of a given assertion or fact being available does not imply whether that possible assertion is true or false: it simply is not known. In other words, lack of knowledge does not imply falsity. Everything is permitted until it is prohibited."

O aspecto dual do OWA para KG parte de (1) KG são KB e (2) KG são gerados por processos automáticos [Weikum 2021] que extraem informações da Web (que podem ser verdadeiras ou falsas) e também por processos de crowdsourcing (Wikidata) que pode conter viés e diferentes perspectivas de mundo, sendo alvo de disputas de narrativas. Logo a presença de uma afirmação em um KG não garante que seja verdadeira, aspecto da Veracidade em V's do Big Data

Em OWA: A ausência de evidência não é evidência de falsidade

Em DOWA: A presença de evidência não é evidência de veracidade. A camada de regras de decisão é onde a avaliação da veracidade acontece, esta camada pode ser por sistema ou do próprio usuário. 

O Contexto está tanto no KG quanto no uso que será dado a Informação recuperada (contexto da tarefa que motivou a busca para satisfazer a necessidade de informação). 

A camada de mapeamento do CKG opera em OWA puramente, pode não ser completa mas o que foi mapeado é considerado verdadeiro pelo engenheiro de KG.  No modelo multi-layer de grafos, o contexto pode estar em N camadas. Até qual camada iremos para montar a resposta (ALL CONTEXTUALIZED ANSWER)? Nos exemplos de queries na camada de mapeamento estamos usando somente um nível.

A ausência de contexto nas alegações e entidades que são recuperadas na resposta é explicitamente representada por pares de chave (qualificador, relacionamento e propriedade) e valor UNKNOWN. Os casos específicos onde não se aplica o contexto (exceções) devem estar explicitamente registrados no KG com valores NONE ou devem ser inferidos através de regras. 

Abdução para cada CLAIM, quais fatores serão levados em consideração para considerar uma Alegação Verdadeira. Mesmo que só um CLAIM seja recuperado, ainda é preciso avaliar a veracidade. 

Busca Exploratória

Perguntas são potencialmente incompletas "Usuário não sabe aquilo que ele não sabe". 

Busca Exploratória e a fase dos porquês na crianças (Jean Piaget chama de período pré-operatório): Ao acrescentar contexto na resposta estamos respondendo a perguntas QUANDO (aconteceu, foi dito), ONDE (aconteceu, foi dito), COMO (foi coletado, foi gerado), QUEM (disse, coletou, gerou) que podem não ter sido formuladas pelo usuário mas que são essenciais para entender, interpretar e avaliar a veracidade e utilidade das respostas, sendo assim cooperativo sem requer interatividade adicional.


Comentários

Postagens mais visitadas deste blog

Connected Papers: Uma abordagem alternativa para revisão da literatura

Durante um projeto de pesquisa podemos encontrar um artigo que nos identificamos em termos de problema de pesquisa e também de solução. Então surge a vontade de saber como essa área de pesquisa se desenvolveu até chegar a esse ponto ou quais desdobramentos ocorreram a partir dessa solução proposta para identificar o estado da arte nesse tema. Podemos seguir duas abordagens:  realizar uma revisão sistemática usando palavras chaves que melhor caracterizam o tema em bibliotecas digitais de referência para encontrar artigos relacionados ou realizar snowballing ancorado nesse artigo que identificamos previamente, explorando os artigos citados (backward) ou os artigos que o citam (forward)  Mas a ferramenta Connected Papers propõe uma abordagem alternativa para essa busca. O problema inicial é dado um artigo de interesse, precisamos encontrar outros artigos relacionados de "certa forma". Find different methods and approaches to the same subject Track down the state of the art rese...

Knowledge Graph Embedding with Triple Context - Leitura de Abstract

  Jun Shi, Huan Gao, Guilin Qi, and Zhangquan Zhou. 2017. Knowledge Graph Embedding with Triple Context. In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17). Association for Computing Machinery, New York, NY, USA, 2299–2302. https://doi.org/10.1145/3132847.3133119 ABSTRACT Knowledge graph embedding, which aims to represent entities and relations in vector spaces, has shown outstanding performance on a few knowledge graph completion tasks. Most existing methods are based on the assumption that a knowledge graph is a set of separate triples, ignoring rich graph features, i.e., structural information in the graph. In this paper, we take advantages of structures in knowledge graphs, especially local structures around a triple, which we refer to as triple context. We then propose a Triple-Context-based knowledge Embedding model (TCE). For each triple, two kinds of structure information are considered as its context in the graph; one is the out...

KnOD 2021

Beyond Facts: Online Discourse and Knowledge Graphs A preface to the proceedings of the 1st International Workshop on Knowledge Graphs for Online Discourse Analysis (KnOD 2021, co-located with TheWebConf’21) https://ceur-ws.org/Vol-2877/preface.pdf https://knod2021.wordpress.com/   ABSTRACT Expressing opinions and interacting with others on the Web has led to the production of an abundance of online discourse data, such as claims and viewpoints on controversial topics, their sources and contexts . This data constitutes a valuable source of insights for studies into misinformation spread, bias reinforcement, echo chambers or political agenda setting. While knowledge graphs promise to provide the key to a Web of structured information, they are mainly focused on facts without keeping track of the diversity, connection or temporal evolution of online discourse data. As opposed to facts, claims are inherently more complex. Their interpretation strongly depends on the context and a vari...