Pular para o conteúdo principal

Reunião 17 de Março - Anotações

Pelo Sérgio

  • Definição de KG e contexto: muita discussão ainda ... não sei se surpreendente MAS fundamental termos a NOSSA definição e argumentar bem por ela. Usar o Survey do Hogan et al de 2021 é importante mas podemos ter críticas!
  • Contexto, algumas buzzwords do Daniel:
    • contexto é task dependent
    • contexto circunscreve, limita de alguma forma
    • não preciso de contexto se na query eu conseguir explicitar tudo que eu quero dizer
  • Acho que talvez tenhamos de adentrar em uma linha de "letras" ou mesmo "filosofia" para fechar as definições.
  • Exemplo comentado na hora:
    • Qual capital da Inglaterra? Resposta Londres pelo contexto temporal atual
    • Lembra Hip. mundo fechado de alguma forma
    • Senso comum o tempo ser "agora"
  • Outro exemplo:
    • Qual cotação do dolar (mais complicado se nao especificar US$, há outros dolares)
    • podemos retornar tudo, todas as cotações históricas desde que as temos disponíveis.
    • se for assim seria mais próximo de mundo aberto e inclui o tempo "atual"
  • A questão é: quão satisfatória é a resposta?
  • MAIS: contexto é algo adicional ao KG?
  • Daniel: vamos estender KG com tempo? Lembrando BD temporal: tempo de validade e tempo transacional
  • As infos de proveniência na base também! "Quem afirmou isso?" Proveniência faz parte do contexto!
  • Quanto a um modelo de confiança
    • seria um exemplo de contexto?
    • cadeia de confiança: como saber se é verdadeiro?
    • disputa de narrativas!
    • "a gente sempre responde algo ou respostas até quando der?"
    • se eu não tenho contexto, não respondo nada ou sendo cooperativo, respondo algo?
    • exemplo dos BD cooperativos do Furtado: chega no aeroporto, pergunto horário de chegada do vôo X, a resposta vem mais completa com um "21h, portão D"
    • Aceitamos interações com o usuário para entender melhor o que ele quer ou só pode ser "one shot"?
  •  Como situar o que o Daniel-pibic tá fazendo com essa discussão de contexto?
  • PRECISAMOS escrever TODOS estes casos para poder exemplificar nossos limites e circunscrições!
    • isso pode ajudar a definir da maneira que queremos
    • ser exaustivo nos exemplos vai ajudar a depois abstrair algo mais conciso
  • Hyper-relacional --> relação vs relacionamento, aqui tudo a mesma coisa, alertar sempre isso.
  • Power step (nao entendi mas ok)
  • diferenças wikidata, wikibase ...
  • Definição de semantic search: fala em resultados mais relevantes; lembrar que info retrieval também ordena ou propõe relevancia!
  • Na semantic search qual a tarefa do usuário?
    • a resposta tem de ser contextualizada por possíveis tarefas.
  • Quem@PUC e Busc@NIMA têm "template" de pergunta e das respostas!
  • Conceitos: mais de um podem ser associados a meio ambiente, por exemplo.
  • Legal deixar claro também a definição dos embeddings, dos graph embeddings
    • sempre rola algo implícito que parece que não seria algo bem definido
  • Importante formalizar os problemas do Quem@PUC e Busc@NIMA usando KG
    • inclusive quando termo de busca é o nome do prof!
    • Daniel-PIBIC: depois pegar o que ele tem feito. Usando rede neural? fazendo o que com ML e ajuda do Baffa?
  • Contei no almoço do caso Mont Saint Michel que aconteceu comigo e Betina, minha esposa, na França.
    • um exemplo complicado de como expressar a pergunta
    • e mais complicado de quem responde estar no comando, quando deveria apenas ser reativo!

Comentários

  1. Fonte: https://www.mediawiki.org/wiki/Wikibase/FAQ

    What is the difference between Wikibase and Wikidata?

    Wikibase is a suite of knowledge-base software for managing linked open data, originally written for and still used by the Wikidata project.

    Wikidata is the largest instance of Wikibase, a free knowledge base that anyone can edit. Its data is used by Wikipedia, by its sister projects and by anyone else who wants to make use of a large amount of open general-purpose data.


    ResponderExcluir
    Respostas
    1. A Wikibase é o nome da infraestrutura de software que suporta o KG da Wikidata.
      MariaDB, ElasticSearch e BlazeGraph com uma interface de consulta SPARQL fazem parte dessa suite.

      Excluir
  2. Sobre power set na definição de grafo hiper relacional: V × R × V × P (R × V) , sendo P o power set

    Aqui eu tenho um conjunto V com os vértices e um conjunto R com os tipos de relações. Cada Statement (declaração, fato) pode ser representado por um relacionamento entre dois elementos de V através de uma relação R e qualificado por um conjunto de N pares Relação-Vértice. O powser set aqui é pq o conjunto de qualificadores pode ter qq quantidade (de nulo até a cardinalidade do powserset da combinação de dois conjuntos)

    ResponderExcluir
  3. Quem@PUC

    Given a Scholarly RDF graph G and a keyword list query Q retrieve researches with academic production whose title matches the keyword list query Q ordered by volume
    Given a Scholarly RDF graph G and a keyword list query Q retrieve researches whose biography description matches the keyword list query Q
    Given a Scholarly RDF graph G and a keyword list query Q retrieve teachers teaching disciplines whose title or description matches the keyword list query Q ordered by volume

    Given a Scholarly RDF graph G and a keyword list query Q retrieve teachers/researches whose full name matches the keyword list query Q

    ResponderExcluir
    Respostas
    1. busc@NIMA

      Given a Scholarly RDF graph G and a keyword list query Q retrieve researches with academic production from Environment Domain context (C) whose title matches the keyword list query Q ordered by volume
      Given a Scholarly RDF graph G and a keyword list query Q retrieve researches from Environment Domain context (C) whose biography description matches the keyword list query Q
      Given a Scholarly RDF graph G and a keyword list query Q retrieve teachers teaching disciplines from Environment Domain context (C) whose title or description matches the keyword list query Q ordered by volume

      Given a Scholarly RDF graph G and a keyword list query Q retrieve teachers/researches from Environment Domain context (C) whose full name matches the keyword list query Q

      Excluir
    2. O MATCH é sintático/exato porém parcial, ou seja, o campo texto deve conter as palavras-chave de Q em qualquer ordem

      Excluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Aula 12: WordNet | Introdução à Linguagem de Programação Python *** com NLTK

 Fonte -> https://youtu.be/0OCq31jQ9E4 A WordNet do Brasil -> http://www.nilc.icmc.usp.br/wordnetbr/ NLTK  synsets = dada uma palavra acha todos os significados, pode informar a língua e a classe gramatical da palavra (substantivo, verbo, advérbio) from nltk.corpus import wordnet as wn wordnet.synset(xxxxxx).definition() = descrição do significado É possível extrair hipernimia, hiponimia, antonimos e os lemas (diferentes palavras/expressões com o mesmo significado) formando uma REDE LEXICAL. Com isso é possível calcular a distância entre 2 synset dentro do grafo.  Veja trecho de código abaixo: texto = 'útil' print('NOUN:', wordnet.synsets(texto, lang='por', pos=wordnet.NOUN)) texto = 'útil' print('ADJ:', wordnet.synsets(texto, lang='por', pos=wordnet.ADJ)) print(wordnet.synset('handy.s.01').definition()) texto = 'computador' for synset in wn.synsets(texto, lang='por', pos=wn.NOUN):     print('DEF:',s

truth makers AND truth bearers - Palestra Giancarlo no SBBD

Dando uma googada https://iep.utm.edu/truth/ There are two commonly accepted constraints on truth and falsehood:     Every proposition is true or false.         [Law of the Excluded Middle.]     No proposition is both true and false.         [Law of Non-contradiction.] What is the difference between a truth-maker and a truth bearer? Truth-bearers are either true or false; truth-makers are not since, not being representations, they cannot be said to be true, nor can they be said to be false . That's a second difference. Truth-bearers are 'bipolar,' either true or false; truth-makers are 'unipolar': all of them obtain. What are considered truth bearers?   A variety of truth bearers are considered – statements, beliefs, claims, assumptions, hypotheses, propositions, sentences, and utterances . When I speak of a fact . . . I mean the kind of thing that makes a proposition true or false. (Russell, 1972, p. 36.) “Truthmaker theories” hold that in order for any truthbe

DGL-KE : Deep Graph Library (DGL)

Fonte: https://towardsdatascience.com/introduction-to-knowledge-graph-embedding-with-dgl-ke-77ace6fb60ef Amazon recently launched DGL-KE, a software package that simplifies this process with simple command-line scripts. With DGL-KE , users can generate embeddings for very large graphs 2–5x faster than competing techniques. DGL-KE provides users the flexibility to select models used to generate embeddings and optimize performance by configuring hardware, data sampling parameters, and the loss function. To use this package effectively, however, it is important to understand how embeddings work and the optimizations available to compute them. This two-part blog series is designed to provide this information and get you ready to start taking advantage of DGL-KE . Finally, another class of graphs that is especially important for knowledge graphs are multigraphs . These are graphs that can have multiple (directed) edges between the same pair of nodes and can also contain loops. The