Pular para o conteúdo principal

Festival do Conhecimento - UFRJ - Ciência das Redes x Teoria dos Grafos: Uma Nova Esperança


Data 24/07 - 17h

Ciência das Redes x Teoria dos Grafos: Uma Nova Esperança

Link https://youtu.be/3I8_vHKt9T8

Professores Daniel Ratton Figueiredo, Fábio Botler (COPPE / PESC)

Teoria de Grafos (TG) e Problemas Combinatórios

A TG começou com jogos e passatempos como um ferramental matemático fazem 200 anos (século XVIII). Em 1878 o termo grafo foi citado pela primeira vez em um artigo da Nature sobre um estudo da área de química (detecção de isômeros de cadeias de carbono, ou seja, identificar se dois grafos são isomorfos)

Grafo é uma abstração (modelagem) para muitas aplicações, tem estreita relação com teoria da computação e é um estudo de combinatória com estrutura. São problemas em sua maioria NP-Difíceis para tratar questões como Decomposição de grafos (identificar estruturas indivisíveis), Circuitos Hamiltonianos* (caixeiro viajante) e Coloração de Grafos.

* Um caminho hamiltoniano é um caminho que permite passar por todos os vértices de um grafo G, não repetindo nenhum, ou seja, passar por todos uma e uma só vez por cada. Caso esse caminho seja possível descrever um ciclo, este é denominado ciclo hamiltoniano em G.

Decomposição de grafos quer identificar o quão conexo é um grafo. Quantas arestas precisam ser deletadas para tornar um grafo desconexo.
Orientações de Grafos: 2 elevado a m (arestas) de possibilidades
Coloração de arestas quer identificar como "colorir" as arestas de modo que cada vértice seja "tocado" por no máximo uma aresta de cada cor.

A Ciência de Redes está contida na Ciência de Dados e é uma ciência nova que começou com aplicações da Internet (a Web e a própria estrutura da rede) no final dos anos 90 e faz uso de teoria matemática. A Ciência de Redes procura: (1) identificar qual é a estrutura de uma rede real; (2) o motivo pelo qual a rede apresenta tal estrutura e (3) quais as consequências de tal estruturas se comportarem de tal forma. Muitos problemas se desenvolvem a partir de dados de redes sociais como seguidores no Twitter, comunidades no Facebook, Tracking e trajetos, etc ...

Alguns artigos

- stru2vec: metodologia para representar vértices em uma rede em um espaço euclidiano (2D) para treinamento em algoritmos de ML

Leonardo F.R. Ribeiro, Pedro H.P. Saverese, and Daniel R. Figueiredo. 2017. Struc2vec: Learning Node Representations from Structural Identity. In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD ’17). Association for Computing Machinery, New York, NY, USA, 385–394. DOI:https://doi.org/10.1145/3097983.3098061

- identificar ambiguidades (fazer entity linkage entre vértices) em redes sociais para promover a consolidação sem usar atributos como o nome (label), usar somente a estrutura é possível pela forma como o ser humano constrói colaborações

KLING, H. ; GOMIDE, J. ; FIGUEIREDO, D. R. . A simple label-free algorithm for removing ambiguities in collaboration networks. In: NetSci-x, 2015, Rio de Janeiro. International School and Conference on Network Science, 2015.

- coautoria de leis de deputados para identificar homofilia** e assimetria, deputados são vértices e cada lei com coautoria é um vértice

** homofilia pode ser caracterizada como a maior predisposição dos indivíduos de formarem relações baseados na similaridade entre suas características. Por exemplo, indivíduos que frequentaram a mesma universidade tem mais chance de serem amigos no Facebook. Nesse contexto, quanto maior a homofilia maior é a preferência de um indivíduo de se relacionar com seus semelhantes em detrimento a outros indivíduos com características distintas.

ROLIM, Lucas; FIGUEIREDO, Daniel R.. Homofilia e Assimetria na Rede de Coautoria de Proposições de Lei do Congresso Brasileiro. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BRASNAM), 8. , 2019, Belém. Anais do VIII Brazilian Workshop on Social Network Analysis and Mining. Porto Alegre: Sociedade Brasileira de Computação, july 2019 . p. 12-23. ISSN 2595-6094. DOI: https://doi.org/10.5753/brasnam.2019.6544.

- epidemia em redes (não achei no Lattes)

98/99 foi o Big Bang em Ciência de Redes. Artigos de grande impacto e citação na Nature e Science

Barabasi AL, Albert R. Emergence of scaling in random networks. Science. 1999;286(5439):509-512. doi:10.1126/science.286.5439.509

Science em 2009 fez uma publicação de comemoração.

O termo grafo é muito usado em Computação, em outras áreas é mais comum usar o termo redes. Grafos são construções / modelos abstratos e redes são mais próximas da compreensão do mundo real. Os problemas de Redes nascem do mundo real enquanto que a TG resolve problemas que podem AINDA não ter aplicação prática.

Isomorfismo*** é um problema que tem grande interesse das duas áreas e aplicação em vários domínios.

*** Um isomorfismo entre dois grafos G e H é uma bijeção f de V (G) em V (H) tal que dois vértices v e w são adjacentes em G se e somente se f(v) e f(w) são adjacentes em H. Dois grafos G e H são isomorfos se existe um isomorfismo entre eles. Em outras palavras, dois grafos são isomorfos se é possível alterar os nomes dos vértices de um deles de tal modo que os dois grafos fiquem iguais. Para decidir se dois grafos G e H são isomorfos, basta examinar todas as bijeções de V (G) em V (H). Se cada um dos grafos tem n vértices, esse algoritmo consome tempo proporcional a n!. Como n! cresce explosivamente com n, esse algoritmo é decididamente insatisfatório na prática. Infelizmente, não se conhece um algoritmo substancialmente melhor.

Detecção de comunidades é um problema que Redes tem grande interesse e depende de TG para realizar a bisseção do grafo, ou seja, particionar os vértices de modo que tenham mais arestas intra-grupos do que entre grupos.

Outra questão de Redes que dependem de Teoria de Grafos é explicar os padrões observáveis em redes reais que a Natureza e o Homem constroem é um desafio também.

A Ciência pode vir antes da Teoria, como produção e organização do conhecimento baseada em evidência empírica, ou vice-versa, a teoria fornece uma abstração formal para explicar e prever a Ciência baseada em lógica matemática.

Comentários

  1. Como o tema de pesquisa ficou fechado em NoSQL Graph Stores vou continuar prospectando um problema de pesquisa nessa área de grafos. O curso de Verão 2021 do LNCC tem um mini curso sobre Ciência de Redes que já me inscrevi e pretendo fazer esse ano, finalmente!

    ResponderExcluir

Postar um comentário

Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.

Postagens mais visitadas deste blog

Aula 12: WordNet | Introdução à Linguagem de Programação Python *** com NLTK

 Fonte -> https://youtu.be/0OCq31jQ9E4 A WordNet do Brasil -> http://www.nilc.icmc.usp.br/wordnetbr/ NLTK  synsets = dada uma palavra acha todos os significados, pode informar a língua e a classe gramatical da palavra (substantivo, verbo, advérbio) from nltk.corpus import wordnet as wn wordnet.synset(xxxxxx).definition() = descrição do significado É possível extrair hipernimia, hiponimia, antonimos e os lemas (diferentes palavras/expressões com o mesmo significado) formando uma REDE LEXICAL. Com isso é possível calcular a distância entre 2 synset dentro do grafo.  Veja trecho de código abaixo: texto = 'útil' print('NOUN:', wordnet.synsets(texto, lang='por', pos=wordnet.NOUN)) texto = 'útil' print('ADJ:', wordnet.synsets(texto, lang='por', pos=wordnet.ADJ)) print(wordnet.synset('handy.s.01').definition()) texto = 'computador' for synset in wn.synsets(texto, lang='por', pos=wn.NOUN):     print('DEF:',s

truth makers AND truth bearers - Palestra Giancarlo no SBBD

Dando uma googada https://iep.utm.edu/truth/ There are two commonly accepted constraints on truth and falsehood:     Every proposition is true or false.         [Law of the Excluded Middle.]     No proposition is both true and false.         [Law of Non-contradiction.] What is the difference between a truth-maker and a truth bearer? Truth-bearers are either true or false; truth-makers are not since, not being representations, they cannot be said to be true, nor can they be said to be false . That's a second difference. Truth-bearers are 'bipolar,' either true or false; truth-makers are 'unipolar': all of them obtain. What are considered truth bearers?   A variety of truth bearers are considered – statements, beliefs, claims, assumptions, hypotheses, propositions, sentences, and utterances . When I speak of a fact . . . I mean the kind of thing that makes a proposition true or false. (Russell, 1972, p. 36.) “Truthmaker theories” hold that in order for any truthbe

DGL-KE : Deep Graph Library (DGL)

Fonte: https://towardsdatascience.com/introduction-to-knowledge-graph-embedding-with-dgl-ke-77ace6fb60ef Amazon recently launched DGL-KE, a software package that simplifies this process with simple command-line scripts. With DGL-KE , users can generate embeddings for very large graphs 2–5x faster than competing techniques. DGL-KE provides users the flexibility to select models used to generate embeddings and optimize performance by configuring hardware, data sampling parameters, and the loss function. To use this package effectively, however, it is important to understand how embeddings work and the optimizations available to compute them. This two-part blog series is designed to provide this information and get you ready to start taking advantage of DGL-KE . Finally, another class of graphs that is especially important for knowledge graphs are multigraphs . These are graphs that can have multiple (directed) edges between the same pair of nodes and can also contain loops. The