Apresentação da disciplina de Big Data do Casanova - grupo sobre Grafos
Clusterização dos nós do grafo para identificação de comunidades, técnicas de clusterização tradicional não são adequadas.
Grafos de redes sociais tem um conjunto de entidades com um ou mais tipos (Pessoas, Organizações) que formam os nós e relações entre os nós que podem ser direcionais (A segue B) ou bidirecionais (A é amigo de B e B é amigo de A) e rotuladas que formam os arcos (ou arestas). Os k tipos de nós podem formar k conjuntos disjuntos em um grafo k-partido.
A formação de comunidades pode se dar por nós do mesmo tipo que compartilham Interesses Comuns (curtiram ou seguem a mesma página, amigos em comum, etc ...). Em caso de grafos de redes de Colaboração Científica as comunidades podem ser formadas por Autores que publicam artigos de um tópico em particular ou por Publicações sobre um tópico em particular.
Medidas de similaridade são necessárias para identificação de clusters.
Algoritmo de Girvan-Newman
Repetir até não haver mais arcos:
Calcula betweenness dos arcos (usando BFS)
Remove arcos com maior betweenness
Outras abordagens: contagem de cliques (qualquer subgrafo completo, ou seja, com nós totalmente conectados) e Grafo Bipartido Completo (grandes itemsets frequentes). Cliques são úteis para achar comunidades pequenas (o q seria pequeno?)
Simrank para similaridade entre nós, principalmente em grafos com diferentes tipos de nós.
Contagem de triângulos (cliques de tamanho 3)
Particionamento de Grafos: minimizar o número de arestas que conectam componentes diferentes (bom corte).
Matriz Laplaciana L = Matriz de Grau D - Matriz de Adjacência A
Comunidades raramente são disjuntas.
Slides do capítulo 10 do Livro
http://www.mmds.org/mmds/v2.1/ch10-graphs1.pdf
http://www.mmds.org/mmds/v2.1/ch10-graphs2.pdf
Livro completo online http://infolab.stanford.edu/~ullman/mmds/book.pdf
Vídeo inicial da série https://youtu.be/MiKecKWbJhM
Site para linkar todo o material do livro e curso de Standford http://www.mmds.org/
Comentários
Postar um comentário
Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.