PageRank
Premissas
Um link na web é um sinal de qualidade já o autor do link pensa que a página referenciada é de alta qualidade
O texto âncora descreve o conteúdo da página referenciada
PageRank = taxa de visita a longo prazo da página dê a probabilidade que um navegador aleatório tem de estar na página d em um dado momento
Esta métrica classifica os vértices de acordo com seu grau e a classificação dos vértices adjacentes a ele. Para obter um score alto utilizando esta métrica é necessário se relacionar com vértices de score alto e que estes vértices, por sua vez, também se relacionem com vértices de alto score.
Aplicação: Grafo de Citações
Medir a similaridade de dois artigos
pelos artigos citados por ambos ou artigos em comuns citando ambos.
Frequência de citação ponderada ou rank de citações é um exemplo do uso de Page Rank.
Mais sobre PageRank em CS224W -> http://web.stanford.edu/class/cs224w/slides/04-pagerank.pdf e no vídeo -> https://youtu.be/TU0ankRcHmo
Hub e Authority
As métricas Hub e Authority são interdependentes. Para cada vértice i, o coeficiente de Hub é obtido realizando-se a soma do score Authority dos vértices que o vértice i aponta. De forma similar, o coeficiente de Authority de um vértice j é obtido realizando-se a soma dos scores Hub dos vértices que apontam para o vértice j.HITS – Hyperlink-Induced Topic Search
Dois tipos de relevância na web
Tipo 1: Hubs. Uma página hub é uma boa lista de [links para páginas adequadas à necessidade de informação].
Exemplo: Para a consulta [chicago bulls]: a lista do Bob de fontes recomendadas sobre o time Chicago Bulls
Tipo 2: Autoridades. Uma página de autoridade é uma resposta direta à necessidade de informação
Exemplo: A home page do Chicago Bulls
Por definição links para páginas de autoridade ocorrem nas páginas hubs e a maior parte das abordagens para busca (incluindo o ranking PageRank) não fazem distinção dos dois tipos de relevância.
Uma boa página hub para um tópico linka para muitas páginas de autoridade para aquele tópico
Uma boa página de autoridade para um tópico é linkado por muitas páginas hub para aquele tópico
J. M. Kleinberg, “Hubs, authorities, and communities,”ACM ComputingSurveys, vol. 31, no. 4, p. 5, 1999
http://www.facom.ufu.br/~albertini/1sem2013/ori/slides/21link-leitura.pdf
Comentários
Postar um comentário
Sinta-se a vontade para comentar. Críticas construtivas são sempre bem vindas.