quarta-feira, 15 de dezembro de 2010

Crawling content - I #in




Os grafos acima são resultantes do mesmo tipo de consulta. No caso da WEB 1.0 o crawler da VOSON foi programado para buscar páginas da WWW que continham "I Haven't Read This Book, but...", a rede era demasiadamente grande (40K vértices), então acabei por limitar em 3 páginas da Amazon nos EUA, no Canadá e no Reino Unido. O que trouxe uma sub rede Amazon com 1.5K vértices ligados a Amazon. Já no caso da WEB 2.0 optei por realiza o mesmo procedimento, agora o crawler do NODEXL para Twitter foi programado para buscar posts do Twitter que continham "I Haven't Read This Book, but...", a rede era formada por cerca de 800 vértices (perfis do Twitter). Fora a distinção no conteúdo dos Tweets contra os testemunhos na Amazon, podemos apontar um distinção na topologia das redes. A rede WEB 1.0 é hierárquica, no Twitter é anárquica. Quando se trata da propagação de uma MEME (Buzz word).

Porém, quando pegamos um perfil e analisamos sua rede de "replies to" e "mentions" o que podemos ver? Fizemos isso o perfil indicado abaixo em até dois graus de separação e limitado a 100 pessoas. É aquele no indicado pela seta vermelha indiscreta.


Resultou no seguinte grafo -  "replies to" e "mentions":


A rede muda de topologia, e veja onde está nosso perfil em análise. É o cara com laços em vermelho. Agora vemos uma outra rede, com nós não coincidentes aos do grafo anterior. Ainda com uma estrutura anárquica, porém com maior conexidade - maior número de ligação entre os perfis. Vejam a posição de nosso perfil (o cara com laços em vermelho), é periférica.

Uma rede  "replies to" e "mentions" para "I Haven't Read This Book, but...", somente se racionalizou através uma estrutura hierárquica formada pelas páginas da Amazon Books e talvez por serem uma arena onde há impessoalidade. Bom tema para estudos futuros. 


Nenhum comentário:

Postar um comentário