Como o Google classifica Tweets

Publicado em: fevereiro 10, 2010.

Algoritmos que julga a relevância das mensagens do microblog contendo 140 caracteres ou menos.

Para proporcionar retornos de busca úteis a partir da chamada Web em tempo real – como segundo antigo  Twitter “tweets” criando engarrafamentos de relatórios O  Google adaptou o seu ranking de tecnologia e desenvolveu novos truques de algoritmos e filtros para manter retornos relevantes, de acordo com um engenheiro do Google.

O Google lançou a tecnologia de pesquisa em tempo real no mês passado, para oferecer acesso  a pesquisadores do novo serviço  e notícias muito mais rápido do que o atual que é de cinco a 15 minutos.

Bing, Cuil e outros sites de busca também fornecem vários tipos de resultados em tempo real. Tanto o Google quanto o Bing  também forjaram grandes negócios com o Twitter para obter acesso em tempo real para tweets, Aqueles 140 caráteres das mensagens do microblog enviados por membros do Twitter. Mas o Google afirma oferecer a mais completa lista em tempo real dos resultados na varredura de manchetes de jornais, blogs e feeds do Facebook, MySpace, Twitter, e outras fontes.

Os tweets são um pilar de resultados do Google em tempo real, mas no Google não foi discutido como os classifica. A estratégia fundamental do Google para identificar a relevância do tweet é análogo ao utilizado pela tecnologia do Google PageRank, o que ajuda a encontrar páginas Web relevantes com pesquisa Web tradicional. Sob o PageRank, O Google julga a importância das páginas que contenham uma determinada palavra-chave de pesquisa, em parte, ao olhar para a estrutura de links da página. Quanto mais páginas que apontam para uma página – e mais páginas linkando para ela – a página se torna mais relevante do que o original.

No caso dos tweets, a chave para identificar “os seguidores de renome”, diz Amit Singhal, o Google Fellow, que liderou o desenvolvimento da pesquisa em tempo real. (Twitterers “seguir” os comentários de outros Twitterers que você selecionou, e são eles próprios “, seguiu.”)

“Você ganha reputação, e, em seguida, dar-lhe a reputação. Se muita gente segui-lo, e então você seguir alguém – então, mesmo que essa pessoa [novo] não tem muitos seguidores,” o seu tweet é considerado valioso porque seus seguidores são seguiu-se amplamente, Singhal afirma. Ele é “definitivamente, definitivamente” mais do que um concurso de popularidade “, acrescenta.

“Um usuário que segue outro em mídia social é análogo a uma página com links para outro na web. Ambos são uma forma de recomendação”, diz Singhal. “Os Links de qualidade para outra página na Web, a qualidade das páginas linkadas sobe. Do mesmo modo, nos meios de comunicação social, os usuários, conforme estabelecido seguir outro usuário, a qualidade do usuário seguido sobe também.”

Mas os truques de ranking social do Google são praticamente o único método que o gigante das buscas usa para extrair pertinência de tweets. O Google também desenvolveu novas formas de escolher quais (se houver) tweets à superfície de termos comuns como “Obama” – e para evitar o spam ou tweets baixa qualidade – tudo isso dentro de segundos.

Um problema com tweets é que as pessoas muitas vezes enchem com os chamados “hashtags”. Estes são símbolos que começam com um sinal de sustenido (#) seguido de uma palavra que representa um tema muito popular atual, como “Nexus One” ou “Earthquake” ou qualquer outra pessoa pode ser um tema da moda no momento. Quando um hashtag está incluída em um tweet,O resultado do tweet vai aparecer quando outros Twitterers clicarem na palavra com a  hashtag do tema em outra parte do site.

Embora essas tags podem ser útil para maximizar a exposição de um tweet, elas também podem servir de bandeiras vermelhas de baixa qualidade e atrair como conteúdo spam-like, Singhal afirma. Enquanto ele não quis entrar em detalhes, ele disse que o Google modelado este comportamento hashtagging de formas que tendem a reduzir a exposição dos tweets de baixa qualidade. “Precisávamos modelo que [hashtagging comportamento]. Esse é o desafio técnico que formamos depois com abordagens de modelagem”, diz Singhal.

Outro problema: como, se alguém está à procura de “Obama”, ao filtrarem tweets imprensa da Casa Branca e milhares de outros para encontrar a informação mais oportuna e atualizada. Google digitaliza tweets para encontrar o sinal “no barulho”, diz ele. Este sinal “poderia incluir uma nova explosão de tweets e outros blogs que a polícia menciona” Cambridge “ou” Harry Reid “perto de menções de” Obama “. Ao olhar para fora destes sinais, o Google é capaz de fornecer acessos em tempo real que contêm os mais atuais assunto até mesmo para termos de pesquisa muito comuns.

No futuro, tanto o Twitter e o Google esperam melhorar a relevância dos retornos de busca em todos os contextos, acrescentando dados de geo-localização, que podem ser adicionados aos posts enviados de telefones inteligentes. Em geral, a pesquisa em tempo real “está evoluindo”, diz Dylan Casey, o gerente de produto do Google para a pesquisa em tempo real. “Eu falo com os caras no Twitter em uma base regular para saber onde o recurso está indo. Recebemos feedback deles, damos-lhe feedback, e nossos engenheiros colaboram. É verdadeiramente simbiótica”.

Singhal acrescentou que o Twitter é praticamente a única fonte de informação em tempo real. “Twitter é realmente um componente muito importante da Web em tempo real. Entretanto, o que estamos observando é que ele é apenas um dos componentes. Existe uma grande quantidade de valor em notícias, blogs e páginas da Web que estão sendo gerados em tempo real-time, porque as organizações de notícias trabalham muito para obter qualidade de um certo nível “, diz ele. “Twitter é realmente útil porque é curto o conteúdo do formulário. No entanto, estamos percebendo que a Web em tempo real é muito maior.”



Comente agora esta notícia

Envie seu Comentário. Lembramos que não nos responsabilizamos pelos comentários enviados no site, uma vez que fica sob responsabilidade daquele que escreveu, todas as ações, decorrentes da mensagem.

Nenhum Comentário »


Deixe seu comentario agora


Compartilhe:

Veja Também