Logo E-Commerce Brasil

Usando as mídias sociais para se antecipar à demanda de busca

Antes de começar a dizer qualquer coisa sobre pesquisa de palavras-chaves, eu quero tirar o chapéu para Richard Baxter porque as ferramentas e metodologias que ele compartilhou no MozCon fazem com que eu me sinta idiota por pensar em trazer algo para a mesa de Pesquisa de Palavras-Chaves. Tendo dito isto, tenho algumas idéias sobre usar fontes de dados além daqueles fornecidos pelos mecanismos de busca para ter uma idéia de quais necessidades as pessoas estão precisando satisfazer no momento. Considere este o primeiro de uma série.

Correlação entre mídias sociais e volume de pesquisa

O maior problema com a pesquisa de palavras-chaves fornecida pelos mecanismos de busca é o atraso de tempo nos dados. A web é inerentemente um canal de tempo real e para capitalizar com ela você precisa ser capaz de alavancar qualquer vantagem que você puder, para se antecipar à demanda de busca. Embora o Google Trends forneça dados quando existe grandes fugas em palavras-chaves em torno de acontecimentos atuais, há um atraso de três dias com o Google Insights, já com o AdWords os números são mensais!

No entanto, muitas vezes existe uma correlação muito forte entre o número de pessoas que estão falando sobre um assunto, ou palavra-chave nas mídias sociais, e a quantidade de volume de busca para aquela tópico. Compare a tendência de tweets postados contendo a palavra-chave “Michael Jackson” com um volume de busca para os últimos dias (pesquisa realizada no mês de agosto e setembro deste ano).

Tweets contendo a palavra-chave “Michael Jackson”

Volume de busca por “Michael Jackson”

Os gráficos são quase idênticos, com um aumento incrível no dia 29 de agosto, que é o dia do aniversário do Michael Jackson (e o meu também!). O problema é que dadas as limitações de ferramentas, como o Google Trends e o Google Insights, você pode não conseguir descobrir isso até o dia 1º de setembro para muitas palavras-chaves, e além disso você pode não ser capaz de encontrar termos long tail complementários com volume de busca.

O que descobrimos aqui é que os assuntos sobre os quais as pessoas estão twitando são, no final das contas, as palavras-chaves pelas quais elas estão procurando. O benefício de escutar a mídia social para pesquisa de palavras-chaves é que você também pode ter uma idéia do intuito do pesquisador para melhor compreender suas necessidades.

Devido a essa correlação, a “Escuta Social” permite que você descubra quais tópicos e palavras-chaves terão demanda e busca e quais terão picos na demanda de busca – em tempo real.

N-grams

Antes de entrarmos na metodologia para fazer isso, tenho que explicar um conceito básico: N-grams. Um N-gram é um sub-conjunto de uma seqüência de comprimento N. No caso dos mecanismos de busca, o N é o numero de palavras em uma consulta. Por exemplo, (sou terrível com gradientes):

É um 5-gram. A maioria das consultas de busca tem entre 2 e 5-grams, e qualquer coisa além de 5-gram provavelmente é uma palavra-chave que chamamos de “LONG TAIL”, que não tem volume de busca suficientemente grande para justificar a criação de conteúdo.

Se isto ainda não está claro para você, dê uma olhada no Google Books Ngram viewer; É uma maneira muito boa de ter uma boa idéia do que são os Ngrams. Você também deveria dar uma olhada neste post de John Doherty – Google Analytics Advanced Segments,onde ele fala sobre como segmentar N-grams usando RegEx.

Metodologia de pesquisa de palavras-chaves em tempo real

Agora que tivemos uma pequena atualização de vocabulário, vamos falar sobre como podemos fazer uma pesquisa de palavras-chaves em tempo real. A metodologia a seguir foi desenvolvida pelo meu amigo Ron Sansone, com algumas pequenas revisões minhas para portá-la para código.

  1. Puxe todos os tweets contendo sua palavra chave do Twitter Search na última hora. Esta parte é bem simples; você quer puxar a porção mais recente da conversa agora para extrair padrões. Use o Topsy para isso. Se você não estiver usando o Topsy, puxar pelo menos 200 tweets do Twitter também é um bom tamanho de dados para usar.
  2. Identifique os 10 N-grams mais repetidos, ignorando as palavras de parada. Aqui você identifica as palavras-chaves com a maior densidade. Em outras palavras, as palavras-chaves que mais são tweetadas são as que você considerará para otimização. Certifique-se em manter isso entre 2 e 5 N-grams, além disso você provalmente não estará lidando com um volume de busca grande o suficiente para que seus esforços de busca valham a pena. Além disso, certifique-se de excluir palavras de parada para que você não fique com n-grams como “jackson the” ou “has Michael.” Aqui está uma lista de palavras de parada em inglês e o Textalyser tem uma ferramenta adequada para quebrar um bloco de texto em N-grams.
  3. Cheque para ver se já existe muito volume de busca na ferramenta de pesquisa do Adwords, ou no Google Insights. Este processo não é somente sobre identificar palavras-chaves que não estão sendo mostradas ainda no Google Insights mas também de identificar palavras-chaves com volume de busca existente e que logo irão alavancar. Portanto, você irá querer checar os mecanismos de busca para ver se existe algum volume de busca para priorizar suas oportunidades.
  4. Puxe todos as pontuações do Klout de todos os usuários que estão twittando.Sim, eu sei que o Klout é um cálculo completamente arbitrário, mas você quer saber que as pessoas que twittam as palavras-chaves tem alguma influência. Se você descobrir que um certo N-gram foi usado muitas vezes por um perfil spam do Twitter, então este N-gram não é útil de nenhuma maneira. Além disso, se você criar conteúdo acerca de um certo termo, você saberá exatamente para quem enviá-lo.

Metodologia Expandida

Eu fui além da metodologia Ron ao introduzir outra fonte de dados. Se você estava no SMX East, você pode ter me ouvido expressar o amor que batalhadores por custo baixo (como eu) tem pelo SocialMention. Usar o SocialMention permite que você puxe dados de até 100 propriedades de mídias sociais e novas fontes. Diferentemente do Topsy, ou do Twitter, existe uma fácil exportação do arquivo CSV/Excel e eles te dão os top 1-grams que estão sendo usados em posts relacionados àquele tópico. Certifique-se em excluir imagens, áudio e vídeo dos seus resultados de busca, uma vez que eles não são úteis.

Menção social sobre “Michael Jackson”

Nota rápida: A exportação do CSV somente te dará uma lista de URLs, fontes, títulos de páginas e ideias principais. Você ainda terá que extrair os dados manualmente, ou com alguma mágica do importXML, que Tom Critchlow lançou no início do ano.

Então, qual o propósito?

Então, o que isso tudo me traz? Bom, hoje ele me trouxe “michael jackson trial”, “jackson trial”, “south park” e “heard today”. Portanto, se eu estivesse procurando por algum conteúdo sobre o Michael Jackson, eu descobriria quais notícias vieram à tona no tribunal, e poderia, assim, ilustrar o julgamento e as notícias que encontrei  em um post em meu blog, usando personagens do desenho animado South Park. Depois disso enviaria para os formadores de opinião que twitaram sobre isso. Preciso dizer mais? Agora você pode facilmente entender que tipo de conteúdo viraria uma isca viral em tempo real.

GoFish

Isso parece muito trabalho para conseguir descobrir algumas palavras-chaves, não?

Bem, eu definitivamente consigo ver o propósito, e por ser programador, é extremamente doloroso para mim fazer qualquer tarefa repetitiva. Eu vou mesmo entrar no Excel e remover palavras de parada? Não, não vou; e você também não deveria. Sempre que surge uma metodologia como esta, a primeira coisa que eu penso é como automatizá-la. Senhoras e senhores, eu gostaria de apresentá-los a legendária ferramenta de busca de palavras-chaves em tempo real: GoFish.

Eu construí o GoFish a partir da metodologia Ron, e ele usa as APIs do Topsy, Repustate e SEMRush. Quando eu tiver um pouco de tempo extra, vou incluir a API do SocialMention.

Eu duvido que ele dará conta da carga de conteúdo – já que ele está na primeira página do SEOmoz, uma vez que ele foi construído sob 10 proxies e cada uma dessas APIs tem limitações substanciais de taxa (Topsy – 33k/dia; Repustate 50k/mês; SEMRush – não tenho certeza). Se alguém quiser me doar algumas instâncias AWS, ou uma rede de Proxy maior, eu ficarei feliz em fazer essas armas aumentarem. Obrigado a John Murch por me emprestar seu estoque secreto de proxies, e muito obrigado, também, a Pete Sena, da Digital Surgeons, por criar para mim um GUI “multiuso” para as minhas ferramentas.

De qualquer maneira, tudo que você tem que fazer é colocar sua palavra-chave, apertar o botão, esperar um tempo e voilá: você terá um resultado mais ou menos assim:

O output é o top 10 do N-grams, com as pontuações combinadas do Klout de todos os usuários que twittaram o dado N-gram, versus a pontuação mais alta possível do Klout.

Então, esse é o GoFish. Pense nele como um trabalho em progresso e me fale quais recursos te ajudariam a aproveitá-lo melhor.

Até a próxima…

É tudo que tenho para essa semana pessoal. Caso você tenha realmente se interessado, pode ler o meu artigo Keyword-level demographics.

Este artigo é uma republicação feita com permissão. SEOMoz não tem qualquer afiliação com este site. O original está em http://www.seomoz.org/blog/using-social-media-to-get-ahead-of-search-demand.