Logo E-Commerce Brasil

SEO: tempo de vida da palavra-chave segundo um engenheiro de busca

Por: Victor Rossini Magalhães

SEO & CRM Director at Cadastra. Atua no mercado digital desde 2001 em projetos de diversos segmentos. Na Cadastra, é responsável pelo Experience Hub que é composto pelas áreas de SEO e User-Centered Design. Já atuou em projetos para Vivo, Lojas Renner, Insper, Abril, Petrobras, entre outros.

As ferramentas de busca existem desde o início da internet. E, desde o seu início, também existem profissionais estudando essas ferramentas e quais as melhores práticas para gerar resultados através deste canal. O objetivo deste artigo é mostrar como funciona o tempo de vida de uma palavra-chave. Ou seja, desde o momento onde o Google “conhece” o termo, até o retorno na busca — sob o olhar dos olhos de um engenheiro de rankings.

O conteúdo é totalmente baseado na palestra do Googler Paul Haahr, no SMX West, cuja a apresentação pode ser conferida na palestra abaixo:

O tempo de vida de uma palavra-chave é dividido em duas partes: pré-busca, que é a parte mais fácil; e o processamento de uma palavra-chave, que já é mais complicado.

Pré-busca

A etapa pré-busca consiste no rastreamento (crawling) da internet pelo Googlebot e suas variações (mobile, news, image e etc). Após essa etapa, as páginas são analisadas passando por um processo de extração dos links, renderização do conteúdo e interpretação sobre as notações semânticas (conexões do conteúdo com entidades e outros elementos do Knowledge Graph).

Com essas informações, o índice de busca é gerado e este funciona como um índice de um livro, sendo que para cada palavra, uma lista de páginas aparece/conecta com ela. O índice é distribuído entre grupos de milhares de páginas. Estes grupos são chamados “Shards*” e existem mais de 1.000 “Shards” para o “web index”. Além dessas informações, também temos os meta-dados* dos documentos.

Processamento da palavra-chave

O processamento e entendimento da palavra-chave começa com uma análise para saber se ela possui alguma entidade vinculada e/ou um sinônimo. Neste momento o contexto é muito importante, pois ele irá segmentar e entender a necessidade do usuário.

Exemplo:

Entendimento da Keyword

Existem entidades ligadas à esta palavra-chave?
Ex: [Estádio do Corinthians], [Zacarias]

Existem sinônimos nesta palavra-chave?
Ex: [XP] -> [XP Investimentos], [XP php] – > [Instalar php no windows xp]

Contexto importa e importa muito nesta etapa:
Ex: [Manga] -> Fruta, Mangá, Manga de Roupa
Ex: [Cabo] -> Cabo de Cobre, Cabo (Lugar), Cabo Frio (Cidade), Cabo Exército

SEO palavra-chave

Após essa primeira etapa, entramos na fase de recuperação e score, passando primeiramente pelo envio da palavra-chave para todas as “shards”.

Cada uma das “shards” retorna:

  • Páginas que combinam com a palavra-chave
  • Calcula o score para a palavra-chave + página
  • Retorna as top pages por score

As top pages são combinadas em uma listagem, ordenadas por score e, em seguida, passam por um ajuste fino, verificando:

Ajustes no título e meta descrição quando necessário

  • Inclui sitelinks + rich snippets
  • Verifica se existem muitos resultados similares
  • Desqualifica páginas spam ou com ações manuais

No final dessa fase, temos o resultado de busca em apenas ⅛ de segundo.

Velocidade de busca palavra-chave

Certo, mas afinal, qual a função do “engenheiro de rankings”? As principais são:

  • Escrever os códigos para os servidores (shards*);
  • Procurar por novos sinais e os combiná-los com os sinais mais antigos;
  • Otimizar os resultados através da análise sobre as métricas;
  • Entender os sinais e alterar o peso deles ao longo do tempo.

Score

O score é uma nota para combinar a palavra-chave com a página do site. Os sinais são um pedaço da informação utilizada no score. Neste caso, são separados em dois grupos distintos: um independente da palavra-chave, e o outro dependente dela. Alguns exemplos de sinais independentes: PageRank, linguagem e mobile friendly. Exemplos de sinais dependentes: hits, sinônimos e proximidade (local).

Métricas

As métricas são utilizadas como guia para que a otimização dos resultados de busca aconteça. Entre ela, as principais são:

  • Relevância: a página responde à busca do usuário e métricas de qualidade da página (essa é a mais importante de todas);
  • Qualidade da página: quão bom são os resultados para esta busca;
  • Tempo de carregamento: quanto mais rápido, melhor.

Ainda dentro das métricas, também são utilizados pesos para os rankings. Neste peso ainda existe uma escala, chamada “Reciprocidade de Rankings”:

  • Primeiro lugar, vale 1;
  • Segundo lugar, vale ½;
  • terceiro lugar, vale ⅓;
  • quarto lugar, vale ¼;
  • quinto lugar, vale ⅕ e assim por diante.

Todos os indicadores passam por um processo de validação, seja ele através dos “Live Experiments” ou dos “Human Raters”. Os exemplos de Live Experiments são: teste A/B nos usuários ativos (o famoso sandbox), entendimento sobre a mudança no padrão de cliques e análise dos resultados. Um teste bastante conhecido foi a análise entre 42 variações da cor azul dos links nos resultados de busca para entender qual delas performa melhor. Conseguem imaginar o desafio que é interpretar estes dados?

Os Human Raters são pessoas que executam uma série de testes e análises nos resultados de busca. Durante o processo de teste, eles passam por um questionamento sobre quais são os melhores resultados para uma busca e o motivo para isso, se estes estão de acordo com os guidelines definidos pelo Google. O processo de coleta dessas informações é bastante automatizado e os engenheiros gostam de contar com a análise dos Raters para qualificar os resultados — a intuição ainda é um ponto bastante utilizado aqui.

Human Haters

Exemplo de como a ferramenta de coleta (Radar Tools) funciona:

Radar Tools

Rating do resultado de busca

Existem duas escalas que podem ser vistas na imagem acima. A primeira indica se o item atende às necessidades dos usuários. Já a segunda é sobre o rating da qualidade deste item.

Uma variável bastante importante sobre a necessidade do usuário é o Mobile First. Ou seja, se a página atende à necessidade e ao modelo de interação para usuários que navegam através de dispositivos móveis. Também são analisadas o dobro de palavras-chave em mobile. Além disso, também existe a preocupação com a localização.

A necessidade encontra o rating

Existem algumas escalas para entender se o item (resultado de site, notícia, imagem, mapa e etc.) atende ou não à necessidade do usuário. Na busca pela palavra-chave “lojas colombo” executada no estado do Rio Grande do Sul, o rating trabalha da seguinte maneira:

  • Combina perfeitamente
    Lojas Colombo
  • Combina bastante
    Colombo
  • Combina
    Camisa Colombo
  • Combina pouco
    Cidade de Colombo
  • Não combina
    Raimundo Colombo

Mais exemplos sobre este ponto podem ser encontrados no guideline mencionado anteriormente.

Qualidade da página

Existem três conceitos que descrevem o significado de “Qualidade de Página”: Expertise, Autoridade e Credibilidade (chamamos este item de Reputação). São três perguntas simples, mas que valem ser feitas: o autor deste conteúdo é um especialista no tema? O site ou página são uma autoridade sobre o tema? Você confia neste conteúdo?

Páginas de baixa qualidade são o oposto do item anterior: a qualidade do conteúdo é baixa? O conteúdo é insatisfatório? O autor não passa confiança ou não é uma autoridade sobre o assunto? Existem muitos anúncios na página ou algo que possa gerar uma distração?

Ufa, finalmente chegamos ao final do artigo e espero não ter assustado ninguém ou soar mandatário em nada. O conteúdo pode parecer uma teoria sobre Game of Thrones. Entretanto, a ideia foi abrir a discussão sobre o entendimento da ferramenta de busca sobre o significado de uma determinada query (palavra-chave) e também da necessidade do usuário quando este executa a busca.

Comentem, discutam, compartilhem e vamos evoluir juntos nesse material!

Meta-dados: também conhecidos como “dados sobre os dados”, são um detalhamento sobre aquela informação em específico.

Shards: são os grupos de servidores onde as mais de 30 trilhões de páginas ficam armazenadas, compondo o índice de busca.