Acesso rápido

Veja 5 receitas para exportação de dados do Google Analytics

por Bianca Santos Sexta-feira, 19 de julho de 2019   Tempo de leitura: 9 minutos

Ainda há muito do que explorar sobre dados brutos vindos diretamente do Google Analytics (GA). Por isso, vamos levantar cinco dicas sobre como interagir com esses dados e uma dica de como compartilhar as consultas criadas.

Já falamos um pouco sobre como o Google lida com seus escopos, agregando as linhas inicialmente por sessões e ramificando os acontecimentos desta através de campos aninhados e repetidos, portanto há como chegar em dados de usuários ou hits para um olhar mais micro das informações do site.

1- Acessar dados a nível minuto/segundo

Com a facilidade no acesso dos dados, a necessidade de acompanhar dados mais granulares com maior frequência se faz presente. Entretanto, é preciso ter uma atenção a mais a questões de fuso horário, que podem variar de ferramenta para ferramenta.

O esquema do Google Analytics possui uma coluna capaz de trazer o momento exato do início da sessão denominado visitStartTime, que está como um número inteiro representando segundos desde 01/01/1970 00:00:00 UTC, ou seja, se esse não foi o seu mesmo fuso horário usado, esse deve ser atualizado.

Uma das formas de fazer esse ajuste é pela função EXTRACT que permite extrair no formato que quiser a informação de data correta.

O horário dos dados do GA sempre estará atrelado ao configurado na vista extraída para o BigQuery, entretanto seu dados não necessariamente precisam ter essa limitante. Com esse ajuste de fuso horário há como considerar dados de um mesmo horário sempre juntos, não importando se a configuração inicial deste esteja em fusos diferentes.

2- Criação de Funil de Eventos/Pageviews

Funis baseados em interações com os sites são extremamente comuns, afinal facilmente apontam de gargalos, oportunidades ou comportamentos inesperados. Em sites, funis comuns são baseados em visualizações de página ou envio de eventos personalizados, portanto esses são os indicativos que devem ser usados na construção do funil.

Como tais informações estão em nível de hit, precisa-se chegar a esse nível de detalhe antes de levantar os totais finais. Nesse sentido, pode ser usada a função UNNEST já explicada no post anterior e desaninhar a tabela para chegarmos à granularidade de Hit. Com isso, os campos Totals ficam então replicados, então não podem mais ser usados.

Se o objetivo for um funil de sessões, o melhor a ser usado para contar é a combinação de visitStartTime com fullVisitorId que tende a ser única, uma vez que um visitante provavelmente não inicie duas sessões ao mesmo tempo.

Dessa forma, segmentamos as visitas passadas em cada passo de uma única vez. Afinal tal construção de funis pode ser considerada análoga aos segmentos avançados. Assim, contando os conjuntos únicos que passaram por cada passo do funil, consegue-se montar o fluxo de sessões que passaram por cada passo previamente levantado:

No entanto, se o objetivo for levantar o funil considerando usuários, basta apenas trocar o conjunto visitStartTime-fullVisitorId para considerar apenas fullVisitorId. Asssim, se o usuário passou pelos passos do funil, mesmo que seja em mais de uma sessão, ele é contado apenas uma vez.

3- Acessar metadados das tabelas

Além dos dados das tabelas, uma necessidade que pode surgir é o acesso aos dados sobre as tabelas em si. No caso da tabelas do GA, essas informações ajudariam a entender em qual horário a tabela do dia está sendo criada e, portanto, quando os dados dela estão disponíveis, assim como o volume desses, por exemplo.

Para tanto o BigQuery fornece o acesso à alguns metadados das tabelas como:

  • Project_id — Id do Projeto
  • Dataset_id — Id do Dataset
  • Table_id — Id da tabela
  • Creation_time — Momento da Criação
  • Last_modified_time — Momento da ultima modificação
  • Row_count — Quantidade de linhas
  • Size_bytes — Volume em bytes
  • Type — Tabela (1) ou Vista (2)

Para acessar os dados, basta fazer a seguinte consulta:

4- Evitar consultas em tabelas externas vazias

O problema em acessar tabelas externas vazias é que geralmente demora muito tempo para retornar algo e, quando finalmente há o retorno, esse se configura como um erro genérico. Para contornar essa situação, uma maneira é usar justamente metadados da tabela e não fazer consulta alguma caso a tabela não tiver linhas:

Tabelas externas geralmente contêm dados dinâmicos que podem enriquecer os dados levantados no GA. O caso de ausência de dados em determinada tabela externa não se configurará como um problema em um fluxo de trabalho automático que leve tais tabelas.

5- Resgate de fluxo de páginas

Além de encontrar o funil, outra comum necessidade encontrada ao analisar dados do GA é encontrar a relação entre as páginas do site. Para tanto é possível criar uma base encontrando as páginas anteriores de visualizações de página feita em uma sessão.

Pensando no objetivo específico de encontrar a página anterior, a função analítica LAG é a indicada pois ela retorna o valor da linha anterior, ou seja, da página visualizada anteriormente, dentro de uma janela que pode ser determinada como cada sessão. A sintaxe no BigQuery ficaria, portanto, como a seguir:

As funções analíticas do BigQuery permitem a manipulação de dados diretamente na consulta ao, antes de finalizá-la, executar uma função a parte que traga o dado necessário para a finalização da consulta específico para cada linha. Para tanto, a função analítica permite criar para cada linha uma janela de dados (window frame) específica para encontrar os valores analíticos relacionados a linha em questão, como o primeiro valor através da função LAG.

Se houver a necessidade de criar a mesma análise para aplicativos, basta apenas trocar a dimensão principal de hits.page.pagePath para hits.appInfo.screenName.

Dica extra: compartilhamento de consultas

O compartilhamento de consultas é uma possibilidade disponibilizada recentemente pelo Google e permite o envio de consultas salvas por um link específico. Isso facilita muito a dinâmica de intercâmbio de consultas que provavelmente acontece em um time que precise trabalhar com dados, seja para compartilhar soluções seja para guardar padrões.

Para tanto, em consultas salvas há um novo botão no canto superior direito denominado “Link Sharing”:

E então habilitar a opção de link compartilhado e copiar e disponibilizar para quem precise a consulta.

Enfim, essas foram cinco receitas para melhor interação com dados do Google Analytics e a dica para ajudar no dia a dia de trabalho com as consultas do BigQuery. Espero que elas ajudem e até a próxima.

Artigo republicado com autorização da autora. Texto original disponível aqui.

Você recomendaria esse artigo para um amigo?

Nunca

 

Com certeza

 

Deixe seu comentário

0 comentário

Comentários

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Comentando como Anônimo

This site uses Akismet to reduce spam. Learn how your comment data is processed.

  Assine nossa Newsletter

Fique por dentro de todas as novidades, eventos, cursos, conteúdos exclusivos e muito mais.

Obrigado!

Você está inscrito em nossa Newsletter. Enviaremos, periodicamente, novidades e conteúdos relevantes para o seu negócio.

Não se preocupe, também detestamos spam.