Acesso rápido

Detecção de anomalias: funcionalidade torna visível o dado anômalo no Adobe Analytics

por Rafael Rojas Quarta-feira, 16 de maio de 2018   Tempo de leitura: 7 minutos

Dados visualizados de maneira otimizada são temas sempre presentes tanto no mercado de marketing digital, como em qualquer companhia que busca melhorar a performance do seu negócio. No entanto, muitas vezes é preciso ir além desse dado visualmente disposto, mas que também agrega tendências e anomalias nesse intervalo de dados.

Estes padrões de alterações são muitas vezes referidos como anomalias, exceções, observações discordantes, entre outros, variando de acordo com o contexto. Geralmente, detectar anomalias é um processo manual, que utiliza modelos estatísticos e um intervalo coerente dos dados, onde quaisquer dados exteriores a esse intervalo pré-definido são considerados anômalos.

Conceito e uso

Anomalias são dados que fogem a um padrão definido. Um dos exemplos estatísticos é o dado que está fora de um intervalo de confiança de 95%, em uma distribuição normal. Além disso, esse valor é considerado anômalo quando atinge um percentual pré-definido acima ou abaixo do valor médio do intervalo analisado.

Segundo a própria Adobe, a detecção de anomalias permite separar os “sinais verdadeiros” do “barulho” e identificar possíveis fatores que contribuem para os sinais ou as anomalias. Ela pode ser definida como o problema de encontrar padrões em dados que não estão em conformidade com o comportamento esperado.

Dentre os exemplos de anomalias que você pode investigar, há quedas drásticas no valor médio de pedido, picos em pedidos com receita baixa, picos ou quedas em registros de avaliação e quedas em visualizações da página inicial.

Varun Chandola, em Anomaly detection: a survey define a detecção de anomalias como uma busca por identificar dados caracterizados como anômalos, diferenciando-os daqueles ditos normais dentro de um determinado contexto. Segundo Vic Barnett e Toby Lewis, no livro Outliers in Statistical Data, uma observação anômala é aquela que parece desviar-se acentuadamente dos outros membros da amostra em que ocorre.

Em diversos casos, o conceito de anomalia é uma divergência em relação a um padrão estabelecido em um intervalo de dados. Em um artigo publicado na área da saúde, por exemplo, os dados com frequência inferior a 4% foram considerados anômalos na análise realizada.

Por dentro do Anomaly Detection

Dentre as ferramentas disponibilizadas no Adobe Analytics, o Analysis Workspace possui uma importante funcionalidade: detecção de Anomalias (Anomaly Detection). Anteriormente era utilizado também no Report & Analytics, porém na versão mais recente da plataforma, apenas é visualizado internamente nos projetos do Workspace.

Essa funcionalidade oferece um método estatístico que determina como uma métrica tem mudado em relação aos dados anteriores. A detecção de anomalias consiste na identificação de dados com um comportamento diferente do esperado. No caso da funcionalidade, entre as diversas metodologias estatísticas apresentadas pela Adobe, é utilizada a que apresentar um intervalo de confiança maior, mais próximo de 100% (entenda um pouco mais sobre o Anomaly Detection).

O algoritmo, no caso da Adobe, também leva em conta sazonalidade da data, como por exemplo feriados norte-americanos e mundiais. Segundo a própria empresa, a aplicação desses feriados no algoritmo melhora o desempenho dele.

Detecção de Anomalias oferece um método estatístico para determinar uma anomalia, considerada a margem limitante, dentre as métricas visualizadas. Essa comparação é feita em relação ao período anterior da visualização. Por exemplo, em uma granularidade semanal, utiliza uma retrospectiva de 15 períodos, incluindo o intervalo de dados de relatório selecionado (15 semanas) e um intervalo de dados correspondente há um ano para treinamento.

Visualização no Workspace

Você pode visualizar a anomalia detectada tanto no formato de tabela, como nas visualizações gráficas, exclusivamente em gráficos de linha.


Exemplo de detecção de anomalia no gráfico (Fonte: Reprodução)

Nas tabelas, você visualiza um aviso, como um sinal de alerta na linha que corresponda ao dado anômalo. Já no contexto do gráfico de linha, você observa o ponto do gráfico que representa essa anomalia, com um ponto já marcado e com a informação percentual da anomalia (saiba mais sobre o Analytics Workspace).

Exemplo de cenário

Um exemplo de como o Anomaly Detection pode auxiliar prontamente a validação e visualização das alterações no seu site é no momento de uma mudança na coleta dos dados. Por exemplo, quando há uma atualização na coleta de dados do site e algumas páginas não estão sendo mais coletadas, pode haver diminuição no volume de page views. Ao visualizar essa métrica relacionada às URLs, poderá ser visualizado qual o escopo de páginas que sofreu maior alteração nesse período.

Nesse cenário, há como entender quais páginas deixaram de ser coletadas e buscar uma solução com a melhoria nessa coleta. Com isso, a atualização da coleta dos dados, buscando abranger essas páginas, já poderia trazer uma correção a esse volume de visualizações.

Auxílio interno

Além do Anomaly Detection, uma outra funcionalidade para auxiliar nessa análise é o Contribution Analysis. Esse é um processo de aprendizado de máquina para descobrir quais dados são contribuintes diretos nessa anomalia dos dados. O objetivo dessa funcionalidade é auxiliar na resolução do diagnóstico já apresentado pelo Anomaly Detection.


Exemplo de análise de contribuição (Fonte: Reprodução)

 

Ações consequentes

A detecção de anomalia surge como um aviso em relação a algum dado que está sendo visualizado no Analysis Workspace. Esse modelo serve para entender alterações no comportamento das métricas e posterior análise em relação à causa dessa mudança.

Por exemplo: ao detectar um aumento de visitas na página de um site, buscar entender qual é a causa responsável por grande parte desse volume de dados pode ser uma sugestão de análise posterior ao cenário já identificado pelo Anomaly Detection.

A sugestão é que, após o diagnóstico, seja realizada uma análise mais aprofundada em relação aos dados diretamente ligados à essa alteração, sendo em algum escopo de variável específico ou não. Com esse dado diagnóstico, podem ser disponibilizadas as informações sobre os motivos dessa alteração e, caso necessárias, realizadas as mudanças para normalização desse dado.

Para acessar o texto original, clique aqui.

Você recomendaria esse artigo para um amigo?

Nunca

 

Com certeza

 

Deixe seu comentário

0 comentário

Comentários

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Comentando como Anônimo

O projeto E-Commerce Brasil é mantido pelas empresas:

Oferecimento:
Hospedado por: Dialhost Transmissão de Webinars: Recrutamento & Seleção: Dialhost Métricas & Analytics: MetricasBoss

  Assine nossa Newsletter

Fique por dentro de todas as novidades, eventos, cursos, conteúdos exclusivos e muito mais.

Obrigado!

Você está inscrito em nossa Newsletter. Enviaremos, periodicamente, novidades e conteúdos relevantes para o seu negócio.

Não se preocupe, também detestamos spam.