Para muita gente, IA generativa é igual a ChatGPT. No máximo, envolve ferramentas de imagem como a DALL-E e a Midjourney. E tem sido usada como pouco mais do que um brinquedo sofisticado, uma maneira divertida de obter informações e criar textos, imagens, códigos…
Mas a verdade é bem séria: uma pesquisa recente da McKinsey estudou 63 casos de uso e concluiu que a IA Generativa pode agregar o equivalente a até US$ 4,4 trilhões em benefícios econômicos anuais.

Como sair do domínio da brincadeira para chegar a algo tão sério como multiplicar o valor do seu negócio?
Parece simples: basta que sua empresa tenha os dados devidamente preparados para isso. Entretanto, não é tão simples.
Tanto assim que a mesma pesquisa destaca o fato de que 72% das principais organizações observam que o gerenciamento de dados é um dos principais desafios que os impede de ampliar os casos de uso de IA.
Corroborando essa informação, outra pesquisa, conduzida pela Marketing Charts, ouviu mais de 600 altos executivos responsáveis pelos dados de sua empresa sobre as suas principais prioridades e, no topo, com 52% das respostas, apareceu “melhorar a governança sobre nossos dados e processos de dados”.
Juntamos o estudo da McKinsey à nossa experiência e listamos sete ações que devem ser consideradas pelos líderes das empresas para capacitá-las a escalar suas ambições em relação à IA generativa.
Mas antes vamos explicar melhor essa tecnologia revolucionária.
O alvorecer de uma nova era
A IA generativa envolve aplicações normalmente construídas usando modelos fundacionais, que contêm redes neurais artificiais expansivas inspiradas nos bilhões de neurônios conectados no cérebro humano.
Eles fazem parte do que é chamado de deep learning, ou aprendizagem profunda, um termo que alude às muitas camadas profundas das redes neurais.
Os modelos fundacionais permitiram novos recursos e melhoraram enormemente os existentes em uma ampla gama de modalidades, incluindo imagens, vídeo, áudio e código de computador.
A IA treinada nesses modelos pode executar diversas funções: classificar, editar, resumir, responder a perguntas e redigir novos conteúdos, entre outras tarefas.
Todos os estudos, inclusive esse mais recente da McKinsey e a nossa própria experiência, sugere que a IA generativa está preparada para transformar funções e aumentar o desempenho em funções como vendas e marketing, operações de clientes e desenvolvimento de software.
Esse processo pode desbloquear bilhões de dólares para setores que vão desde o mercado financeiro, passando por varejo, educação, telecom e até as ciências biológicas.
O fato é que ainda estamos no início de uma jornada para compreender o poder, o alcance e as capacidades da IA generativa. O que já aprendemos, entretanto, vamos compartilhar com você, começando com algumas ações relativamente simples, mas imprescindíveis.
Guia simples para deixar os dados preparados e a IA generativa gerar mais valor para seu negócio
1. Deixe que o valor seja o seu guia – é preciso ser claro sobre onde está o valor e quais dados são necessários para fornecê-lo.
Ao determinar uma estratégia de dados para IA generativa, pergunte antes o que a IA generativa pode fazer pelo seu negócio.
O foco no valor é um princípio de longa data, mas devemos confiar nele especialmente para contrabalançar a pressão para “fazer algo” com IA generativa.
Para fornecer esse foco no valor, é preciso desenvolver uma visão clara das implicações dos dados para uma abordagem geral da empresa à IA generativa, que se desenvolverá em três arquétipos:
– Taker: uma empresa que consome serviços preexistentes por meio de interfaces básicas, como APIs. Nesse caso, a governança de dados terá de se concentrar na disponibilização de dados de qualidade para modelos generativos de IA e subsequentemente na validação dos resultados.
– Shaper: uma empresa que acessa modelos e os ajusta com base em seus próprios dados. A governança de dados deverá avaliar como o gerenciamento de dados da empresa precisa evoluir e quais mudanças na arquitetura de dados são necessárias para permitir os resultados desejados.
– Maker: uma empresa que constrói seus próprios modelos fundamentais. A governança de dados terá de desenvolver uma estratégia sofisticada de rotulagem e marcação de dados, bem como fazer investimentos mais significativos.
2. Crie recursos específicos na arquitetura de dados para dar suporte ao mais amplo conjunto de casos de uso.
A grande mudança, quando se trata de dados, é que o escopo de valor ficou muito maior devido à capacidade da IA generativa de trabalhar com dados não estruturados, como chats, vídeos e códigos.
Isso representa uma mudança significativa, porque as organizações de dados tradicionalmente tinham capacidades para trabalhar apenas com dados estruturados, como dados em tabelas. Capturar esse valor não requer uma reconstrução da arquitetura de dados, mas a governança de dados que quiser ir além do arquétipo básico do Taker, precisará se concentrar em duas prioridades claras:
A – A primeira é consertar os fundamentos da arquitetura de dados.
Muitas das vantagens da IA generativa simplesmente não são possíveis sem uma base sólida de dados. Por isso, a governança de dados será melhor atendida identificando as correções que proporcionam o maior benefício para a mais ampla gama de casos de uso, como protocolos de tratamento de dados para informações de identificação pessoal (PII), uma vez que qualquer caso de uso de IA generativa específico do cliente precisará desse recurso.
B – A segunda prioridade é determinar quais atualizações da arquitetura de dados são necessárias para atender aos requisitos de casos de uso de alto valor, gerenciando e dimensionando de maneira econômica as integrações de dados e informações que impulsionam os casos de uso de IA generativa. Caso contrário, existe um risco significativo de sobrecarregar o sistema com atividades massivas de computação de dados, ou de as equipes realizarem integrações pontuais, o que aumenta a complexidade e a dívida técnica.
3. Concentre-se nos pontos-chave do ciclo de vida dos dados para garantir alta qualidade.
Identificar problemas de qualidade de dados é muito mais difícil em modelos generativos de IA do que em modelos clássicos de machine learning porque há muito mais dados, e muitos deles não são estruturados, dificultando o uso das ferramentas de rastreamento existentes.
A governança de dados precisa fazer duas coisas para garantir a qualidade dos dados:
1) Alargar os seus programas de observabilidade de dados para aplicações de IA generativa, como estabelecer limiares mínimos para conteúdo não estruturado a ser incluído em aplicações de IA generativa;
2) Desenvolver intervenções ao longo do ciclo de vida dos dados para corrigir os problemas encontrados pelas equipes, principalmente em quatro áreas:
– Dados de origem, expandindo o quadro de qualidade para incluir medidas relevantes, como preconceitos, metadados e rótulos de alta qualidade para dados estruturados e não estruturados e regulação do acesso a dados confidenciais.
– Pré-processamento, garantindo consistência e padronização, automatizando o gerenciamento de dados PII e estabelecendo diretrizes sobre se os dados devem ser ignorados, retidos, redigidos, colocados em quarentena, removidos, mascarados ou sintetizados.
– Qualidade dos prompts, incluindo metadados de alta qualidade e transparência de linhagem para dados estruturados e não estruturados.
– Resultados do modelo, estabelecendo os procedimentos de governança necessários para identificar e resolver resultados incorretos e usar “humanos no circuito” para rever e fazer a triagem de problemas de resultados, entre outras medidas.
4. Proteja seus dados confidenciais e esteja pronto para agir rapidamente conforme surgirem regulamentações.
Segundo a pesquisa da McKinsey, aproximadamente 71% dos líderes seniores de TI acreditam que a tecnologia de IA generativa introduz novos riscos de segurança aos seus dados. Por isso, a governança de dados precisa considerar as implicações dos dados em três áreas específicas:
– Identificar e priorizar riscos de segurança para os dados proprietários da empresa. Por exemplo, adicionando lembretes pop-up sempre que um engenheiro deseja compartilhar dados com um modelo ou executando scripts automatizados para garantir a conformidade.
– Gerenciar o acesso aos dados PII. É preciso configurar sistemas que incorporem ferramentas de proteção e intervenções humanas para garantir que os dados PII sejam removidos durante o pré-processamento de dados e antes de serem usados em um LLM. Usar dados sintéticos (por meio de fabricantes de dados) e identificadores não confidenciais pode ajudar.
– Acompanhar de perto o aumento esperado de regulamentações. A governança de dados deve permanecer próxima dos líderes de risco da empresa para compreenderem as novas regulamentações e as suas implicações para a estratégia de dados, tais como a necessidade de “desqualificar” modelos que utilizam dados regulamentados.
5. Desenvolva talentos em engenharia de dados.
As empresas precisam de pessoas que possam integrar conjuntos de dados (como escrever APIs conectando modelos a fontes de dados), sequenciar e encadear prompts, organizar grandes quantidades de dados e trabalhar com parâmetros de modelo.
Isso significa que a governança de dados deve concentrar-se mais em encontrar engenheiros de dados, arquitetos e engenheiros de back-end, e menos na contratação de cientistas de dados, cujas competências serão cada vez menos críticas à medida que a IA generativa permite que pessoas com capacidades técnicas menos avançadas utilizem linguagem natural ao fazer análise básica.
6. Use a IA generativa para ajudá-lo a gerenciar seus próprios dados.
A governança de dados tem uma enorme oportunidade de aproveitar a IA generativa para melhorar a sua própria função. Muitos fornecedores já estão lançando produtos, mas uma regra prática é que, para processos de governança de dados exclusivos do negócio, é melhor construir sua própria ferramenta.
Observe que muitas ferramentas e capacidades são novas e podem funcionar bem em ambientes experimentais, mas não em escala.
7. Acompanhe com rigor e intervenha rapidamente.
Existem hoje mais incógnitas do que esclarecimentos no mundo da IA generativa, e as empresas ainda estão aprendendo o caminho a seguir. É, portanto, crucial que a governança de dados estabeleça sistemas para acompanhar e gerir ativamente o progresso das suas iniciativas de IA generativa, e para compreender o desempenho dos dados no apoio aos objetivos do negócio.
Na prática, as métricas eficazes são compostas por um conjunto de KPIs principais e KPIs operacionais (as atividades subjacentes que impulsionam os KPIs), que ajudam os líderes a acompanhar o progresso e a identificar as causas raízes dos problemas:
– custo de componentes adicionais, como bancos de dados vetoriais e consumo de LLMs como serviço
– receita adicional que é possibilitada pela integração de fontes de dados específicas com fluxos de trabalho generativos de aplicativos de IA
– tempo de lançamento no mercado para desenvolver um aplicativo generativo baseado em IA que requer acesso a dados internos
– satisfação do usuário final com a forma como os dados melhoraram o desempenho e a qualidade do aplicativo
Os KPIs operacionais devem incluir o rastreamento de quais dados estão sendo mais usados, o desempenho dos modelos, onde a qualidade dos dados é ruim, quantas solicitações estão sendo feitas em um determinado conjunto de dados e quais casos de uso estão gerando mais atividade e valor.
Conclusão
Quando falamos em IA generativa, as empresas não podem se dar ao luxo de esperar para refletir e agir sobre os seus dados, pois eles são o combustível principal que impulsiona a capacidade de uma empresa de capturar valor com essa tecnologia.
Mas as empresas que desejam esse valor não podem se preocupar apenas em gerar dados; elas precisam de uma governança que entenda como usar os dados para liderar os negócios. Ou, como temos defendido, de uma cogovernança de dados capaz de preencher as lacunas que surgirem.
Se você ficou com alguma dúvida, teremos o maior prazer em descomplicar esse tema cada vez mais fundamental para o futuro das empresas. Envie e-mail para elcio@aodigital.com.br, e vamos marcar uma conversa.