Governança de IA não é assunto de TI — e quem descobrir tarde vai pagar caro
A empresa média opera hoje 37 agentes de IA implantados. Mais da metade roda sem log nem supervisão. Apenas 24% das organizações têm visibilidade real de como a IA está sendo usada internamente. A pergunta deixou de ser "como construir um agente?" — virou "quantos já estão rodando aqui dentro sem ninguém saber quem responde por eles?"
Por Eliana Cecilia · Publicado em 17 de junho de 2026 · 14 min de leitura
1. O problema que ninguém está vendo
Quando uma equipe conecta um agente de IA a um processo crítico sem documentação, sem log e sem critério de revisão, ela não está sendo irresponsável por má intenção. Está sendo irresponsável por ausência de estrutura.
É o fenômeno conhecido como shadow AI: o uso de ferramentas de IA fora dos canais oficiais, sem visibilidade da organização, sem controle de dados e sem dono claro. Contas pessoais em plataformas públicas, documentos internos carregados em modelos sem contrato corporativo, automações improvisadas que ninguém documentou.
A shadow AI não nasce de irresponsabilidade individual. Nasce da combinação entre pressão por produtividade, ausência de ferramenta aprovada, falta de orientação clara e lentidão institucional. A empresa não oferece trilhos seguros, as pessoas encontram os próprios caminhos.
A Microsoft reconheceu isso em junho de 2026 ao lançar o Agent 365 com governança em runtime: descoberta de agentes não cadastrados, mapeamento de contexto (em quais máquinas rodam, quais identidades usam, o que acessam) e bloqueio de ações em tempo real. O nome técnico é shadow AI. O nome de negócio é mais preciso: risco que ninguém mediu.
2. Por que isso é decisão de diretoria — e não de TI
Existe uma crença confortável que precisa ser desconstruída: a de que governança de IA é problema de arquitetura técnica, que a TI resolve com as ferramentas certas. Não é.
Quando um modelo de linguagem passa a interpretar documentos, apoiar decisões, orientar fluxos, responder clientes ou acionar sistemas, a empresa deixa de testar uma tecnologia. Ela incorpora uma nova dependência à operação. E essa dependência muda — versões, custos, cotas, políticas de fornecedores, limites de contexto, integrações e o próprio comportamento do modelo ao longo do tempo.
A escolha de um modelo não é decisão de stack. É decisão de arquitetura de negócio, com implicações sobre responsabilidade legal, proteção de dados, continuidade operacional e capacidade de auditoria. As perguntas que importam não são técnicas:
- Se esse agente tomar uma decisão errada, conseguimos explicar o que aconteceu?
- Quem responde formalmente por esse processo automatizado?
- Se o fornecedor mudar os termos amanhã, qual parte da operação para?
- Os dados que enviamos para esse modelo podem sair do nosso perímetro?
- O paciente foi avisado que uma IA está participando da sua consulta?
A última pergunta não é hipotética. Em fevereiro de 2026, o Conselho Federal de Medicina regulou o uso de IA na medicina no Brasil. A resolução exige que cada instituição monte uma comissão de IA e telemedicina, e que o paciente seja informado toda vez que a tecnologia entra na consulta. Nas ferramentas sérias, o registro fica na infraestrutura do hospital — não no servidor do fornecedor.
A parte fácil é o modelo. A parte que cai no colo da diretoria é a comissão, o aviso ao paciente, a custódia dos dados e a responsabilidade formal. Quem tratar isso como assunto de TI vai descobrir tarde que era assunto da diretoria — e do CPF do gestor.
3. O que a maior operação independente de agentes do mundo aprendeu
Em 2026, a Prosus — quinta maior empresa de tecnologia listada na Europa, dona de iFood, Just Eat e Despegar — publicou The Coming Age of AI Colleagues, o que pode ser considerado o primeiro relatório independente em escala sobre IA agentiva corporativa. Feito por quem usa, não por quem vende. Com 40.000 funcionários e 60.000 agentes construídos em 18 meses na plataforma interna Toqan, três lições se destacam. Todos os dados desta seção vêm desse relatório.
Lição 1: 2% dos agentes geram o impacto que importa
A lei de potência clássica se confirma: ~2% dos agentes ativos geram parcela desproporcional do valor. 82% dos agentes de produtividade economizam menos de 20 horas por mês. Um grupo pequeno opera em outra escala — há agentes que equivalem a centenas de FTEs e casos como um agente de marketplace de afiliados projetado em US$ 83 milhões de nova receita anual.
A primeira prioridade não é aumentar o número de agentes. É identificar e dobrar a aposta nos 2% que geram impacto desproporcional. E isso só é possível com governança: sem log, rastreabilidade e critérios de avaliação, a lei de potência existe mas é invisível.
Lição 2: O teste "delete tonight"
Quando ROI é difícil de quantificar, a Prosus usa uma pergunta simples (descrita em The Coming Age of AI Colleagues): "O que aconteceria se deletássemos esse agente esta noite, e sua equipe nunca mais pudesse usá-lo?"
A pergunta força o exercício de imaginar a ausência, não a presença — e ausência é mais fácil de precificar. Quando a resposta é "não sei", o agente pode estar consumindo recursos sem entregar valor mensurável. Quando é "teríamos um problema sério", a organização descobriu uma dependência operacional real — e precisa entender se tem os controles adequados.
Lição 3: O modelo não é o diferencial
Talvez a lição mais contraintuitiva. Com dez modelos disponíveis na Toqan para 40.000 funcionários, a Prosus identificou apenas um salto real de capacidade: a adoção do Claude Sonnet 4. Desde então, retornos decrescentes. A maioria das tarefas agentivas pode ser executada por qualquer modelo de fronteira.
O diferencial competitivo não está em qual modelo a empresa escolhe. Está em como arquiteta a adoção: com que critérios aprova novos usos, como monitora comportamento em produção, como gerencia a relação com fornecedores e como mantém a capacidade de operar quando as variáveis mudam. O diferencial está na governança.
4. Um framework de 4 eixos para começar
Governança de IA não precisa começar com um projeto de seis meses. Precisa começar com clareza sobre as perguntas certas. O framework abaixo organiza as dimensões essenciais em quatro eixos.
Eixo 1: Classificação do uso
- Por capacidade: assistivo, analítico, operacional, decisório ou agêntico — cada nível tem requisitos distintos de supervisão e controle.
- Por impacto: qual o custo de um erro? Reversível ou irreversível? Afeta processo interno, cliente externo ou obrigação regulatória?
- Por sensibilidade dos dados: dados pessoais, estratégicos, jurídicos ou regulados definem quais fornecedores podem ser usados — antes de qualquer avaliação técnica do modelo.
Eixo 2: Arquitetura do sistema
O modelo não é o sistema. Quatro camadas merecem atenção:
- Contexto: instruções de sistema, RAG, bases de conhecimento — versionados, auditáveis, com dono.
- Dados: qualidade, origem e permissões determinam confiabilidade. Dados desatualizados produzem respostas coerentes mas erradas.
- Integrações: cada API conectada adiciona permissões e dependências que precisam ser mapeadas como risco.
- Observabilidade: além de métricas técnicas, acompanhar sinais de negócio — taxa de erro, escalonamento, exceções, impacto sobre o processo.
Eixo 3: Responsabilidade distribuída com accountability central
A cadeia envolve fornecedor, integrador, tecnologia, negócio, jurídico, segurança e usuários. Responsabilidade distribuída sem accountability central é o ambiente onde os problemas ficam sem dono. Antes de qualquer agente ir para produção: quem é o dono do caso de uso, o responsável técnico, o responsável de negócio, quais critérios de escalonamento e quem tem autoridade para suspender.
Eixo 4: Ciclo de vida
- Antes: classificação, avaliação do fornecedor, análise dos dados, homologação com casos reais, definição de responsáveis e desenho da supervisão.
- Durante: monitoramento contínuo (qualidade, custo, exceções, incidentes) e gestão formal de mudanças.
- Após: migração de dados, exclusão de informações no fornecedor, preservação de logs para auditoria — planejados antes da descontinuação, não improvisados.
5. O que separa consumir IA de governar IA
A empresa que consome IA escolhe modelos, testa casos de uso e coloca em produção o que parece funcionar. A empresa que governa IA define que capacidade quer incorporar, classifica o risco de cada uso, estabelece controles proporcionais, monitora o comportamento em produção, gerencia a relação com fornecedores e mantém a capacidade de continuar operando quando as variáveis mudam.
Num ambiente onde o modelo pode mudar, o custo pode flutuar, a cota pode ser revisada e o harness pode quebrar sem aviso — governar IA é a única forma de transformar adoção em capacidade estável.
A diferença competitiva nos próximos anos não vai estar em quem adotou IA primeiro. Vai estar em quem conseguiu operar o que decidiu automatizar, responder pelo que decidiu delegar e sustentar, auditar e corrigir o que colocou em produção. Isso não é questão técnica. É maturidade organizacional.
6. Para começar agora: três perguntas
- Inventário: quantos agentes de IA estão rodando na sua organização hoje? Quem sabe a resposta com precisão?
- Dono: para cada agente relevante em produção, existe um responsável nomeado — alguém que pode ser chamado se o agente tomar uma decisão errada?
- Teste "delete tonight": se desligarmos esse agente esta noite, o que acontece? Se a resposta é "não sei" — ou se ninguém sabe responder — a organização tem uma dependência operacional sem governança equivalente.
Governança de IA não é o freio da inovação. É o que permite que a inovação escale sem acumular risco invisível.
7. Perguntas frequentes
O que é shadow AI?
Uso de ferramentas de IA fora dos canais oficiais, sem visibilidade, sem controle de dados e sem dono claro — contas pessoais, documentos internos em modelos sem contrato corporativo e automações não documentadas.
Por que governança não é só assunto de TI?
Porque adotar IA não é escolher um stack — é incorporar uma dependência à operação, com implicações sobre responsabilidade legal, proteção de dados, continuidade e auditoria.
O que é o teste "delete tonight"?
Pergunta usada pela Prosus para medir valor de agentes: "se deletássemos esse agente esta noite, o que aconteceria?". Força a precificar a ausência e revela dependências invisíveis.
Leitura recomendada
- Ferramentas Práticas para Controle de Custos em IA — o lado FinOps da governança: como observar, medir e otimizar.
- IA Generativa para executivos — casos de uso, ROI e roadmap de 90 dias.
- Custo de tokens em IA — a base econômica para qualquer decisão de adoção.
Fontes
- Prosus — The Coming Age of AI Colleagues (2026). Origem dos dados sobre Toqan, lei de potência dos agentes, teste "delete tonight" e a tese de que o modelo não é o diferencial.
- Microsoft — Anúncio do Agent 365 (junho de 2026): descoberta e governança em runtime para shadow AI.
- Conselho Federal de Medicina (Brasil) — Resolução sobre uso de IA na medicina (fevereiro de 2026).
Compartilhar este artigo
Quer estruturar a governança de IA da sua organização sem travar a inovação?
Conduzo diagnósticos executivos de adoção e governança de IA para conselhos e diretorias — do inventário de agentes ao framework de accountability.
Falar com a Eliana