O erro mais comum ao construir um Agente de IA não é escolher o modelo ou o canal errado. É colocar tudo no mesmo lugar.
Acontece sempre: alguém monta um Agente de IA para atendimento ao cliente, e começa a colocar no prompt principal as políticas de devolução, o catálogo de produtos, os fluxos de cobrança, o manual de tom, os casos de escalonamento, a lista de integrações com o ERP, as perguntas frequentes históricas e três versões distintas de como cumprimentar de acordo com o canal. O prompt termina com 8.000 palavras. O Agente fica lento, confunde contextos, responde com informações que não correspondem ao caso, e custa o dobro em tokens.
A solução não é "escrever melhor o prompt". É entender que um Agente de IA profissional tem três camadas de conhecimento bem diferenciadas, e cada tipo de informação vive em uma camada distinta.
Este guia explica quais são essas três camadas, o que vai em cada uma, e como mapeá-las para as ferramentas reais que você usa no construtor de bots. No final, você poderá olhar para qualquer bloco de instruções e dizer com segurança: "isso vai aqui".
Sumário
- Por que um Agente de IA não é uma enciclopédia
- Camada 1: o prompt oculto — o que o Agente sempre sabe
- Camada 2: a base de conhecimento — o que o Agente consulta quando necessário
- Camada 3: as interações específicas — o que o Agente carrega apenas em contexto
- Como decidir em qual camada cada coisa vai
- Erros comuns ao estruturar o conhecimento
- Perguntas frequentes
Por que um Agente de IA não é uma enciclopédia
Imagine que você contrata alguém novo para atendimento ao cliente. Como você o treina?
Você não joga o manual completo de 500 páginas em cima dele no primeiro dia. Nem deixa todos os procedimentos impressos sobre a mesa para que ele os leia em voz alta em cada chamada. O que você faz é outra coisa:
- Você ensina as regras básicas de sempre: como cumprimentar, o tom da marca, o que pode e o que não pode prometer, a quem escalar se ficar sem resposta. Pouco texto, alto impacto. É o seu manual de integração, curto e memorável.
- Você mostra onde procurar quando ele precisa de informações específicas: a wiki interna, o manual do produto, o tarifário atualizado. Ele não memoriza, sabe que existe e o consulta quando surge uma pergunta concreta.
- Você explica procedimentos específicos quando o caso surge: se um cliente pede uma devolução, nesse dia você conta os 12 passos do fluxo de devolução. Você não carrega os procedimentos de devolução, troca, cancelamento, reclamação e novo cadastro todos juntos antes de começar a atender.
Um Agente de IA profissional funciona da mesma forma. Ele tem três camadas de conhecimento que cumprem essas três funções distintas. O que muda em relação a um funcionário humano é que em um Agente de AI mal estruturado, a camada 1 acaba cheia de informações que deveria estar na camada 2 ou 3. E aí começa o desastre.
Camada 1: o prompt oculto — o que o Agente sempre sabe
O prompt oculto é o conjunto de instruções que o Agente de AI recebe em cada conversa, antes de ver a mensagem do cliente. É carregado sempre, consome tokens a cada turno, e define o escopo dentro do qual o Agente vai operar.
Por isso, o que você colocar aqui precisa cumprir duas condições:
- Aplica-se a todas as conversas. Se algo se aplica apenas a um fluxo específico, não vai aqui.
- É compacto e estável. Se muda com frequência, não vai aqui (obriga você a redeployar).
O que vai no prompt oculto
- Identidade do Agente: quem é, para quem trabalha, qual é o seu papel. "Você é o assistente virtual de [empresa], uma [indústria] em [país]."
- Tom e linguagem: formal, informal, com tratamento informal, com "você", neutro. Palavras proibidas. Emojis sim ou não.
- Regras rígidas de negócio: "nunca prometa datas exatas de entrega", "não revele preços de produtos sem confirmar disponibilidade", "se o cliente pedir para falar com um humano, transfira sem perguntar".
- Critérios de escalonamento: quando transferir para um humano, para qual equipe, com qual contexto.
- Formato de resposta padrão: mensagens curtas, uso de marcadores, uso de emojis, se aplicável.
O que NÃO vai no prompt oculto
- Catálogos completos de produtos.
- Políticas extensas (privacidade, devoluções, termos legais).
- Procedimentos passo a passo que se aplicam apenas a casos específicos.
- Listas de preços variáveis.
- FAQs longas.
Regra prática: se o seu prompt oculto ultrapassar 1.000 palavras, algo está errado
Um prompt oculto bem pensado para atendimento ao cliente não deveria ultrapassar 500 a 800 palavras. Se o seu tem 3.000, quase certamente você está misturando camada 1 com camada 2 e camada 3. O modelo se distrai, a qualidade cai e o custo sobe.
Em AsisteGPT, o prompt oculto é configurado por bot e é editável pela interface. Você não precisa tocar em código.
Camada 2: a base de conhecimento — o que o Agente consulta quando necessário
A base de conhecimento é o conjunto de documentos, políticas, manuais, catálogos e FAQs que o Agente pode consultar sob demanda. A diferença chave com a camada 1 é que isso não é carregado em cada conversa. O Agente consulta a base de conhecimento somente quando detecta que precisa de informações de lá para responder.
A tecnologia que torna isso possível se chama RAG (Retrieval-Augmented Generation, ou "geração aumentada por recuperação"). Na prática, funciona assim:
- Você envia seus documentos para a base de conhecimento do Agente.
- A plataforma os divide em fragmentos e os indexa com busca semântica.
- Quando o cliente pergunta algo, o Agente busca fragmentos relevantes e os usa para construir a resposta.
- Opcionalmente, o Agente pode citar de onde obteve a informação.
O que vai na base de conhecimento
- Políticas completas: devoluções, trocas, garantias, privacidade, termos e condições.
- Catálogos de produtos ou serviços: fichas técnicas, preços, especificações.
- Manuais e guias de uso do produto.
- FAQs extensas: as 200 perguntas mais comuns com suas respostas oficiais.
- Conteúdo do site: as páginas chave que descrevem o que você faz e como.
- Registros de conversas anteriores que a plataforma usa como referência para responder como um humano capacitado.
O que NÃO vai na base de conhecimento
- Procedimentos estritos passo a passo (vão na camada 3). Se um cliente pede para iniciar uma devolução, você não quer que o Agente procure entre fragmentos soltos do manual — você quer que ele siga o procedimento exato, em ordem.
- Regras de negócio rígidas (vão na camada 1). "Nunca prometa datas" não pode depender de o Agente encontrar o fragmento correto; ele tem que saber isso sempre.
- Documentos desatualizados ou contraditórios. Se você envia dois PDFs que dizem coisas diferentes sobre o mesmo tema, o Agente vai citar o que encontrar primeiro e a qualidade da resposta se torna imprevisível.
Regra prática: curar importa mais que volume
Três manuais atualizados e limpos rendem mais que 100 PDFs velhos, mal escaneados e com informação sobreposta. A base de conhecimento é um ativo que se mantém, não um depósito onde se joga o que sobra.
Camada 3: as interações específicas — o que o Agente carrega apenas em contexto
Aqui está a camada mais subestimada — e a que faz a diferença entre um Agente de IA amador e um profissional.
Há um tipo de conhecimento que não é genérico (não vai na camada 1) nem pesquisável (não vai na camada 2): são procedimentos específicos que só fazem sentido quando aparece um caso pontual.
Exemplos:
- O fluxo de devolução de um produto: 12 passos estritos em ordem, com perguntas obrigatórias, validações e bifurcações.
- O processo de cobrança para um atraso de 30 dias: tom específico, opções de plano de pagamento, escalonamento para a área legal se não houver acordo.
- O agendamento de uma consulta médica: perguntar convênio, especialidade, unidade, oferecer horários disponíveis, confirmar dados, gerar lembrete.
- O procedimento de reclamação formal: registrar número de caso, gerar ticket, atribuir à equipe, oferecer prazo de resposta.
Se você coloca os 4 procedimentos no prompt oculto, o prompt cresce para 5.000 palavras e o Agente se perde. Se você os deixa na base de conhecimento, o Agente os consulta de forma incompleta (RAG funciona mal com instruções em ordem, porque parte o documento em chunks e mistura passos).
A solução correta é carregar o procedimento completo apenas quando o caso aparece. E a ferramenta para fazer isso é a IA Tool.
Como isso é implementado na prática: IA Tools
No módulo AsisteGPT, além do prompt oculto e da base de conhecimento, o Agente de IA pode ter IA Tools: capacidades que o próprio Agente decide invocar quando detecta que o caso o merece.
Uma IA Tool não é um nó de fluxo rígido. É uma ação que o Agente sabe que existe (porque a vê listada com sua descrição) e que executa quando o contexto da conversa a justifica. Quando a executa, a tool responde com um bloco de texto que é injetado como contexto, e o Agente redige a resposta ao cliente usando essa informação.
Há duas formas de usar IA Tools para resolver a camada 3:
Opção A: IA Tool mono-skill (a mais simples)
Uma tool por procedimento. Exemplos:
- Tool "iniciar_devolucion" → quando o Agente detecta que o cliente quer devolver algo, invoca esta tool. A tool responde com os 12 passos do procedimento de devolução. O Agente segue esses passos na conversa.
- Tool "consultar_plan_pago" → quando o cliente pede opções de pagamento, a tool devolve os trechos disponíveis, critérios e scripts sugeridos.
- Tool "agendar_turno" → quando o cliente quer um agendamento, a tool devolve o procedimento de captura de dados e a consulta à agenda.
Vantagem: simples, claro, cada tool faz uma coisa. O Agente decide quando usar cada uma pela sua descrição.
Desvantagem: se você tiver muitos procedimentos, a lista de tools fica cheia e o contexto base cresce (mesmo que aos poucos, cada descrição ocupa espaço).
Opção B: IA Tool dispatcher (uma única tool com parâmetro classificador)
Uma única tool, por exemplo "cargar_procedimiento", que recebe um parâmetro tipo Bot Pergunta que classifica qual procedimento trazer. O parâmetro tem um enum com as opções disponíveis ("devolucion", "cambio", "cobranza", "cancelacion", "alta_nueva", etc.).
Quando o Agente detecta um caso que requer um procedimento específico, invoca a tool com o valor correto do parâmetro, a tool responde com o prompt do procedimento correspondente, e o Agente segue esse procedimento.
Vantagem: escala para muitos procedimentos sem encher a lista de tools. Uma única tool, muitos destinos.
Desvantagem: requer pensar bem no parâmetro classificador e no seu enum. Se as opções não estiverem bem definidas, o Agente pode invocar com o valor equivocado.
Qual escolher
- Até 5 procedimentos: mono-skill. É mais transparente e mais fácil de iterar.
- Mais de 5 procedimentos: dispatcher com parâmetro classificador. Escala melhor.
- Misto: você pode ter algumas tools mono-skill para os procedimentos mais críticos (onde você quer controle fino de quando são ativadas) e uma tool dispatcher para o resto.
O que vai nas interações específicas (seja mono-skill ou dispatcher)
- Fluxos operacionais longos com passos em ordem estrita.
- Procedimentos com perguntas obrigatórias e validações.
- Fluxos com ramificações condicionais ("se o valor for maior que X, ofereça plano de pagamento; se não, solicite pagamento único").
- Processos que requerem chamadas a APIs externas (ERP, CRM, agenda) como parte do fluxo — neste caso, a tool pode, além de devolver texto, disparar a chamada API.
- Conhecimento denso que só faz sentido em um contexto específico.
Regra prática: um procedimento = uma tool (ou uma opção do dispatcher)
Se algo pode ser descrito como "quando o cliente pede X, faço Y, Z, W em ordem", é candidato à camada 3. Não o coloque no prompt oculto. Crie uma IA Tool (mono-skill ou dispatcher) para esse caso.
Como decidir em qual camada cada coisa vai
Quando tiver uma instrução ou um conteúdo e não souber onde colocá-lo, aplique esta árvore de decisão:
| Pergunta | Se a resposta for... | Vai em... |
|---|---|---|
| Aplica em todas as conversas? | Sim | Camada 1 (prompt oculto) |
| É uma regra curta e imutável? | Sim | Camada 1 (prompt oculto) |
| É um documento, catálogo, política ou FAQ extensa? | Sim | Camada 2 (base de conhecimento) |
| O Agente precisa buscar o fragmento relevante? | Sim | Camada 2 (base de conhecimento) |
| É um procedimento passo a passo com ordem estrita? | Sim | Camada 3 (IA Tool) |
| Só aplica quando o cliente expressa uma intenção concreta? | Sim | Camada 3 (IA Tool) |
| Requer chamadas a APIs externas durante o fluxo? | Sim | Camada 3 (IA Tool) |
Exemplos práticos
Caso 1: "Nosso horário de atendimento é das 9h às 18h de segunda a sexta-feira."
→ Camada 1. É uma informação curta, imutável, aplica-se sempre. O prompt oculto pode mencioná-la para que o Agente responda imediatamente sem consultar nada.
Caso 2: "Temos 340 produtos no catálogo com seus preços e estoque."
→ Camada 2. É um volume alto, o Agente só consulta quando o cliente pergunta por um produto específico.
Caso 3: "O processo para cancelar uma assinatura tem 8 passos obrigatórios e requer validar a identidade do titular."
→ Camada 3. É um procedimento estrito, só se aplica quando o cliente expressa a intenção de cancelar.
Caso 4: "Nossa política de devolução permite 30 dias a partir da compra se o produto não estiver aberto."
→ Camada 2. É parte da política, o Agente a consulta quando o cliente pergunta sobre devoluções. Se o cliente, além disso, quiser iniciar uma devolução, isso dispara um fluxo de camada 3.
Caso 5: "Nunca ofereça descontos por iniciativa própria."
→ Camada 1. É uma regra rígida de negócio, aplica-se sempre.
Erros comuns ao estruturar o conhecimento
Erro 1: colocar o catálogo completo no prompt oculto
O caso típico: um e-commerce com 500 produtos carrega tudo no prompt geral "para que o bot saiba". Resultado: tokens inflados, respostas mais lentas, e o Agente se confunde porque não distingue entre o produto que perguntam e os 499 que não. Onde vai: camada 2. Envie o catálogo como documento estruturado para a base de conhecimento.
Erro 2: escrever cada procedimento dentro do prompt oculto
Exemplo: "Se o cliente pedir devolução, pergunte o número do pedido, valide a data, ofereça nota de crédito ou reembolso...". Se você tiver 10 procedimentos assim, seu prompt oculto explode. Onde vai: camada 3. Cada procedimento é sua própria IA Tool (mono-skill) ou uma opção de uma tool dispatcher.
Erro 3: enviar qualquer PDF para a base de conhecimento sem curar
Manuais escaneados com OCR ruim, documentos duplicados, versões antigas que contradizem as novas. O Agente cita o que encontra primeiro e a qualidade das respostas se torna imprevisível. Como corrigir: cure a base como se fosse um manual público. Menos quantidade, mais qualidade.
Erro 4: descrições de IA Tool vagas
Você cria uma tool de devolução perfeita, mas sua descrição diz "gerencia devoluções". O cliente escreve "quero devolver o celular" e o Agente não a invoca porque não ficou claro para ele quando fazê-lo. Como corrigir: a descrição de cada IA Tool deve explicar com precisão quando deve ser invocado, com exemplos. Ex: "Invocar quando o cliente pede para devolver, retornar, reembolsar ou trocar um produto comprado. Palavras-chave típicas: devolução, reembolso, não me serviu, quero trocar". Se você usa um dispatcher, aplica o mesmo ao parâmetro classificador.
Erro 5: misturar tom entre camadas
O prompt oculto diz "tom formal com tuteio", mas a base de conhecimento tem documentos escritos em "você". O Agente copia o tom do documento que cita e soa inconsistente. Como corrigir: o tom é responsabilidade da camada 1 e deve sobrescrever o que vem da camada 2. Instrua explicitamente o Agente: "Responda sempre em tuteio, mesmo que os documentos de referência usem você".
Erro 6: não auditar o prompt depois de adicionar funcionalidades
Cada vez que um novo caso é adicionado, alguém adiciona uma linha ao prompt geral. Após seis meses, o prompt tem 40 regras que se contradizem. Como corrigir: revisão trimestral do prompt oculto. Mover para a camada 2 ou 3 tudo o que não for imprescindível, e ir descontinuando regras obsoletas.
Perguntas frequentes
Quanto deve medir meu prompt oculto?
Entre 200 e 800 palavras é saudável para a maioria dos casos de atendimento ao cliente. Se passar de 1.000, é sinal de que há coisas que deveriam estar na camada 2 ou camada 3. Mais longo não é melhor: o modelo distribui atenção sobre tudo o que lê, e um prompt inflado dilui as regras importantes.
Quais documentos convém subir para a base de conhecimento?
Prioridade alta: políticas oficiais, manuais de produto atualizados, FAQs extensas, fichas técnicas, conteúdo do site. Prioridade baixa: apresentações comerciais, documentos internos sem formato público, contratos (a menos que seja um Agente legal). Regra geral: apenas suba o que você daria a um cliente novo para que ele entenda como você trabalha.
Quando crio uma IA Tool em vez de adicioná-lo ao prompt oculto?
Quando cumpre duas condições: (1) tem mais de 4 ou 5 passos em ordem, e (2) só se aplica quando o cliente expressa uma intenção pontual. Se cumprir apenas uma, revise: se for curto e sempre se aplicar, vai na camada 1. Se for longo, mas consultável por fragmentos, vai na camada 2. Se for longo e for ativado por contexto da conversa, é camada 3.
Como sei se meu Agente de IA está mal estruturado?
Quatro sinais: (1) o prompt oculto ultrapassa as 1.500 palavras, (2) as respostas demoram mais do que o esperado, (3) o Agente mistura contextos (responde sobre devoluções quando perguntam sobre horários), (4) o custo por conversa é mais alto do que o projetado. Se você vir dois ou mais desses sinais, é momento de redistribuir o conhecimento entre as três camadas.
Posso mover conhecimento de uma camada para outra depois?
Sim, e você deveria fazer isso toda vez que o Agente cresce. O típico: você começa com tudo na camada 1 porque é rápido de iterar. Quando você passa de certo tamanho, migra os documentos para a camada 2 e os procedimentos longos para a camada 3 como IA Tools. Não é refactor, é maturidade do produto. O prompt oculto deveria diminuir com o tempo, não crescer.
Como o Agente decide quando invocar uma IA Tool?
A partir da descrição que você colocar em cada tool (ou a cada opção do parâmetro dispatcher) e do contexto da conversa. É o próprio Agente que decide, em tempo real, se o caso merece invocar a tool. Por isso a descrição é crítica: tem que descrever com precisão quando deve ser usada. Um bom formato: "Invocar quando [situação específica]. Palavras-chave: [lista]. Exemplos: [2-3 frases típicas do cliente]".
Conclusão
Um Agente de IA não é um cérebro ao qual você joga informações até que ele aprenda. É um sistema com camadas bem diferenciadas, e o bot builder que entende isso constrói Agentes que escalam. Quem não entende isso constrói prompts gigantes que ninguém consegue manter.
A regra simples: prompt oculto para o que sempre se aplica, base de conhecimento para o que é consultado, IA Tools para o que é ativado por contexto. Se seu Agente respeitar essa separação, você poderá continuar adicionando funcionalidade sem que cada nova regra quebre as anteriores.
Se você quiser medir o impacto de estruturar bem seu Agente, preparamos um guia para calcular o ROI de um chatbot com números reais. E se você está montando um Agente de IA do zero ou quer levar o seu para o próximo nível, você pode ver como o prompt oculto, a base de conhecimento e as IA Tools são configurados no módulo AsisteGPT.
Continue lendo
- Prompt engineering para chatbots: 7 técnicas para que seu bot de IA responda como um especialista — para aprofundar em como escrever melhor a Camada 1
- Como medir o ROI de um chatbot (com a fórmula usada pelas empresas que renovam) — para quantificar o impacto de um Agente bem estruturado
- GPT-5.4 mini vs nano vs default: como escolher o modelo para seu Agente de IA — para combinar as 3 camadas com o modelo adequado