🤖 O que é um AI Agent?
An AI agent é um sistema de IA que usa um large language model como seu motor de raciocínio para perceber autonomamente seu ambiente, planejar ações, usar ferramentas e executar tarefas multi-etapas em direção a um objetivo — sem exigir input humano em cada etapa.
A distinção chave em relação a um chatbot LLM padrão é agency: a capacidade de tomar ações consequentes no mundo. Um chatbot responde perguntas. Um agent reserva voos, escreve e faz deploy de código, envia emails, consulta bases de dados e itera sobre resultados — tudo por conta própria.
📊 Níveis de Autonomia (L0–L5)
Nem todos os "agents" têm o mesmo nível de autonomia. O framework da Anthropic define um espectro desde controle totalmente humano até totalmente autônomo:
| Level | Name | Description | Example |
|---|---|---|---|
| L0 | Sem IA | Software puramente controlado por humanos | Scripts tradicionais, formulários |
| L1 | AI-assisted | IA sugere; humano decide e age | GitHub Copilot autocomplete |
| L2 | AI-driven | IA age; humano revisa antes da execução | IA redige PR; desenvolvedor aprova |
| L3 | Semi-autonomous | IA executa com pontos de verificação HITL seletivos | Agent de codificação executa testes autonomamente, pergunta antes de fazer merge |
| L4 | Autonomous | IA executa de ponta a ponta; humano monitora | Agent implementa um recurso completo sem etapas humanas |
| L5 | Totalmente autônomo | IA autogerencia, autocorrige, autoaperfeiçoa | Apenas em estágio de pesquisa; não implantado em produção |
A maioria dos agents em produção hoje opera em L2–L3. L4 existe em domínios especializados (trading automatizado, pipelines de dados). L5 permanece teórico e levanta questões significativas de alinhamento.
🧩 Componentes Centrais de um AI Agent
Todo agent — independentemente do framework ou provedor — é construído a partir de quatro componentes fundamentais:
1. Percepção (Input)
Como o agent observa seu ambiente. Isso inclui mensagens do usuário, resultados de chamadas de ferramenta, conteúdo de arquivos, respostas de API, dados de sensores e qualquer outra informação inserida na janela de contexto. A qualidade do que o agent pode perceber limita diretamente o que ele pode fazer.
2. Memória
O que o agent pode lembrar e por quanto tempo:
| Tipo de Memória | Scope | Implementation |
|---|---|---|
| In-context | Apenas conversa atual | Mensagens na janela de contexto |
| Externo (curto prazo) | Duração da sessão ou tarefa | Redis, in-memory store, arquivos scratchpad |
| Externo (longo prazo) | Persistente entre sessões | Vector database (RAG), SQL, sistema de arquivos |
| Pesos do modelo | Incorporado no modelo | Dados de treino, fine-tuning |
3. Ferramentas (Ação)
As funções que o agent pode chamar para afetar o mundo. O design das ferramentas é crítico — ferramentas bem definidas com descrições e schemas claros permitem que o LLM as use corretamente. Ferramentas mal projetadas conduzem ao uso indevido e falhas.
- Ler ferramentas: search_web, read_file, query_database, get_weather
- Ferramentas de escrita: write_file, send_email, create_pr, post_message
- Ferramentas de execução: run_code, call_api, deploy_service
- Ferramentas do agent: spawn_subagent, ask_human (HITL), delegate_task
4. Planejamento & Raciocínio
Como o agent decide o que fazer a seguir. Agents modernos usam um ou mais padrões de planejamento:
- ReAct (Reason + Act): Intercalar raciocínio e uso de ferramentas no mesmo contexto
- Chain-of-Thought: Raciocínio explícito passo a passo antes de agir
- Tree-of-Thought: Explorar múltiplos ramos de raciocínio, selecionar o melhor
- Plan-and-Execute: Criar um plano completo antecipadamente, então executar cada etapa
🔁 O Agent Loop
A maioria dos agents opera em um loop perceber-planejar-agir que se repete até a tarefa ser concluída ou uma condição de parada ser atingida:
- Observar: Ler o estado atual (mensagens, resultados de ferramentas, memória)
- Planejar: LLM raciocina sobre o que fazer a seguir (pode gerar um scratchpad ou CoT)
- Agir: Chamar uma ferramenta, gerar saída ou pedir input humano
- Atualizar: Receber resultados de ferramentas, atualizar memória, anexar ao contexto
- Avaliar: Verificar se o objetivo foi alcançado; se não, retornar ao passo 1
Condições de parada são críticas para prevenir loops infinitos. Abordagens comuns incluem: limites máximos de iterações, chamadas explícitas de ferramenta "task complete", e checkpoints human-in-the-loop após N passos.
🛠️ Frameworks & SDKs para Agents
O ecossistema de AI agents amadureceu rapidamente. Aqui estão os principais frameworks em abril de 2026:
| Framework | Language | Melhor para | Suporte de modelo |
|---|---|---|---|
| LangChain / LangGraph | Python, JS | Pipelines multi-etapa complexos, grafos com estado | Qualquer (OpenAI, Anthropic, Ollama…) |
| AutoGen (Microsoft) | Python | Conversas multi-agent, execução de código | OpenAI, Azure, modelos locais |
| CrewAI | Python | Equipes multi-agent baseadas em papéis | OpenAI, Anthropic, local |
| Claude Agent SDK (Anthropic) | Python, TS | Agents nativos Claude com MCP | Claude only |
| OpenAI Agents SDK | Python | Agents nativos OpenAI com handoffs | OpenAI only |
| Semantic Kernel (Microsoft) | Python, C#, Java | Enterprise, arquitetura de plugins | Any |
Para novos projetos, considere começar com uma abordagem leve (chamadas diretas de API + function calling) antes de adotar um framework pesado. Frameworks adicionam conveniência, mas também complexidade e lock-in.
💼 Casos de Uso no Mundo Real
Desenvolvimento de software
- Agents de codificação que leem testes falhando, identificam bugs e submetem PRs (Devin, SWE-agent)
- Agents de revisão de código que verificam vulnerabilidades de segurança e violações de estilo
- Agents de documentação que leem código-fonte e geram docs de API
Pesquisa & análise
- Agents de pesquisa profunda que buscam na web, leem papers e sintetizam relatórios
- Agents de inteligência competitiva que monitoram notícias e geram resumos
- Agents de análise de dados que escrevem e executam SQL/Python e interpretam resultados
Automação de negócios
- Agents de suporte ao cliente que resolvem tickets de ponta a ponta (não apenas redigem respostas)
- Agents de vendas que pesquisam prospects, redigem outreach e agendam chamadas
- Agents financeiros que reconciliam transações e geram relatórios de exceções
Produtividade pessoal
- Agents de email que redigem respostas, agendam reuniões e gerenciam caixa de entrada
- Assistentes de pesquisa que encontram, leem e resumem papers sob demanda
- Automação de fluxo de trabalho que conecta ferramentas díspares sem integrações customizadas
🚫 Quando NÃO usar Agents
Agents são poderosos, mas nem sempre são a ferramenta certa. Usar um agent quando uma solução mais simples existe acrescenta custo, latência e imprevisibilidade.
| Situation | Abordagem melhor |
|---|---|
| Tarefa de etapa única com input/output claro | Chamada direta de API do LLM |
| Transformação determinística de dados | Código tradicional (sem LLM necessário) |
| Ações irreversíveis de alto risco em escala | Fluxo de trabalho humano com assistência de IA (L1–L2) |
| Recursos sensíveis à latência voltados ao usuário | Chamada direta de API; agents adicionam overhead de round-trip |
| Requisitos rígidos de conformidade/auditoria | Humano no loop com agent apenas redigindo |
Aprenda como agents se conectam a ferramentas externas através do Model Context Protocol (MCP), e entenda os risks de segurança de ação autônoma em nosso guia sobre Prompt Injection.