🤖 Che cos'è un AI Agent?
An AI agent è un sistema AI che usa un large language model come motore di ragionamento per percepire autonomamente il suo ambiente, pianificare azioni, usare tool ed eseguire task multi-step verso un obiettivo — senza richiedere input umano ad ogni passo.
La distinzione chiave rispetto a un chatbot LLM standard è agency: la capacità di intraprendere azioni consequenziali nel mondo. Un chatbot risponde alle domande. Un agent prenota voli, scrive e distribuisce codice, invia email, interroga database e itera sui risultati — tutto autonomamente.
📊 Livelli di autonomia (L0–L5)
Non tutti gli "agents" sono ugualmente autonomi. Il framework di Anthropic definisce uno spettro da completamente controllato dall'uomo a completamente autonomo:
| Level | Name | Description | Example |
|---|---|---|---|
| L0 | Nessuna AI | Software completamente controllato dall'uomo | Script tradizionali, form |
| L1 | AI-assisted | L'AI suggerisce; l'umano decide e agisce | GitHub Copilot autocomplete |
| L2 | AI-driven | L'AI agisce; l'umano revisiona prima dell'esecuzione | L'AI redige PR; lo sviluppatore approva |
| L3 | Semi-autonomous | L'AI esegue con checkpoint HITL selettivi | Un coding agent esegue test autonomamente, chiede prima del merge |
| L4 | Autonomous | L'AI esegue end-to-end; l'umano monitora | L'agent distribuisce una funzionalità completa senza passaggi umani |
| L5 | Completamente autonomo | L'AI si autodirige, si autocorregge, si auto-migliora | Solo in fase di ricerca; non distribuito in produzione |
La maggior parte degli agent di produzione oggi opera a L2–L3. L4 esiste in domini specializzati (trading automatizzato, pipeline di dati). L5 rimane teorico e solleva significative questioni di alignment.
🧩 Componenti principali di un AI Agent
Ogni agent — indipendentemente dal framework o provider — è costruito su quattro componenti fondamentali:
1. Percezione (Input)
Come l'agent osserva il suo ambiente. Ciò include messaggi utente, risultati di tool, contenuti di file, API responses, dati da sensori e qualsiasi altra informazione fornita nella context window. La qualità di ciò che l'agent può percepire limita direttamente ciò che può fare.
2. Memoria
Ciò che l'agent può ricordare e per quanto tempo:
| Tipo di memoria | Scope | Implementation |
|---|---|---|
| In-context | Solo conversazione corrente | Messaggi nella context window |
| Esterno (a breve termine) | Durata della sessione o del task | Redis, in-memory store, file scratchpad |
| Esterno (a lungo termine) | Persistente tra le sessioni | Vector database (RAG), SQL, file system |
| Pesi del modello | Integrato nel modello | Dati di training, fine-tuning |
3. Tools (Azione)
Le funzioni che l'agent può chiamare per influenzare il mondo. Il design dei tool è critico — tool ben definiti con descrizioni e schemi chiari permettono all'LLM di usarli correttamente. Tool mal progettati portano a uso scorretto e fallimenti.
- Strumenti di lettura: search_web, read_file, query_database, get_weather
- Tool di scrittura: write_file, send_email, create_pr, post_message
- Tool di esecuzione: run_code, call_api, deploy_service
- Tool per agent: spawn_subagent, ask_human (HITL), delegate_task
4. Pianificazione & Ragionamento
Come l'agent decide cosa fare dopo. Gli agent moderni usano uno o più pattern di pianificazione:
- ReAct (Reason + Act): Interleaving di ragionamento e uso dei tool nello stesso contesto
- Chain-of-Thought: Ragionamento esplicito passo-passo prima di agire
- Tree-of-Thought: Esplorare rami multipli di ragionamento, selezionare il migliore
- Plan-and-Execute: Creare un piano completo in anticipo, poi eseguire ogni passo
🔁 The Agent Loop
La maggior parte degli agent opera in un loop percepisci-pianifica-agisci che si ripete finché il task non è completo o non si raggiunge una condizione di stop:
- Osserva: Leggi lo stato corrente (messaggi, risultati dei tool, memoria)
- Pianifica: LLM ragiona su cosa fare dopo (può generare uno scratchpad o CoT)
- Agisci: Chiama un tool, genera output o chiede input umano
- Aggiorna: Ricevi i risultati dei tool, aggiorna la memoria, aggiungi al contesto
- Valuta: Verifica se l'obiettivo è raggiunto; altrimenti, torna al passo 1
Le condizioni di stop sono critiche per prevenire loop infiniti. Approcci comuni includono: limiti massimi di iterazioni, chiamate esplicite "task complete" agli strumenti e checkpoint human-in-the-loop dopo N passaggi.
🛠️ Framework & SDK per agent
L'ecosistema degli AI agent è maturato rapidamente. Ecco i principali framework a aprile 2026:
| Framework | Language | Ideale per | Supporto modello |
|---|---|---|---|
| LangChain / LangGraph | Python, JS | Pipeline multi-step complesse, grafi stateful | Qualsiasi (OpenAI, Anthropic, Ollama…) |
| AutoGen (Microsoft) | Python | Conversazioni multi-agent, esecuzione di codice | OpenAI, Azure, local models |
| CrewAI | Python | Team multi-agent basati su ruoli | OpenAI, Anthropic, local |
| Claude Agent SDK (Anthropic) | Python, TS | Claude-native agents con MCP | Solo Claude |
| OpenAI Agents SDK | Python | OpenAI-native agents con handoff | Solo OpenAI |
| Semantic Kernel (Microsoft) | Python, C#, Java | Enterprise, architettura a plugin | Any |
Per nuovi progetti, considera di iniziare con un approccio leggero (direct API calls + function calling) prima di adottare un framework pesante. I framework aggiungono convenienza ma anche complessità e lock-in.
💼 Casi d'uso reali
Sviluppo software
- Coding agents che leggono test falliti, identificano bug e inviano PR (Devin, SWE-agent)
- Agent di code review che verificano vulnerabilità di sicurezza e violazioni di stile
- Documentation agents che leggono codice sorgente e generano documentazione API
Ricerca & analisi
- Deep research agents che cercano sul web, leggono paper e sintetizzano report
- Agent di intelligence competitiva che monitorano notizie e generano sommari
- Agent di analisi dati che scrivono ed eseguono SQL/Python e interpretano i risultati
Automazione aziendale
- Agent di customer support che risolvono ticket end-to-end (non solo redigono risposte)
- Agent di sales che ricercano prospect, redigono outreach e pianificano chiamate
- Agent finanziari che riconciliano transazioni e generano report di eccezione
Produttività personale
- Agent email che redigono risposte, pianificano meeting e gestiscono la inbox
- Assistenti di ricerca che trovano, leggono e riassumono paper su richiesta
- Automazione workflow che connette tool disparati senza integrazioni custom
🚫 Quando NON usare gli agent
Gli agent sono potenti ma non sempre lo strumento giusto. Usare un agent quando esiste una soluzione più semplice aggiunge costi, latenza e imprevedibilità.
| Situation | Approccio migliore |
|---|---|
| Task a passo singolo con input/output chiari | Direct LLM API call |
| Trasformazione deterministica dei dati | Codice tradizionale (nessun LLM necessario) |
| Azioni irreversibili ad alto rischio su larga scala | Workflow umano con assistenza AI (L1–L2) |
| Funzionalità user-facing sensibili alla latenza | Direct API call; gli agent aggiungono overhead di round-trip |
| Requisiti normativi/di audit stringenti | Human-in-the-loop con solo drafting da parte dell'agent |
Scopri come gli agent si connettono a tool esterni attraverso il Model Context Protocol (MCP), e comprendi i rischi di sicurezza delle azioni autonome nella nostra guida su Prompt Injection.