🤖 Qu'est-ce qu'un agent IA ?
An AI agent est un système d'IA qui utilise un large modèle de langage comme moteur de raisonnement pour percevoir son environnement de manière autonome, planifier des actions, utiliser des outils et exécuter des tâches multi‑étapes en vue d'un objectif — sans nécessiter d'intervention humaine à chaque étape.
La distinction clé par rapport à un chatbot LLM standard est agency: la capacité d'entreprendre des actions conséquentes dans le monde. Un chatbot répond aux questions. Un agent réserve des vols, écrit et déploie du code, envoie des e-mails, interroge des bases de données et itère sur les résultats — le tout de manière autonome.
📊 Niveaux d'autonomie (L0–L5)
Tous les « agents » n'ont pas le même degré d'autonomie. Le cadre d'Anthropic définit un spectre allant du contrôle humain total à l'autonomie complète :
| Level | Name | Description | Example |
|---|---|---|---|
| L0 | Pas d'IA | Logiciel entièrement contrôlé par l'humain | Scripts traditionnels, formulaires |
| L1 | AI-assisted | L'IA suggère ; l'humain décide et agit | GitHub Copilot autocomplete |
| L2 | AI-driven | L'IA agit ; l'humain révise avant l'exécution | L'IA rédige la PR ; le développeur approuve |
| L3 | Semi-autonomous | L'IA exécute avec points de contrôle HITL sélectifs | Un agent de codage exécute des tests de manière autonome, demande avant de fusionner |
| L4 | Autonomous | L'IA exécute de bout en bout ; l'humain surveille | L'agent déploie une fonctionnalité complète sans étapes humaines |
| L5 | Entièrement autonome | L'IA s'auto‑dirige, s'auto‑corrige, s'auto‑améliore | Stade de recherche uniquement ; non déployé en production |
La plupart des agents en production aujourd'hui fonctionnent aux niveaux L2–L3. L4 existe dans des domaines spécialisés (trading automatisé, pipelines de données). L5 reste théorique et soulève d'importantes questions d'alignement.
🧩 Composants principaux d'un agent IA
Chaque agent — quel que soit le framework ou le fournisseur — est construit à partir de quatre composants fondamentaux :
1. Perception (Entrée)
Comment l'agent observe son environnement. Cela inclut les messages des utilisateurs, les résultats d'appels d'outils, le contenu des fichiers, les réponses d'API, les données de capteurs et toute autre information fournie dans la fenêtre de contexte. La qualité de ce que l'agent peut percevoir limite directement ce qu'il peut faire.
2. Mémoire
Ce que l'agent peut mémoriser et pendant combien de temps :
| Type de mémoire | Scope | Implementation |
|---|---|---|
| In-context | Conversation courante uniquement | Messages dans la fenêtre de contexte |
| Externe (court terme) | Durée de la session ou de la tâche | Redis, stockage en mémoire, fichiers scratchpad |
| Externe (long terme) | Persistant entre les sessions | Base de vecteurs (RAG), SQL, système de fichiers |
| Poids du modèle | Intégré au modèle | Données d'entraînement, fine-tuning |
3. Outils (Action)
Les fonctions que l'agent peut appeler pour affecter le monde. La conception des outils est critique — des outils bien définis avec des descriptions et des schémas clairs permettent au LLM de les utiliser correctement. Des outils mal conçus mènent à des usages incorrects et à des échecs.
- Outils en lecture : search_web, read_file, query_database, get_weather
- Outils d'écriture : write_file, send_email, create_pr, post_message
- Outils d'exécution : run_code, call_api, deploy_service
- Outils d'agent : spawn_subagent, ask_human (HITL), delegate_task
4. Planification et raisonnement
Comment l'agent décide de la prochaine action. Les agents modernes utilisent un ou plusieurs schémas de planification :
- ReAct (Reason + Act): Intercaler raisonnement et usage d'outils dans le même contexte
- Chain-of-Thought : Raisonnement explicite étape par étape avant d'agir
- Tree-of-Thought : Explorer plusieurs branches de raisonnement, sélectionner la meilleure
- Plan-and-Execute : Créer un plan complet en amont, puis exécuter chaque étape
🔁 La boucle de l'agent
La plupart des agents fonctionnent dans une boucle percevoir‑planifier‑agir qui se répète jusqu'à ce que la tâche soit terminée ou qu'une condition d'arrêt soit atteinte :
- Observer : Lire l'état courant (messages, résultats d'outils, mémoire)
- Planifier : Le LLM raisonne sur la suite à donner (peut générer un scratchpad ou CoT)
- Agir : Appeler un outil, générer une sortie, ou demander une intervention humaine
- Mettre à jour : Recevoir les résultats d'outils, mettre à jour la mémoire, ajouter au contexte
- Évaluer : Vérifier si l'objectif est atteint ; sinon, revenir à l'étape 1
Les conditions d'arrêt sont essentielles pour éviter des boucles infinies. Les approches courantes incluent : limites d'itération max, appels d'outil explicites « task complete », et checkpoints human‑in‑the‑loop après N étapes.
🛠️ Frameworks et SDKs pour agents
L'écosystème des agents IA a rapidement mûri. Voici les principaux frameworks en avril 2026 :
| Framework | Language | Meilleur pour | Support de modèle |
|---|---|---|---|
| LangChain / LangGraph | Python, JS | Pipelines multi‑étapes complexes, graphes avec état | Tout (OpenAI, Anthropic, Ollama…) |
| AutoGen (Microsoft) | Python | Conversations multi‑agents, exécution de code | OpenAI, Azure, modèles locaux |
| CrewAI | Python | Équipes multi‑agents basées sur des rôles | OpenAI, Anthropic, local |
| Claude Agent SDK (Anthropic) | Python, TS | Agents natifs Claude avec MCP | Claude only |
| OpenAI Agents SDK | Python | Agents natifs OpenAI avec handoffs | OpenAI only |
| Semantic Kernel (Microsoft) | Python, C#, Java | Entreprise, architecture plugin | Any |
Pour les nouveaux projets, envisagez de commencer par une approche légère (appels API directs + function calling) avant d'adopter un framework lourd. Les frameworks apportent de la commodité mais aussi de la complexité et du lock‑in.
💼 Cas d'utilisation réels
Développement logiciel
- Agents de codage qui lisent des tests échoués, identifient des bugs et soumettent des PRs (Devin, SWE-agent)
- Agents de revue de code qui vérifient vulnérabilités de sécurité et violations de style
- Agents de documentation qui lisent le code source et génèrent la doc API
Recherche & analyse
- Agents de recherche approfondie qui parcourent le web, lisent des articles et synthétisent des rapports
- Agents d'intelligence économique qui surveillent l'actualité et génèrent des résumés
- Agents d'analyse de données qui écrivent et exécutent SQL/Python et interprètent les résultats
Automatisation business
- Agents de support client qui résolvent des tickets de bout en bout (pas seulement rédiger des réponses)
- Agents commerciaux qui recherchent des prospects, rédigent des messages et planifient des rendez‑vous
- Agents financiers qui rapprochent les transactions et génèrent des rapports d'exception
Productivité personnelle
- Agents e‑mail qui rédigent des réponses, planifient des réunions et gèrent la boîte de réception
- Assistants de recherche qui trouvent, lisent et résument des articles à la demande
- Automatisation des workflows qui connecte des outils disparates sans intégrations personnalisées
🚫 Quand NE PAS utiliser d'agents
Les agents sont puissants mais pas toujours appropriés. Utiliser un agent lorsqu'une solution plus simple existe ajoute coût, latence et imprévisibilité.
| Situation | Approche préférable |
|---|---|
| Tâche mono‑étape avec entrée/sortie claires | Appel API LLM direct |
| Transformation de données déterministe | Code traditionnel (pas d'LLM nécessaire) |
| Actions irréversibles à grande échelle à haut risque | Flux de travail humain avec assistance IA (L1–L2) |
| Fonctionnalités sensibles à la latence côté utilisateur | Appel API direct ; les agents ajoutent des allers‑retours |
| Exigences strictes de conformité/audit | Humain dans la boucle avec simple rédaction par l'agent |
Apprenez comment les agents se connectent aux outils externes via le Model Context Protocol (MCP), et comprenez les risques de sécurité de l'action autonome dans notre guide sur Prompt Injection.