Qu'est-ce qu'un AI agent ? Guide du développeur

Des chatbots simples aux systèmes entièrement autonomes — niveaux d'autonomie, composants principaux (mémoire, outils, planification), frameworks, et quand utiliser des agents

9 min de lecture Mis à jour : avril 2026

🤖 Qu'est-ce qu'un agent IA ?

An AI agent est un système d'IA qui utilise un large modèle de langage comme moteur de raisonnement pour percevoir son environnement de manière autonome, planifier des actions, utiliser des outils et exécuter des tâches multi‑étapes en vue d'un objectif — sans nécessiter d'intervention humaine à chaque étape.

La distinction clé par rapport à un chatbot LLM standard est agency: la capacité d'entreprendre des actions conséquentes dans le monde. Un chatbot répond aux questions. Un agent réserve des vols, écrit et déploie du code, envoie des e-mails, interroge des bases de données et itère sur les résultats — le tout de manière autonome.

💡 Définition simple : LLM + Tools + Memory + Loop = Agent. Remove any of these, and you have something less than an agent. Add planning and multi-agent communication, and you get systems capable of extraordinary complexity.

📊 Niveaux d'autonomie (L0–L5)

Tous les « agents » n'ont pas le même degré d'autonomie. Le cadre d'Anthropic définit un spectre allant du contrôle humain total à l'autonomie complète :

Level Name Description Example
L0 Pas d'IA Logiciel entièrement contrôlé par l'humain Scripts traditionnels, formulaires
L1 AI-assisted L'IA suggère ; l'humain décide et agit GitHub Copilot autocomplete
L2 AI-driven L'IA agit ; l'humain révise avant l'exécution L'IA rédige la PR ; le développeur approuve
L3 Semi-autonomous L'IA exécute avec points de contrôle HITL sélectifs Un agent de codage exécute des tests de manière autonome, demande avant de fusionner
L4 Autonomous L'IA exécute de bout en bout ; l'humain surveille L'agent déploie une fonctionnalité complète sans étapes humaines
L5 Entièrement autonome L'IA s'auto‑dirige, s'auto‑corrige, s'auto‑améliore Stade de recherche uniquement ; non déployé en production

La plupart des agents en production aujourd'hui fonctionnent aux niveaux L2–L3. L4 existe dans des domaines spécialisés (trading automatisé, pipelines de données). L5 reste théorique et soulève d'importantes questions d'alignement.

🧩 Composants principaux d'un agent IA

Chaque agent — quel que soit le framework ou le fournisseur — est construit à partir de quatre composants fondamentaux :

1. Perception (Entrée)

Comment l'agent observe son environnement. Cela inclut les messages des utilisateurs, les résultats d'appels d'outils, le contenu des fichiers, les réponses d'API, les données de capteurs et toute autre information fournie dans la fenêtre de contexte. La qualité de ce que l'agent peut percevoir limite directement ce qu'il peut faire.

2. Mémoire

Ce que l'agent peut mémoriser et pendant combien de temps :

Type de mémoireScopeImplementation
In-context Conversation courante uniquement Messages dans la fenêtre de contexte
Externe (court terme) Durée de la session ou de la tâche Redis, stockage en mémoire, fichiers scratchpad
Externe (long terme) Persistant entre les sessions Base de vecteurs (RAG), SQL, système de fichiers
Poids du modèle Intégré au modèle Données d'entraînement, fine-tuning

3. Outils (Action)

Les fonctions que l'agent peut appeler pour affecter le monde. La conception des outils est critique — des outils bien définis avec des descriptions et des schémas clairs permettent au LLM de les utiliser correctement. Des outils mal conçus mènent à des usages incorrects et à des échecs.

  • Outils en lecture : search_web, read_file, query_database, get_weather
  • Outils d'écriture : write_file, send_email, create_pr, post_message
  • Outils d'exécution : run_code, call_api, deploy_service
  • Outils d'agent : spawn_subagent, ask_human (HITL), delegate_task

4. Planification et raisonnement

Comment l'agent décide de la prochaine action. Les agents modernes utilisent un ou plusieurs schémas de planification :

  • ReAct (Reason + Act): Intercaler raisonnement et usage d'outils dans le même contexte
  • Chain-of-Thought : Raisonnement explicite étape par étape avant d'agir
  • Tree-of-Thought : Explorer plusieurs branches de raisonnement, sélectionner la meilleure
  • Plan-and-Execute : Créer un plan complet en amont, puis exécuter chaque étape

🔁 La boucle de l'agent

La plupart des agents fonctionnent dans une boucle percevoir‑planifier‑agir qui se répète jusqu'à ce que la tâche soit terminée ou qu'une condition d'arrêt soit atteinte :

  1. Observer : Lire l'état courant (messages, résultats d'outils, mémoire)
  2. Planifier : Le LLM raisonne sur la suite à donner (peut générer un scratchpad ou CoT)
  3. Agir : Appeler un outil, générer une sortie, ou demander une intervention humaine
  4. Mettre à jour : Recevoir les résultats d'outils, mettre à jour la mémoire, ajouter au contexte
  5. Évaluer : Vérifier si l'objectif est atteint ; sinon, revenir à l'étape 1

Les conditions d'arrêt sont essentielles pour éviter des boucles infinies. Les approches courantes incluent : limites d'itération max, appels d'outil explicites « task complete », et checkpoints human‑in‑the‑loop après N étapes.

⚠️ Les boucles d'agent sans garde‑fous peuvent tourner indéfiniment et générer des coûts API énormes. Implémentez toujours une limite d'itérations stricte et un budget de tokens pour les agents en production.

🛠️ Frameworks et SDKs pour agents

L'écosystème des agents IA a rapidement mûri. Voici les principaux frameworks en avril 2026 :

Framework Language Meilleur pour Support de modèle
LangChain / LangGraph Python, JS Pipelines multi‑étapes complexes, graphes avec état Tout (OpenAI, Anthropic, Ollama…)
AutoGen (Microsoft) Python Conversations multi‑agents, exécution de code OpenAI, Azure, modèles locaux
CrewAI Python Équipes multi‑agents basées sur des rôles OpenAI, Anthropic, local
Claude Agent SDK (Anthropic) Python, TS Agents natifs Claude avec MCP Claude only
OpenAI Agents SDK Python Agents natifs OpenAI avec handoffs OpenAI only
Semantic Kernel (Microsoft) Python, C#, Java Entreprise, architecture plugin Any

Pour les nouveaux projets, envisagez de commencer par une approche légère (appels API directs + function calling) avant d'adopter un framework lourd. Les frameworks apportent de la commodité mais aussi de la complexité et du lock‑in.

💼 Cas d'utilisation réels

Développement logiciel

  • Agents de codage qui lisent des tests échoués, identifient des bugs et soumettent des PRs (Devin, SWE-agent)
  • Agents de revue de code qui vérifient vulnérabilités de sécurité et violations de style
  • Agents de documentation qui lisent le code source et génèrent la doc API

Recherche & analyse

  • Agents de recherche approfondie qui parcourent le web, lisent des articles et synthétisent des rapports
  • Agents d'intelligence économique qui surveillent l'actualité et génèrent des résumés
  • Agents d'analyse de données qui écrivent et exécutent SQL/Python et interprètent les résultats

Automatisation business

  • Agents de support client qui résolvent des tickets de bout en bout (pas seulement rédiger des réponses)
  • Agents commerciaux qui recherchent des prospects, rédigent des messages et planifient des rendez‑vous
  • Agents financiers qui rapprochent les transactions et génèrent des rapports d'exception

Productivité personnelle

  • Agents e‑mail qui rédigent des réponses, planifient des réunions et gèrent la boîte de réception
  • Assistants de recherche qui trouvent, lisent et résument des articles à la demande
  • Automatisation des workflows qui connecte des outils disparates sans intégrations personnalisées

🚫 Quand NE PAS utiliser d'agents

Les agents sont puissants mais pas toujours appropriés. Utiliser un agent lorsqu'une solution plus simple existe ajoute coût, latence et imprévisibilité.

SituationApproche préférable
Tâche mono‑étape avec entrée/sortie claires Appel API LLM direct
Transformation de données déterministe Code traditionnel (pas d'LLM nécessaire)
Actions irréversibles à grande échelle à haut risque Flux de travail humain avec assistance IA (L1–L2)
Fonctionnalités sensibles à la latence côté utilisateur Appel API direct ; les agents ajoutent des allers‑retours
Exigences strictes de conformité/audit Humain dans la boucle avec simple rédaction par l'agent
💡 Règle générale : Si vous pouvez résoudre le problème avec un prompt bien conçu et un seul appel API, faites‑le. Construisez un agent uniquement lorsque la tâche requiert véritablement plusieurs étapes, sélection dynamique d'outils ou itération basée sur des résultats intermédiaires.

Apprenez comment les agents se connectent aux outils externes via le Model Context Protocol (MCP), et comprenez les risques de sécurité de l'action autonome dans notre guide sur Prompt Injection.