🤖 AI 에이전트란 무엇인가?
An AI 에이전트 는 대형 언어 모델을 추론 엔진으로 사용하여 환경을 자율적으로 인지하고, 행동을 계획하고, 도구를 사용하며, 인간의 각 단계 입력 없이 목표를 향해 다단계 작업을 실행하는 AI 시스템입니다.
표준 LLM 챗봇과의 핵심 차이점은 agency: 세상에서 결과적인 행동을 취할 수 있는 능력입니다. 챗봇은 질문에 답합니다. 에이전트는 항공편을 예약하고, 코드를 작성하고 배포하며, 이메일을 보내고, 데이터베이스를 조회하고, 결과를 반복적으로 처리합니다 — 모든 것이 인간의 각 단계 개입 없이 수행됩니다.
📊 자율성 수준 (L0–L5)
모든 "에이전트"가 동일한 수준의 자율성을 가지는 것은 아닙니다. Anthropic의 프레임워크는 완전한 인간 통제에서 완전한 자율성까지 스펙트럼을 정의합니다:
| Level | Name | Description | Example |
|---|---|---|---|
| L0 | AI 없음 | 완전한 인간 통제 소프트웨어 | 전통적인 스크립트, 양식 |
| L1 | AI-assisted | AI가 제안하고; 사람이 결정하고 실행함 | GitHub Copilot 자동완성 |
| L2 | AI-driven | AI가 행동하고; 사람이 실행 전에 검토함 | AI가 PR 초안을 작성하고; 개발자가 승인함 |
| L3 | Semi-autonomous | AI가 선택적 HITL 체크포인트와 함께 실행함 | 코딩 에이전트가 자율적으로 테스트를 실행하고, 병합 전에 묻음 |
| L4 | Autonomous | AI가 엔드투엔드로 실행함; 사람이 모니터링함 | 에이전트가 인간의 단계 없이 전체 기능을 배포함 |
| L5 | 완전 자율 | AI가 스스로 지시하고, 스스로 수정하며, 스스로 개선함 | 연구 단계에만 해당; 생산 환경에는 배포되지 않음 |
오늘날 대부분의 생산 에이전트는 L2–L3 수준에서 운영됩니다. L4는 특수 영역(자동화된 거래, 데이터 파이프라인)에서 존재합니다. L5는 이론적이며 중요한 정렬 문제를 제기합니다.
🧩 AI 에이전트의 핵심 구성 요소
모든 에이전트는 — 프레임워크나 제공업체에 관계없이 — 네 가지 기본 구성 요소로 구축됩니다:
1. 지각(입력)
에이전트가 환경을 관찰하는 방식입니다. 여기에는 사용자 메시지, 도구 호출 결과, 파일 내용, API 응답, 센서 데이터 및 컨텍스트 창에 제공되는 기타 모든 정보가 포함됩니다. 에이전트가 인지할 수 있는 정보의 품질이 수행할 수 있는 작업을 직접 제한합니다.
2. 메모리
에이전트가 무엇을 기억할 수 있으며 얼마나 오래 기억하는가:
| 메모리 유형 | Scope | Implementation |
|---|---|---|
| In-context | 현재 대화만 | 컨텍스트 창의 메시지 |
| 외부(단기) | 세션 또는 작업 지속 시간 | Redis, 인메모리 저장소, 스크래치패드 파일 |
| 외부(장기) | 세션 간 지속 | 벡터 데이터베이스(RAG), SQL, 파일 시스템 |
| 모델 가중치 | 모델에 내장됨 | 학습 데이터, 미세조정 |
3. 도구(행동)
에이전트가 세상에 영향을 주기 위해 호출할 수 있는 함수들입니다. 도구 설계는 매우 중요합니다 — 명확한 설명과 스키마를 가진 잘 정의된 도구는 LLM이 올바르게 사용하도록 합니다. 잘못 설계된 도구는 오용과 실패를 초래합니다.
- 읽기 도구: search_web, read_file, query_database, get_weather
- 쓰기 도구: write_file, send_email, create_pr, post_message
- 실행 도구: run_code, call_api, deploy_service
- 에이전트 도구: spawn_subagent, ask_human (HITL), delegate_task
4. 계획 및 추론
에이전트가 다음에 무엇을 할지 결정하는 방식입니다. 현대의 에이전트는 하나 이상의 계획 패턴을 사용합니다:
- ReAct (Reason + Act): 동일 컨텍스트에서 추론과 도구 사용을 교차 수행
- 체인 오브 솟(Chain-of-Thought): 행동하기 전에 명시적인 단계별 추론
- 트리 오브 솟(Tree-of-Thought): 여러 추론 가지를 탐색하고 최적을 선택
- 계획 및 실행(Plan-and-Execute): 사전에 전체 계획을 작성한 다음 각 단계를 실행
🔁 에이전트 루프
대부분의 에이전트는 작업이 완료되거나 정지 조건이 충족될 때까지 반복되는 지각-계획-행동 루프에서 운영됩니다:
- 관찰: 현재 상태(메시지, 도구 결과, 메모리)를 읽음
- 계획: LLM이 다음에 할 일을 추론함(스크래치패드나 CoT를 생성할 수 있음)
- 행동: 도구를 호출하거나, 출력을 생성하거나, 인간 입력을 요청함
- 업데이트: 도구 결과를 수신하고, 메모리를 업데이트하며, 컨텍스트에 추가함
- 평가: 목표가 달성되었는지 확인; 그렇지 않으면 1단계로 돌아감
무한 루프를 방지하려면 정지 조건이 중요합니다. 일반적인 접근 방식에는 최대 반복 제한, 명시적인 "작업 완료" 도구 호출, N단계 후 인간 개입 체크포인트가 포함됩니다.
🛠️ 에이전트 프레임워크 및 SDK
AI 에이전트 생태계는 빠르게 성숙했습니다. 다음은 2026년 4월 기준 주요 프레임워크입니다:
| Framework | Language | 권장 대상 | 모델 지원 |
|---|---|---|---|
| LangChain / LangGraph | Python, JS | 복잡한 다단계 파이프라인, 상태 그래프 | Any (OpenAI, Anthropic, Ollama…) |
| AutoGen (Microsoft) | Python | 다중 에이전트 대화, 코드 실행 | OpenAI, Azure, 로컬 모델 |
| CrewAI | Python | 역할 기반 다중 에이전트 팀 | OpenAI, Anthropic, 로컬 |
| Claude Agent SDK (Anthropic) | Python, TS | Claude-네이티브 에이전트와 MCP | Claude 전용 |
| OpenAI Agents SDK | Python | OpenAI-네이티브 에이전트와 핸드오프 | OpenAI 전용 |
| Semantic Kernel (Microsoft) | Python, C#, Java | 엔터프라이즈, 플러그인 아키텍처 | Any |
새 프로젝트의 경우 무거운 프레임워크를 도입하기 전에 경량 접근법(직접 API 호출 + function calling)으로 시작하는 것을 고려하세요. 프레임워크는 편의성을 제공하지만 복잡성과 종속성(lock-in)을 증가시킵니다.
💼 실제 사용 사례
소프트웨어 개발
- 실패한 테스트를 읽고 버그를 식별하며 PR을 제출하는 코딩 에이전트(Devin, SWE-agent)
- 보안 취약점과 스타일 위반을 검사하는 코드 리뷰 에이전트
- 소스 코드를 읽고 API 문서를 생성하는 문서화 에이전트
연구 및 분석
- 웹을 검색하고 논문을 읽어 보고서를 종합하는 심층 연구 에이전트
- 뉴스를 모니터링하고 요약을 생성하는 경쟁 정보 에이전트
- SQL/Python을 작성하고 실행하며 결과를 해석하는 데이터 분석 에이전트
비즈니스 자동화
- 티켓을 끝까지 해결하는 고객 지원 에이전트(단지 응답 초안 작성만 하는 것이 아님)
- 잠재 고객을 조사하고 아웃리치를 작성하며 통화를 예약하는 영업 에이전트
- 거래를 조정하고 예외 보고서를 생성하는 금융 에이전트
개인 생산성
- 응답을 초안하고 회의를 예약하며 인박스를 관리하는 이메일 에이전트
- 요구 시 논문을 찾아 읽고 요약하는 연구 보조 에이전트
- 맞춤 통합 없이 다양한 도구를 연결하는 워크플로 자동화
🚫 에이전트를 사용하면 안 되는 경우
에이전트는 강력하지만 항상 적절한 도구는 아닙니다. 보다 단순한 솔루션으로 해결할 수 있는데 에이전트를 사용하면 비용, 지연, 예측 불가능성이 증가합니다.
| Situation | 더 나은 접근 방식 |
|---|---|
| 명확한 입력/출력이 있는 단일 단계 작업 | 직접 LLM API 호출 |
| 결정적 데이터 변환 | 전통적인 코드(LLM 불필요) |
| 대규모에서 되돌릴 수 없는 고위험 작업 | AI 지원이 포함된 인간 워크플로(수준 L1–L2) |
| 지연에 민감한 사용자 대면 기능 | 직접 API 호출; 에이전트는 왕복 오버헤드를 추가함 |
| 엄격한 규제/감사 요구사항 | 에이전트 초안 작성만 포함하는 인간 개입 워크플로 |
에이전트가 외부 도구에 연결되는 방법을 알아보려면 Model Context Protocol (MCP), 그리고 자율 행동의 보안 위험을 이해하려면 우리의 가이드를 참조하세요 Prompt Injection.