AI Agent란 무엇인가? 개발자 가이드

간단한 챗봇부터 완전 자율 시스템까지 — 자율성 수준, 핵심 구성 요소, 프레임워크, 에이전트 사용 시기

읽는 데 9분 업데이트: 2026년 4월

🤖 AI 에이전트란 무엇인가?

An AI 에이전트 는 대형 언어 모델을 추론 엔진으로 사용하여 환경을 자율적으로 인지하고, 행동을 계획하고, 도구를 사용하며, 인간의 각 단계 입력 없이 목표를 향해 다단계 작업을 실행하는 AI 시스템입니다.

표준 LLM 챗봇과의 핵심 차이점은 agency: 세상에서 결과적인 행동을 취할 수 있는 능력입니다. 챗봇은 질문에 답합니다. 에이전트는 항공편을 예약하고, 코드를 작성하고 배포하며, 이메일을 보내고, 데이터베이스를 조회하고, 결과를 반복적으로 처리합니다 — 모든 것이 인간의 각 단계 개입 없이 수행됩니다.

💡 간단한 정의: LLM + Tools + Memory + Loop = Agent. Remove any of these, and you have something less than an agent. Add planning and multi-agent communication, and you get systems capable of extraordinary complexity.

📊 자율성 수준 (L0–L5)

모든 "에이전트"가 동일한 수준의 자율성을 가지는 것은 아닙니다. Anthropic의 프레임워크는 완전한 인간 통제에서 완전한 자율성까지 스펙트럼을 정의합니다:

Level Name Description Example
L0 AI 없음 완전한 인간 통제 소프트웨어 전통적인 스크립트, 양식
L1 AI-assisted AI가 제안하고; 사람이 결정하고 실행함 GitHub Copilot 자동완성
L2 AI-driven AI가 행동하고; 사람이 실행 전에 검토함 AI가 PR 초안을 작성하고; 개발자가 승인함
L3 Semi-autonomous AI가 선택적 HITL 체크포인트와 함께 실행함 코딩 에이전트가 자율적으로 테스트를 실행하고, 병합 전에 묻음
L4 Autonomous AI가 엔드투엔드로 실행함; 사람이 모니터링함 에이전트가 인간의 단계 없이 전체 기능을 배포함
L5 완전 자율 AI가 스스로 지시하고, 스스로 수정하며, 스스로 개선함 연구 단계에만 해당; 생산 환경에는 배포되지 않음

오늘날 대부분의 생산 에이전트는 L2–L3 수준에서 운영됩니다. L4는 특수 영역(자동화된 거래, 데이터 파이프라인)에서 존재합니다. L5는 이론적이며 중요한 정렬 문제를 제기합니다.

🧩 AI 에이전트의 핵심 구성 요소

모든 에이전트는 — 프레임워크나 제공업체에 관계없이 — 네 가지 기본 구성 요소로 구축됩니다:

1. 지각(입력)

에이전트가 환경을 관찰하는 방식입니다. 여기에는 사용자 메시지, 도구 호출 결과, 파일 내용, API 응답, 센서 데이터 및 컨텍스트 창에 제공되는 기타 모든 정보가 포함됩니다. 에이전트가 인지할 수 있는 정보의 품질이 수행할 수 있는 작업을 직접 제한합니다.

2. 메모리

에이전트가 무엇을 기억할 수 있으며 얼마나 오래 기억하는가:

메모리 유형ScopeImplementation
In-context 현재 대화만 컨텍스트 창의 메시지
외부(단기) 세션 또는 작업 지속 시간 Redis, 인메모리 저장소, 스크래치패드 파일
외부(장기) 세션 간 지속 벡터 데이터베이스(RAG), SQL, 파일 시스템
모델 가중치 모델에 내장됨 학습 데이터, 미세조정

3. 도구(행동)

에이전트가 세상에 영향을 주기 위해 호출할 수 있는 함수들입니다. 도구 설계는 매우 중요합니다 — 명확한 설명과 스키마를 가진 잘 정의된 도구는 LLM이 올바르게 사용하도록 합니다. 잘못 설계된 도구는 오용과 실패를 초래합니다.

  • 읽기 도구: search_web, read_file, query_database, get_weather
  • 쓰기 도구: write_file, send_email, create_pr, post_message
  • 실행 도구: run_code, call_api, deploy_service
  • 에이전트 도구: spawn_subagent, ask_human (HITL), delegate_task

4. 계획 및 추론

에이전트가 다음에 무엇을 할지 결정하는 방식입니다. 현대의 에이전트는 하나 이상의 계획 패턴을 사용합니다:

  • ReAct (Reason + Act): 동일 컨텍스트에서 추론과 도구 사용을 교차 수행
  • 체인 오브 솟(Chain-of-Thought): 행동하기 전에 명시적인 단계별 추론
  • 트리 오브 솟(Tree-of-Thought): 여러 추론 가지를 탐색하고 최적을 선택
  • 계획 및 실행(Plan-and-Execute): 사전에 전체 계획을 작성한 다음 각 단계를 실행

🔁 에이전트 루프

대부분의 에이전트는 작업이 완료되거나 정지 조건이 충족될 때까지 반복되는 지각-계획-행동 루프에서 운영됩니다:

  1. 관찰: 현재 상태(메시지, 도구 결과, 메모리)를 읽음
  2. 계획: LLM이 다음에 할 일을 추론함(스크래치패드나 CoT를 생성할 수 있음)
  3. 행동: 도구를 호출하거나, 출력을 생성하거나, 인간 입력을 요청함
  4. 업데이트: 도구 결과를 수신하고, 메모리를 업데이트하며, 컨텍스트에 추가함
  5. 평가: 목표가 달성되었는지 확인; 그렇지 않으면 1단계로 돌아감

무한 루프를 방지하려면 정지 조건이 중요합니다. 일반적인 접근 방식에는 최대 반복 제한, 명시적인 "작업 완료" 도구 호출, N단계 후 인간 개입 체크포인트가 포함됩니다.

⚠️ 가드레일 없는 에이전트 루프는 무한히 실행되어 막대한 API 비용을 초래할 수 있습니다. 생산 환경의 에이전트에는 항상 하드 반복 제한과 토큰 예산을 구현하세요.

🛠️ 에이전트 프레임워크 및 SDK

AI 에이전트 생태계는 빠르게 성숙했습니다. 다음은 2026년 4월 기준 주요 프레임워크입니다:

Framework Language 권장 대상 모델 지원
LangChain / LangGraph Python, JS 복잡한 다단계 파이프라인, 상태 그래프 Any (OpenAI, Anthropic, Ollama…)
AutoGen (Microsoft) Python 다중 에이전트 대화, 코드 실행 OpenAI, Azure, 로컬 모델
CrewAI Python 역할 기반 다중 에이전트 팀 OpenAI, Anthropic, 로컬
Claude Agent SDK (Anthropic) Python, TS Claude-네이티브 에이전트와 MCP Claude 전용
OpenAI Agents SDK Python OpenAI-네이티브 에이전트와 핸드오프 OpenAI 전용
Semantic Kernel (Microsoft) Python, C#, Java 엔터프라이즈, 플러그인 아키텍처 Any

새 프로젝트의 경우 무거운 프레임워크를 도입하기 전에 경량 접근법(직접 API 호출 + function calling)으로 시작하는 것을 고려하세요. 프레임워크는 편의성을 제공하지만 복잡성과 종속성(lock-in)을 증가시킵니다.

💼 실제 사용 사례

소프트웨어 개발

  • 실패한 테스트를 읽고 버그를 식별하며 PR을 제출하는 코딩 에이전트(Devin, SWE-agent)
  • 보안 취약점과 스타일 위반을 검사하는 코드 리뷰 에이전트
  • 소스 코드를 읽고 API 문서를 생성하는 문서화 에이전트

연구 및 분석

  • 웹을 검색하고 논문을 읽어 보고서를 종합하는 심층 연구 에이전트
  • 뉴스를 모니터링하고 요약을 생성하는 경쟁 정보 에이전트
  • SQL/Python을 작성하고 실행하며 결과를 해석하는 데이터 분석 에이전트

비즈니스 자동화

  • 티켓을 끝까지 해결하는 고객 지원 에이전트(단지 응답 초안 작성만 하는 것이 아님)
  • 잠재 고객을 조사하고 아웃리치를 작성하며 통화를 예약하는 영업 에이전트
  • 거래를 조정하고 예외 보고서를 생성하는 금융 에이전트

개인 생산성

  • 응답을 초안하고 회의를 예약하며 인박스를 관리하는 이메일 에이전트
  • 요구 시 논문을 찾아 읽고 요약하는 연구 보조 에이전트
  • 맞춤 통합 없이 다양한 도구를 연결하는 워크플로 자동화

🚫 에이전트를 사용하면 안 되는 경우

에이전트는 강력하지만 항상 적절한 도구는 아닙니다. 보다 단순한 솔루션으로 해결할 수 있는데 에이전트를 사용하면 비용, 지연, 예측 불가능성이 증가합니다.

Situation더 나은 접근 방식
명확한 입력/출력이 있는 단일 단계 작업 직접 LLM API 호출
결정적 데이터 변환 전통적인 코드(LLM 불필요)
대규모에서 되돌릴 수 없는 고위험 작업 AI 지원이 포함된 인간 워크플로(수준 L1–L2)
지연에 민감한 사용자 대면 기능 직접 API 호출; 에이전트는 왕복 오버헤드를 추가함
엄격한 규제/감사 요구사항 에이전트 초안 작성만 포함하는 인간 개입 워크플로
💡 경험 법칙: 잘 구성된 프롬프트와 한 번의 API 호출로 문제를 해결할 수 있다면 그렇게 하세요. 작업이 실제로 여러 단계, 동적 도구 선택 또는 중간 결과에 따른 반복을 요구할 때만 에이전트를 구축하세요.

에이전트가 외부 도구에 연결되는 방법을 알아보려면 Model Context Protocol (MCP), 그리고 자율 행동의 보안 위험을 이해하려면 우리의 가이드를 참조하세요 Prompt Injection.