한눈에 보기

Anthropic이 The 2026 State of AI Agents Report를 공개했다. 부제는 How enterprises are building and deploying AI in production이다.

이번 보고서는 Anthropic이 리서치 회사 Material과 함께 late 2025에 미국의 technical leaders 500명 이상을 조사한 결과를 담고 있다. 핵심은 간단하다. 기업의 AI 에이전트 사용이 "챗봇 써봤다" 수준에서 멀티스텝 업무, 생산 코드, 데이터 분석, 내부 프로세스 자동화로 넘어가고 있다.

숫자로 보면 더 선명하다.

  • 57%가 multi-stage workflows에 AI 에이전트를 사용
  • 16%는 cross-functional 또는 end-to-end processes까지 확장
  • 9 in 10 organizations가 coding 보조에 AI 사용
  • 86%는 production code에 AI coding agents를 배포
  • 80%는 AI agent investments가 이미 measurable economic impact를 내고 있다고 응답
  • 81%는 2026년에 simple task automation을 넘어 더 complex AI projects로 이동할 계획

이번 발표 뭐가 나왔나

Anthropic 보고서는 기업들이 AI 에이전트를 어떻게 만들고, 어디에 배포하고, 어떤 장벽을 느끼는지 정리한다. 조사 대상은 engineering leaders, IT executives, technical decision-makers 등 기술 의사결정자다.

보고서에서 가장 눈에 띄는 문장은 에이전트가 더 이상 단일 기능 도구가 아니라는 점이다. 기존 챗봇은 사람이 질문하고 사람이 다음 행동을 정했다. 지금 기업들이 말하는 에이전트는 여러 단계의 작업을 스스로 이어가고, 코드 작성부터 리포트 생성, 내부 프로세스 처리까지 맡는 쪽에 가깝다.

Anthropic Economic Index의 September 2025 보고서도 배경으로 보면 흐름이 이어진다. Claude.ai 사용에서 사용자가 Claude에게 작업을 맡기는 directive automation 대화 비율은 late 2024 V1 27%에서 V3 39%로 늘었다. 개인 사용에서도 "같이 대화하기"보다 "일을 맡기기" 비중이 커지고 있는데, 기업 쪽에서는 이 흐름이 더 구조화된 업무 시스템으로 들어가는 셈이다.

핵심 변화 3가지

1. 에이전트가 단일 작업에서 멀티스텝 워크플로로 넘어갔다

보고서에 따르면 조직의 57%가 AI 에이전트를 multi-stage workflows에 사용한다. 16%는 여러 팀이나 비즈니스 기능을 가로지르는 cross-functional 또는 end-to-end processes에 쓰고 있다.

이건 "메일 초안 써줘"와는 결이 다르다. 예를 들면 자료를 찾고, 요약하고, 내부 데이터와 맞춰보고, 보고서 초안을 만들고, 다음 액션까지 연결하는 식이다. 사람이 중간중간 방향을 잡더라도, AI가 맡는 작업 단위가 훨씬 길어졌다.

2. 코딩 에이전트는 이미 생산 코드 영역에 들어갔다

코딩 쪽 수치는 꽤 강하다. 9 in 10 organizations가 coding 보조에 AI를 쓰고, 86%는 production code에 AI coding agents를 배포했다고 답했다. 규모별로 보면 enterprise는 91%, SMB는 83%다.

또 42%는 human oversight 하에 agent가 development work를 lead하도록 신뢰한다고 답했다. "개발자가 AI를 보조 도구로 쓴다"에서 한 발 더 나가, AI가 작업을 주도하고 사람이 검토하는 구조가 일부 조직에서는 현실이 되고 있다.

생산성 이득도 코드 작성 하나에만 몰려 있지 않다.

  • code generation: 59%
  • research/documentation: 59%
  • code review/testing: 59%
  • planning/ideation: 58%

개발 라이프사이클 전체에 비슷하게 분산되어 있다는 점이 재미있다. AI가 단순히 타이핑 속도를 올리는 도구가 아니라, 기획, 조사, 테스트, 리뷰까지 들어가고 있다는 얘기다.

3. 기업은 pre-built와 custom-built 사이의 하이브리드를 택하고 있다

AI 에이전트를 만드는 방식은 47%가 hybrid다. 완전히 pre-built agent만 쓰는 곳은 21%, custom-built로 직접 만드는 곳은 20%다.

이 수치는 현실적이다. 기업 입장에서 모든 걸 직접 만들면 비용과 유지보수가 커진다. 반대로 완제품만 쓰면 내부 시스템, 권한, 데이터, 업무 규칙에 맞추기 어렵다. 그래서 이미 있는 에이전트나 플랫폼을 쓰되, 핵심 업무에는 custom component를 붙이는 방식이 가장 많이 선택된 것으로 보인다.

본문 이미지

AI 에이전트 기업 활용 흐름

실제로 뭐가 달라지나

일반 사용자

일반 사용자 입장에서는 회사 안의 AI 도구가 "질문 답변 창"에서 "업무 요청 창"으로 바뀔 가능성이 크다. 예전에는 사내 문서 검색이나 회의록 요약 정도였다면, 앞으로는 보고서 초안 작성, 데이터 확인, 승인 흐름 준비, 반복 문서 처리까지 묶어서 맡기는 식이 늘어날 수 있다.

다만 이 변화가 곧바로 모든 사람이 편해진다는 뜻은 아니다. 보고서에서도 SMB는 human side와 training needs를 51%로 크게 느끼고 있다. 도구가 좋아져도 사람들이 언제 맡기고, 어디서 검토하고, 어떤 결과를 믿어야 하는지 배워야 한다.

개발자

개발자에게는 가장 직접적인 변화가 온다. 이미 86%가 production code에 AI coding agents를 배포했다는 응답이 나왔다. 이제 논점은 "AI로 코딩해도 되나?"보다 "AI가 만든 코드를 어떤 기준으로 리뷰하고, 테스트하고, 배포할 것인가?"에 가깝다.

특히 42%가 agent-led development work를 human oversight 하에 신뢰한다고 답한 점은 개발 프로세스 설계와 연결된다. 이슈 분해, 브랜치 전략, 코드 리뷰, 테스트 자동화, 보안 검토 같은 주변 체계가 더 중요해진다.

창업자

창업자에게는 두 가지가 보인다.

첫째, AI 에이전트 제품을 만들 때 단순 챗봇 인터페이스만으로는 차별화가 어려워진다. 기업이 원하는 건 내부 시스템과 연결되고, 데이터 권한을 지키고, 반복 업무를 끝까지 처리하는 제품이다.

둘째, 내부 운영에도 바로 쓸 수 있다. 보고서는 coding 외 high-impact use cases로 data analysis/report generation 60%, internal process automation 48%를 꼽았다. 작은 팀일수록 리포트, 영업 자료, 재무 계획, 고객 응대, 운영 문서 같은 반복 업무를 줄이는 효과가 크게 체감될 수 있다.

좋은 점

이번 보고서의 좋은 점은 AI 에이전트 논의를 감이 아니라 운영 지표 쪽으로 끌고 온다는 점이다. 80%가 이미 measurable economic impact를 보고했고, 88%는 returns가 지속되거나 증가할 것으로 기대한다고 답했다.

또 에이전트 활용처가 코딩에만 갇히지 않는다. 다음 12개월 확장 계획에서 research/reporting은 56%로 높게 나왔고, supply chain optimization, product development, financial planning도 언급된다. 기업들이 에이전트를 "개발팀 도구"가 아니라 "업무 인프라"로 보기 시작했다는 해석이 가능하다.

AWS Agent Registry preview도 이 흐름과 맞물린다. 조직 안에 에이전트가 늘어나면 누가 만든 에이전트인지, 어떤 도구와 권한을 쓰는지, 이미 비슷한 기능이 있는지 관리해야 한다. AWS는 AgentCore 안에서 agents, tools, skills, MCP servers, custom resources를 private catalog로 관리하고, approval workflow와 CloudTrail audit까지 붙이는 방향을 제시했다.

Microsoft 365 Copilot 쪽도 비슷하다. Agent Builder로 만든 에이전트를 Teams에 공유하고, 자연어로 agent를 만들고, declarative agents에 interactive UI widgets를 붙이는 업데이트가 이어지고 있다. 기업 에이전트 시장이 "모델 성능"만이 아니라 "업무 앱 안에서 어떻게 배포되고 관리되는가"로 움직이고 있다.

아쉬운 점

보고서에서 장벽도 꽤 현실적으로 나온다.

  • existing systems와의 integration: 46%
  • data access/quality: 42%
  • implementation costs: 43%
  • SMB의 human side/training needs: 51%

결국 에이전트는 모델만 좋다고 굴러가지 않는다. 사내 데이터가 정리되어 있어야 하고, 권한 체계가 맞아야 하고, 기존 업무 시스템과 연결되어야 한다. 이 부분이 안 되어 있으면 멋진 데모는 나와도 실제 업무에서는 막힌다.

또 조사 대상이 technical leaders라는 점도 감안해야 한다. 현업 사용자, 법무, 보안, 재무, 고객지원 담당자가 느끼는 리스크는 다를 수 있다. 숫자는 강하지만, 모든 기업에 그대로 적용되는 공식처럼 읽으면 곤란하다.

내 생각

이번 보고서를 보면서 가장 크게 느낀 건, AI 에이전트의 경쟁력이 "대답을 잘하는가"에서 "일을 끝까지 굴릴 수 있는가"로 이동하고 있다는 점이다.

예전에는 모델이 얼마나 똑똑한 답을 내는지가 중심이었다. 이제는 그 답을 바탕으로 파일을 만들고, 코드를 고치고, 테스트를 돌리고, 내부 데이터와 맞추고, 승인 라인을 타는지까지 봐야 한다. 기업 입장에서는 여기서부터 진짜 비용과 효과가 갈린다.

그래서 앞으로는 에이전트를 잘 쓰는 회사와 못 쓰는 회사의 차이가 모델 구독 여부에서 끝나지 않을 것 같다. 업무를 잘게 쪼개고, 검토 지점을 만들고, 데이터 접근 권한을 정리하고, 실패했을 때 되돌릴 수 있는 운영 방식을 갖춘 회사가 더 빨리 효과를 볼 가능성이 높다.

Google DeepMind의 Gemini Robotics-ER 1.6 같은 뉴스도 넓게 보면 같은 흐름이다. 소프트웨어 안에서 멀티스텝 업무를 처리하던 에이전트가, 로봇의 공간 추론과 실제 환경 인식까지 확장되고 있다. 반대로 Decoupled DiLoCo 계열 연구처럼 대형 모델 학습 비용과 통신량을 낮추려는 시도도 계속된다. 에이전트가 많아질수록 모델을 더 싸고 넓게 학습하고 배포하는 문제도 같이 커질 수밖에 없다.

요약 카드 이미지

Anthropic AI Agents Report 2026 요약 카드

결론

Anthropic의 The 2026 State of AI Agents Report는 기업 AI 에이전트가 실험 단계를 지나고 있다는 쪽에 힘을 싣는다. 57%는 multi-stage workflows에 쓰고, 86%는 production code에 AI coding agents를 배포했으며, 80%는 이미 measurable economic impact를 보고했다.

하지만 동시에 병목도 분명하다. 기존 시스템 연동, 데이터 품질, 구현 비용, 직원 교육이 따라오지 않으면 에이전트는 멋진 데모에서 멈출 수 있다.

2026년의 관전 포인트는 누가 더 화려한 에이전트를 만드는지가 아니라, 누가 에이전트를 실제 업무 프로세스 안에 안정적으로 넣고 관리하느냐가 될 가능성이 크다.

한 줄 평

AI 에이전트는 이제 챗봇의 다음 버전이 아니라, 기업 업무 운영 방식 자체를 다시 짜게 만드는 도구가 되고 있다.

참고 출처