Anthropic Project Glasswing, AI 보안 병목은 이제 검증과 패치다

Anthropic Project Glasswing 초기 업데이트와 Claude Mythos Preview의 취약점 탐지 결과를 정리했습니다.

Anthropic이 Project Glasswing 초기 업데이트를 공개했다. Claude Mythos Preview가 취약점 발견 속도를 크게 끌어올리면서, 실제 병목은 검증·책임 있는 공개·패치 처리로 이동하고 있다.

한눈에 보기

발표 내용: Anthropic이 Claude Mythos Preview와 약 50개 파트너가 진행한 Project Glasswing 초기 결과를 공개했다.
핵심 변화: high/critical 취약점 후보를 대량으로 찾으면서 병목이 발견에서 검증·공개·패치로 옮겨갔다.
한 줄 결론: AI 보안 자동화의 진짜 승부처는 "찾을 수 있나"보다 "믿고 고칠 수 있나"가 됐다.

이번 발표, 뭐가 나왔나

Anthropic은 2026년 5월 22일 Project Glasswing 초기 업데이트를 공개했다. 핵심은 Claude Mythos Preview와 약 50개 파트너가 세계적으로 중요한 소프트웨어를 대상으로 high/critical 취약점 1만 건 이상을 찾았다는 내용이다.

숫자만 보면 "AI가 취약점을 많이 찾았다"로 끝낼 수 있지만, 이번 발표의 진짜 포인트는 그다음이다. Anthropic은 이제 보안의 병목이 취약점 발견이 아니라, 발견된 내용을 검증하고 책임 있게 공개하고 실제 패치까지 밀어붙이는 과정으로 이동했다고 설명했다.

핵심 변화 3가지

1. Claude Mythos Preview가 취약점 발견 속도를 끌어올렸다

Anthropic에 따르면 Project Glasswing은 오픈소스 프로젝트 1,000개 이상을 스캔했고, 전체 취약점 후보 23,019건을 찾았다. 이 중 high/critical로 추정된 항목은 6,202건이었다.

평가된 high/critical 후보 1,752건 중 90.6%는 true positive로 확인됐고, 62.4%는 실제 high/critical로 재분류됐다. 아직 모든 항목이 공개·패치까지 끝났다는 뜻은 아니지만, 단순한 노이즈 생산과는 거리가 있는 결과로 볼 수 있다.

2. 병목이 '발견'에서 '검증'으로 옮겨갔다

사용자 입장에서는 이 부분이 먼저 보인다. AI가 취약점 후보를 빠르게 뽑아내면 보안팀 일이 줄어드는 게 아니라, 재현 검증과 우선순위 판단이 더 빨리 쌓인다.

Cloudflare도 Project Glasswing 경험을 공유하면서, 일반 코딩 에이전트를 저장소에 던져 넣는 방식으로는 충분한 커버리지가 나오기 어렵다고 설명했다. 대신 좁은 범위의 병렬 작업, 독립 검증, 중복 제거, 보고서 스키마 같은 하네스가 필요하다는 쪽이다.

3. 보안 모델 공개 방식 자체가 제품 문제가 됐다

Anthropic은 Mythos-class 모델을 아직 일반 공개하지 않고 있다. 이유는 단순하다. 취약점 탐지 능력이 강해질수록 방어자에게는 유용하지만, 공격자에게도 같은 능력이 넘어갈 수 있다.

그래서 이번 발표는 모델 성능 발표이면서 동시에 배포 방식에 대한 메시지이기도 하다. Claude Security public beta, Cyber Verification Program, 보안팀용 skills·evaluation harness·threat model builder 언급은 "강한 모델 하나"보다 검증 가능한 워크플로를 먼저 만들겠다는 방향에 가깝다.

그래서 실제로 뭐가 달라지나

일반 사용자 기준

일반 사용자가 당장 Claude Mythos Preview를 직접 쓰게 되는 뉴스는 아니다. 오히려 반대다. 강한 사이버 보안 모델은 공개 범위가 제한될 수 있고, 그 대신 브라우저·운영체제·클라우드·오픈소스 라이브러리 쪽에서 더 많은 보안 패치가 나오는 흐름으로 먼저 체감될 가능성이 크다.

Mozilla 사례가 이 방향을 잘 보여준다. Mozilla는 Claude Mythos Preview 초기 버전을 Firefox에 적용해 Firefox 150에서 271개 취약점을 수정했다고 밝혔다. 이전 Opus 4.6 협업에서 Firefox 148에 수정한 22개보다 훨씬 큰 규모다.

개발자 기준

개발자와 보안팀 입장에서는 "AI가 찾아줬다"가 끝이 아니다. 후보를 재현하고, 영향도를 다시 매기고, 기존 패치 여부를 확인하고, maintainer에게 안전하게 전달하고, 수정 후 회귀 테스트까지 봐야 한다.

Cloudflare가 말한 것처럼 앞으로는 모델 자체보다 실행 구조가 더 중요해진다. 여러 좁은 태스크를 병렬로 돌리고, 다른 에이전트가 반박 검증을 하고, root cause가 같은 항목을 묶고, 외부 입력이 실제로 해당 버그까지 닿는지 추적하는 파이프라인이 필요해진다.

창업자/업무 활용 기준

창업자나 보안 제품을 만드는 팀이라면 "AI 보안 스캐너"라는 말만으로는 부족하다. 실제 고객이 원하는 건 대량 발견이 아니라, 신뢰할 수 있는 재현 근거와 고칠 순서다.

XBOW 평가도 이 지점을 짚는다. Mythos Preview는 소스코드 감사와 취약점 발견에서 강한 모습을 보였지만, 판단이 항상 충분히 자율적이거나 균형 잡힌 것은 아니었다. 결국 명확한 threat model, 검증 인프라, 안전한 live-site 테스트 구조가 붙어야 실무 도구가 된다.

좋은 점

Anthropic이 대규모 수치와 검증 단계를 함께 공개해, 단순 홍보보다 읽을 근거가 많다.
Cloudflare, Mozilla, AISI, XBOW처럼 실제 보안 현장의 후속 설명이 붙어 결과를 교차로 볼 수 있다.
발견 속도보다 검증·공개·패치 병목을 정면으로 다뤘다는 점이 현실적이다.

아쉬운 점

Mythos-class 모델은 아직 일반 공개 모델이 아니라서 외부 재현 가능성이 제한적이다.
발견된 모든 취약점이 공개·패치까지 완료된 것은 아니다. 아직 확인 필요다.
취약점 탐지 능력이 강해질수록 오남용 방지 장치와 접근 통제 방식도 같이 검증돼야 한다.

내 생각

이번 Project Glasswing 업데이트는 "AI가 취약점을 찾을 수 있나?"라는 질문에서 한 단계 넘어간 발표로 보인다. 이제 핵심은 이거다. AI가 찾아낸 후보를 누가 믿을 수 있게 검증하고, 누가 책임지고 공개하고, 얼마나 빨리 패치할 수 있느냐.

특히 Cloudflare가 말한 하네스 이야기는 꽤 실무적이다. 보안 취약점 분석은 한 번에 넓게 훑는 일이 아니라, 좁은 질문을 많이 던지고 반박 검증을 붙이는 일에 가깝다. 그래서 강한 모델이 등장할수록 오히려 프로세스 설계가 더 중요해진다.

경쟁 모델과 비교할 때도 단순 벤치마크 점수만으로 보기 어렵다. AISI는 Claude Mythos Preview와 GPT-5.5가 기존 사이버 작업 시간 지평 추세를 크게 넘어섰다고 설명했지만, 동시에 벤치마크가 현실 공격 전체를 그대로 대표하지 않는다는 한계도 분명히 적었다. 결국 지금 단계에서는 "누가 더 강한가"보다 "그 능력을 어떤 안전한 구조 안에서 쓰는가"가 더 큰 차이다.

결론

Anthropic의 Project Glasswing 초기 업데이트는 AI 보안 자동화가 발견 단계에서 처리 단계로 넘어가고 있다는 신호다. 취약점 후보를 많이 찾는 능력은 이미 강해지고 있고, 이제는 검증·공개·패치 파이프라인이 그 속도를 따라갈 수 있느냐가 관건이다.

한 줄 평: "AI가 취약점을 찾기 시작하면, 사람의 일은 더 정확한 검증과 책임 있는 패치로 옮겨간다."

이 흐름이 보안팀을 더 편하게 만들지, 아니면 처리해야 할 큐를 더 크게 만들지 여러분은 어떻게 보시나요?