
OpenAI GPT-5.5와 Codex가 AWS Bedrock에 들어왔다: 기업 도입 관점에서 본 핵심 변화
OpenAI GPT-5.5, GPT-5.4, Codex가 Amazon Bedrock에서 일반 제공된다. 핵심은 모델 성능보다 AWS 보안, 과금, 거버넌스 흐름 안에서 OpenAI 기능을 도입할 수 있게 된 변화다.
읽기아카이브
AI 뉴스, 도구, 자동화 흐름을 주제별로 모아봅니다.

OpenAI GPT-5.5, GPT-5.4, Codex가 Amazon Bedrock에서 일반 제공된다. 핵심은 모델 성능보다 AWS 보안, 과금, 거버넌스 흐름 안에서 OpenAI 기능을 도입할 수 있게 된 변화다.
읽기
NVIDIA가 Cosmos 3를 공개했다. Physical AI를 위한 오픈 옴니 모델로, 물리 추론·월드 생성·액션 생성을 하나의 개발 흐름으로 묶었다.
읽기
GitHub Copilot이 2026년 6월 1일부터 PRU 중심 요청 기반 과금에서 GitHub AI Credits 기반 사용량 과금으로 전환된다. 개발자와 팀이 봐야 할 변화만 정리했다.
읽기
Microsoft가 Copilot Health를 미국 유료 개인 구독자 대상으로 프리뷰로 열었다. 건강 기록, 웨어러블 데이터, 의료 AI 안전장치를 어떻게 묶었는지 정리했다.
읽기
OpenAI가 제3자 frontier model 평가 플레이북을 공개했다. harness, tool access, budget, validity check가 AI 에이전트 평가에서 왜 중요한지 정리했다.
읽기
OpenAI가 GPT-Rosalind 기반 Rosalind Biodefense를 공개했다. 검증된 개발자와 공공 파트너에게 생명과학 AI를 제한적으로 여는 trusted access 전략을 정리했다.
읽기
Asana가 StackAI 인수를 통해 no-code AI workflow와 human-agent teams 전략을 강화했다. 협업툴이 업무 기록에서 AI 실행 플랫폼으로 이동하는 흐름을 정리했다.
읽기
Anthropic이 Series H에서 650억 달러를 조달하고 투자 후 기업가치 9,650억 달러를 발표했다. Claude 수요, 컴퓨트 확장, 클라우드 파트너십 관점에서 정리했다.
읽기
Anthropic이 Claude Opus 4.8을 발표했다. 코딩, 에이전트 작업, Messages API 개선이 개발 워크플로에 어떤 의미인지 정리했다.
읽기
Reuters/MarketScreener와 국내 보도에 FuriosaAI 8,000억 원 투자 소식이 올라왔다. 국민성장펀드와 첨단전략산업기금, Broadcom 협력 맥락을 나눠 정리했다.
읽기
Vertu가 Hermes Agent를 내세운 폴더블폰 ALPHAFOLD를 공식 출시한다고 예고했다. 시작가 6,880달러의 AI 폴더블폰이 노리는 시장과 한계를 정리했다.
읽기
Google이 Preferred Sources를 AI Overviews와 AI Mode까지 확장한다고 밝혔다. SEO의 무게중심이 단순 검색 노출에서 독자가 선택하는 출처 쪽으로 조금 더 이동했다.
읽기
Hugging Face TRL 공개, 핵심은 대형 RL 학습의 가중치 동기화 병목을 줄이는 delta weight sync였다
읽기
xAI가 Grok을 Kilo Code에 OAuth로 연결하는 공식 업데이트를 공개했습니다. SuperGrok·X Premium+ 구독, API 키 없는 연결, IDE·CLI agentic coding 흐름을 정리했습니다.
읽기
Reuters의 SK하이닉스 1조 달러 시가총액 보도를 바탕으로, AI 데이터센터 수요가 HBM과 고급 메모리 공급망을 어떻게 밀어 올리는지 정리했습니다.
읽기
Anthropic이 최기영 한국 대표를 선임하고 서울 오피스 개소를 앞뒀다고 발표했다. 이번 소식은 Claude의 한국 기업 AI 시장 공략이 더 구체화되는 신호다.
읽기
Sam Altman의 AI와 일자리 관련 발언을 바탕으로, AI가 어떤 업무를 바꾸고 개인과 기업이 무엇을 준비해야 하는지 정리했습니다.
읽기
OpenAI가 Grupo Folha, Grupo UOL과 브라질 첫 미디어 콘텐츠 파트너십을 발표했습니다. ChatGPT 답변 안의 출처 표시와 원문 링크가 왜 중요한지 정리했습니다.
읽기
교황 Leo XIV의 첫 회칙 Magnifica Humanitas가 AI 시대 인간 보호를 정면으로 다뤘습니다. 발표 내용과 실제 의미를 정리했습니다.
읽기
TechCrunch의 Google Cloud COO 인터뷰와 Gemini API 키 비용·삭제 지연 논란을 바탕으로 AI 보안이 데이터, 권한, 비용 통제 문제로 바뀐 흐름을 정리했습니다.
읽기
Waymo 로보택시가 폭우, 침수 도로, 공사 구간 대응 문제로 일부 도시와 freeway 운행을 조정했습니다. NHTSA 리콜 문서와 TechCrunch 보도를 바탕으로 자율주행 상용화의 현실적인 한계를 정리했습니다.
읽기
Zoom의 2026년 1분기 10-Q에서 Anthropic 우선주 장부가와 추가 투자 규모가 공개됐습니다. AI 기능 제휴가 재무제표의 전략 자산으로 바뀌는 흐름을 정리했습니다.
읽기
Anthropic Project Glasswing 초기 업데이트와 Claude Mythos Preview의 취약점 탐지 결과를 정리했습니다.
읽기
OpenAI가 발표한 Erdős planar unit distance problem 반례와 general-purpose reasoning model의 연구 활용 의미를 정리했습니다.
읽기
Google I/O 2026에서 공개된 Gemini 3.5 Flash, Gemini Spark, Search agents, Managed Agents를 실행형 AI 관점에서 정리합니다.
읽기
OpenAI와 Dell Technologies의 Codex 기업 배포 파트너십을 하이브리드, 온프레미스, 에어갭에 가까운 기업 환경 관점에서 정리합니다.
읽기
Anthropic과 Gates Foundation의 4년 2억 달러 AI 파트너십을 보건, 교육, 농업, 공익 AI 인프라 관점에서 정리합니다.
읽기
Anthropic이 공개한 Claude for Small Business를 연결 앱, Claude Cowork, 승인 기반 워크플로 관점에서 정리합니다.
읽기
Adaption이 공개한 AutoScientist를 모델 평가, 약점 진단, 학습 데이터 생성, post-training 자동화 관점에서 정리합니다.
읽기
Google이 발표한 Gemini Intelligence on Android를 앱 간 자동화, Gemini in Chrome, Autofill, Rambler, AppFunctions 관점에서 정리합니다.
읽기
Anthropic이 공개한 Claude for the legal industry를 MCP connectors, legal plugins, Microsoft Office 연동, CoCounsel Legal 연결 관점에서 정리합니다.
읽기
OpenAI와 Microsoft의 파트너십 개정에서 수익공유 상한, Azure 우선권, IP 라이선스 비독점화가 어떤 의미인지 정리합니다.
읽기
Google GTIG가 AI 위협 리포트를 공개하며 AI로 개발됐다고 판단한 zero-day exploit 사용 사례를 공식 확인했다. AI 보안의 초점이 위협 탐지에서 취약점 발견과 공격 자동화 속도로 이동하고 있다.
읽기
Google이 AI-powered Google Finance를 유럽으로 확대했다. 핵심은 단순한 지역 확장이 아니라, AI 리서치, Deep Search, 고급 차트, 실시간 뉴스, 원자재와 암호화폐 데이터, 실적 발표 요약을 한곳에 묶는 금융 검색 경험이다.
읽기
Sony가 2026년 Corporate Strategy 발표에서 PlayStation 제작 워크플로와 플랫폼 경험에 AI를 적용하는 방향을 공개했다. 핵심은 창작자 대체가 아니라 반복 작업, QA, 3D 모델링, 애니메이션, 추천과 결제 최적화 같은 병목을 줄이는 실무형 AI다.
읽기
Mozilla가 Claude Mythos Preview와 다른 AI 모델을 Firefox 보안 하드닝에 활용한 과정을 공개했다. 핵심은 AI가 보안팀을 대체했다는 이야기가 아니라, 취약점 탐색과 재현, triage, 패치 검토 흐름을 확장했다는 점이다.
읽기
OpenAI가 Realtime API용 새 음성 모델 3종을 공개했다. GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper의 핵심은 음성 AI가 단순 STT/TTS를 넘어 실시간 추론과 도구 실행 레이어로 이동한다는 점이다.
읽기
Genesis AI가 로봇 조작 모델 GENE-26.5를 공개했다. 핵심은 모델 크기보다 사람 손동작, 로봇 손, 장갑 데이터, 시뮬레이션을 묶어 로봇 행동 데이터 병목을 줄이려는 전략이다.
읽기
Anthropic이 SpaceXAI의 Colossus 1 compute capacity를 확보하며 Claude Code와 Claude API 사용 한도를 높였다. 핵심은 새 모델보다 Claude를 더 오래 안정적으로 쓰게 만드는 인프라 확장이다.
읽기
NIST 산하 CAISI가 Google DeepMind, Microsoft, xAI와 frontier AI 국가안보 테스트 협약을 맺었다. 핵심은 강한 모델 경쟁이 성능 발표에서 배포 전 검증 체계로 넓어지고 있다는 점이다.
읽기
Google이 AI Mode와 AI Overviews에서 원본 콘텐츠와 신뢰할 수 있는 출처로 더 쉽게 이동하도록 5가지 링크 표시 업데이트를 공개했다. AI 검색 시대의 콘텐츠 운영 관점에서 의미를 정리한다.
읽기
Google이 Gemini API File Search에 이미지+텍스트 처리, custom metadata filtering, page-level citations를 추가했다. RAG가 단순 문서 검색에서 검증 가능한 멀티모달 업무 검색으로 이동하는 신호다.
읽기
OpenAI Engineering이 ChatGPT voice와 Realtime API WebRTC endpoint를 위해 WebRTC media architecture를 relay + transceiver 구조로 재설계한 과정을 공개했다. 음성 AI 품질이 모델뿐 아니라 네트워크와 미디어 인프라에서 갈리는 이유를 정리한다.
읽기
Anthropic이 Blackstone, Hellman & Friedman, Goldman Sachs와 함께 AI-native enterprise services firm을 출범한다고 발표했다. Claude 경쟁이 모델 판매를 넘어 실제 업무 도입과 운영 서비스로 이동하는 이유를 정리한다.
읽기
Mistral AI가 Workflows public preview를 공개했다. 기업 AI 에이전트가 답변 품질을 넘어 durable execution, observability, human-in-the-loop, RBAC 같은 운영 레이어로 이동하는 이유를 정리한다.
읽기
2026년 5월 4일 arXiv cs.AI recent list에서 보인 agentic AI 흐름을 정리했다. tool calling, orchestration, GUI grounding, small model routing, coding-agent reproducibility가 왜 실무 병목으로 떠오르는지 본다.
읽기
Google Research가 ERA를 공중보건 예측, 우주론, CO2 모니터링, 신경과학 사례에 적용했다. AI 연구조교가 논문 요약을 넘어 계산 모델링과 가설 생성에 들어가는 흐름을 정리한다.
읽기
Okta for AI Agents가 일반 제공됐다. 핵심은 AI agent를 사람이나 앱처럼 신원, 권한, 수명주기, 감사 로그, 회수 대상이 되는 first-class identity로 관리하는 흐름이다.
읽기
Snowflake가 Snowflake Intelligence와 Cortex Code 확장을 발표했다. 핵심은 챗봇 추가가 아니라 기업 데이터, 거버넌스, 개발 흐름, 에이전트 실행을 묶는 control plane 전략이다.
읽기Anthropic이 Claude for Creative Work를 공개했다. Adobe, Affinity by Canva, Autodesk Fusion, Blender, SketchUp, Splice 같은 창작 도구와 연결되며 AI가 별도 챗봇을 넘어 실제 작업 흐름 안으로 들어가는 방향을 보여준다.
읽기
IBM이 IBM Bob을 글로벌 출시했다. 핵심은 코드 생성보다 계획, 구현, 테스트, 배포, 현대화, 보안, 거버넌스를 묶는 기업용 AI 개발 파트너라는 점이다.
읽기
Ai2가 Molmo 계열을 MolmoPoint와 MolmoWeb으로 확장했다. 핵심은 화면과 이미지 안의 대상을 더 정확히 가리키고, 스크린샷 기반으로 다음 웹 행동을 예측하는 오픈 에이전트 연구 흐름이다.
읽기
OpenAI와 AWS가 OpenAI models on Amazon Bedrock, Codex on AWS, Amazon Bedrock Managed Agents powered by OpenAI를 limited preview로 발표했다. 모델 추가보다 중요한 것은 기업용 보안, 조달, 감사 체계 안으로 OpenAI agent stack이 들어오는 변화다.
읽기
Google이 Gemma 4를 공개했다. Apache 2.0 오픈 모델 제품군으로, E2B/E4B 엣지 모델과 26B MoE, 31B Dense를 통해 온디바이스와 agentic workflow를 겨냥한다.
읽기
Google Research가 Vantage를 공개했다. AI avatars와 simulated environment를 사용해 협업, 갈등 해결, 프로젝트 관리 같은 future-ready skills를 평가하는 연구 실험이다.
읽기
Google Research가 Simula를 공개했다. 합성 데이터 생성을 단순 샘플 생성이 아니라 coverage, complexity, quality를 제어하는 dataset-level mechanism design 문제로 다룬다.
읽기
Google DeepMind가 Frontier Safety Framework를 강화했다. harmful manipulation, misalignment, ML R&D 위험을 더 구체화하고, 일부 영역에는 Tracked Capability Levels를 추가했다.
읽기
Sakana AI가 Fugu beta를 공개했다. 여러 frontier foundation model을 pool로 두고 task마다 agent 조합과 협업 방식을 조율하는 multi-agent orchestration 제품이다.
읽기
Anthropic이 Introspection Adapters 연구를 공개했다. fine-tuning으로 모델에 심어진 숨은 행동을 모델 스스로 자연어로 보고하게 만들어 model auditing을 보완하려는 접근이다.
읽기
NVIDIA가 Nemotron 3 Nano Omni를 공개했다. 텍스트, 이미지, 오디오, 비디오, 문서, 차트, GUI 입력을 하나의 흐름에서 처리해 AI 에이전트의 perception sub-agent 역할을 노린다.
읽기
Mistral AI가 Mistral Medium 3.5, Vibe remote agents, Le Chat Work mode를 공개했다. 핵심은 새 모델 성능보다 코딩 에이전트를 클라우드 비동기 작업 흐름으로 옮기는 전략이다.
읽기
OpenAI가 Cybersecurity in the Intelligence Age와 action plan을 공개했다. 핵심은 강력한 사이버 AI를 무작정 풀거나 막는 것이 아니라, 검증된 방어자에게 접근을 넓히고 배포 통제를 붙이는 구조다.
읽기
DeepSeek가 V4-Pro와 V4-Flash Preview를 공개했고, Huawei Cloud가 DeepSeek-V4의 첫 적응과 1M long-context inference 지원을 발표했다. 핵심은 모델 성능표보다 AI 인프라 선택지가 어떻게 달라지는지다.
읽기
미국 Department of War가 SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft, AWS와 classified networks 배포 agreements를 발표했다. 핵심은 모델 성능 경쟁보다 IL6·IL7 같은 고보안 네트워크에서 여러 AI 공급자의 역량을 운영하는 구조다.
읽기
OpenAI가 ChatGPT 개인 계정용 Advanced Account Security를 공개했다. passkey와 FIDO 보안키를 중심으로 비밀번호 로그인과 이메일·SMS 복구 의존도를 줄이고, Codex까지 같은 로그인 보호를 적용하는 보안 기능이다.
읽기
NVIDIA가 DLSS 4.5, TensorRT for RTX, Unreal Engine NNE, Kimodo, ComfyUI 흐름을 묶어 게임 개발용 AI 스택을 제시했다. 핵심은 프레임 보간만이 아니라 렌더링, inference, animation, asset 제작까지 이어지는 개발 파이프라인이다.
읽기
Google DeepMind가 AI co-clinician 연구 이니셔티브를 공개했다. 의사를 대체하는 제품 발표가 아니라, 임상 감독 아래 환자와 의사를 보조하는 triadic care 모델을 검증하려는 의료 AI 연구다.
읽기
Google이 Google built-in 차량에서 Gemini를 Google Assistant의 업그레이드로 순차 도입한다. 핵심은 차량용 음성 비서가 정해진 명령어 중심에서 지도, 메시지, 차량 매뉴얼을 연결하는 대화형 인터페이스로 이동한다는 점이다.
읽기
OpenAI가 Stargate를 중심으로 미국 AI 인프라 10GW 확보 목표를 이미 넘어섰고 최근 90일 동안 3GW 이상을 추가했다고 밝혔다. AI 경쟁은 모델 성능표를 넘어 전력, 데이터센터, 칩, 클라우드 파트너십 경쟁으로 확장되고 있다.
읽기
Cloudflare와 Stripe Projects 통합은 AI agent가 계정 생성, API token 발급, 도메인 구매, 결제, production 배포까지 이어가는 agentic deployment 흐름을 보여준다.
읽기
Microsoft Agent 365가 2026년 5월 1일 일반 제공된다. 핵심은 AI agent를 registry, observability, governance, security 관점에서 관리하는 control plane으로 올리는 것이다.
읽기
Microsoft와 OpenAI가 파트너십 조건을 조정했다. Azure 우선 출시와 Microsoft의 primary cloud partner 지위는 유지되지만, OpenAI는 모든 클라우드 제공업체의 고객에게 제품을 제공할 수 있게 됐다.
읽기
Google A2UI Team이 A2UI v0.9 draft를 공개했다. 에이전트가 임의 코드를 실행하는 대신 UI intent를 선언하고, 앱은 기존 component catalog로 렌더링하는 generative UI 표준 흐름을 정리한다.
읽기
OpenAI가 ChatGPT Enterprise와 OpenAI API Platform의 FedRAMP 20x Moderate authorization을 발표했다. 모델 성능보다 공공기관과 규제 산업의 AI 도입 조건이 어떻게 달라지는지 정리한다.
읽기
Microsoft가 Copilot Studio real-time voice agents의 GA와 Dynamics 365 Contact Center의 agentic CX 확장을 발표했다. 고객센터 음성 AI가 IVR을 넘어 자연어 상담, 맥락 전달, 품질 관리로 확장되는 흐름을 정리한다.
읽기
AMD가 Xiaomi MiMo-V2.5-Pro의 AMD Instinct GPU Day 0 지원을 공개했다. 1T급 MoE 모델 공개와 동시에 ROCm 7, SGLang, ATOM 기반 배포 흐름이 나온 점을 인프라 관점에서 정리한다.
읽기
OpenAI가 Codex 작업을 이슈 트래커 중심으로 오케스트레이션하는 오픈소스 spec Symphony를 공개했다. Linear 보드, isolated workspace, CI, 리뷰 흐름을 묶어 코딩 에이전트를 팀 workflow 안에서 굴리는 방식이다.
읽기
Google DeepMind와 대한민국 과기정통부가 AI for Science 파트너십을 발표했다. 서울 AI Campus, SNU·KAIST·AI Bio Innovation Hubs 협력, 한국 AI Safety Institute 협력까지 한 번에 묶인 국내 AI 이슈다.
읽기
Google과 Kaggle이 무료 5일 AI Agents Vibe Coding Course를 다시 연다. 핵심은 자연어를 개발 인터페이스로 쓰고, tools와 API를 연결해 실제 agent 시스템을 만드는 흐름이다.
읽기
xAI가 Grok Voice Think Fast 1.0을 API로 공개했다. 핵심은 단순 TTS가 아니라 실시간 음성 대화, tool calling, 전화 상담, 영업, 예약 같은 multi-step workflow를 처리하는 voice agent다.
읽기
OpenAI가 GPT-5.5를 공개했다. 핵심은 답변 성능만이 아니라 Codex, computer use, 지식 업무, API 가격, Bio Bug Bounty까지 이어지는 agentic workflow 전환이다.
읽기
Anthropic과 NEC가 일본 엔터프라이즈 AI 협업을 발표했다. Claude는 약 3만 명의 NEC Group employees에게 전개되고, BluStellar와 Claude Code, Claude Cowork를 통해 산업별 보안 AI 제품으로 확장된다.
읽기
OpenAI가 기업 AI의 다음 단계를 Frontier와 unified AI superapp 중심으로 설명했다. 핵심은 모델 성능보다 회사 전체의 에이전트 운영 레이어와 직원 업무 화면을 잡는 것이다.
읽기
Meta가 Alta Daily의 Segment Anything Model 활용 사례를 공개했다. SAM은 사용자 옷 사진의 배경 제거, 디지털 옷장, avatar 착장 UX, 이미지 처리 비용 구조에 직접 들어간다.
읽기
Google Research가 MoGen으로 현실적인 3D 합성 뉴런 형태를 만들고 PATHFINDER 훈련에 섞어 mouse axon 재구성 오류를 줄였다고 공개했다.
읽기
Cohere가 첫 transcription model인 cohere-transcribe-03-2026을 공개했다. 14개 언어, Apache 2.0, API와 Model Vault 배포 옵션, 한계까지 정리한다.
읽기
GitHub가 Copilot Free, Pro, Pro+ 사용자의 interaction data를 AI 모델 학습과 개선에 사용할 수 있다고 공지했다. 개인 플랜 사용자와 팀이 확인해야 할 범위를 정리한다.
읽기
Anthropic이 2026년 미국 중간선거와 주요 글로벌 선거를 앞두고 Claude의 선거 안전장치를 정리했다. 정치 편향 평가, 악용 방어, TurboVote 연결, 웹 검색 라우팅이 핵심이다.
읽기
Cohere와 Aleph Alpha가 정부와 규제 산업을 겨냥한 주권 AI 결합 계획을 발표했다. 모델 성능보다 데이터 통제권, 인프라 선택권, 규제 대응이 더 중요해지는 흐름이다.
읽기
GitHub Copilot에서 GPT-5.5가 일반 제공되기 시작했다. Pro+, Business, Enterprise 사용자는 모델 선택지와 premium request 소모량을 함께 봐야 한다.
읽기
Google DeepMind가 Accenture, Bain, BCG, Deloitte, McKinsey와 손잡고 기업 AI 전환을 밀고 간다. 모델 성능보다 실제 업무 도입과 운영 역량이 더 중요해지는 흐름이다.
읽기
NVIDIA가 양자 프로세서 보정과 양자 오류 정정 디코딩을 위한 open AI model family Ising을 공개했다. AI가 콘텐츠 생성 밖의 과학 하드웨어 운영 문제로 들어가는 흐름이다.
읽기
Google Research가 ReasoningBank를 공개했다. AI 에이전트가 성공과 실패 경험에서 추론 전략을 뽑아 다음 작업에 다시 쓰는 memory framework다.
읽기
Google Research가 Google Photos Auto frame에 들어간 3D-aware 이미지 편집 기술을 공개했다. 단순 보정이 아니라 촬영 후 카메라 관점과 구도를 다시 계산하는 흐름이다.
읽기
Anthropic과 Amazon이 최대 5GW 신규 컴퓨트 협력을 발표했다. Claude 경쟁의 병목이 모델 성능표에서 전력, 데이터센터, 자체 칩으로 옮겨가는 흐름을 정리했다.
읽기
OpenAI가 Codex Labs와 GSI 파트너십을 발표했다. 코딩 에이전트 경쟁이 개인 생산성 도구에서 기업 도입 체계로 옮겨가는 흐름을 정리했다.
읽기
OpenAI와 Cloudflare가 2026년 4월 13일, OpenAI 모델과 Codex를 Cloudflare Agent Cloud에서 사용할 수 있도록 협력한다고 발표했습니다. 핵심은 GPT-5.4 같은 모델을 Cloudflare 쪽에서
읽기
Microsoft 365 Copilot Agent Builder의 Teams 공유, 자연어 에이전트 생성, MCP Apps UI 위젯 흐름을 정리했다.
읽기
AWS Agent Registry 프리뷰가 Bedrock AgentCore에서 에이전트, 도구, 스킬, MCP 서버를 사내 카탈로그로 관리하게 만드는 흐름을 정리했다.
읽기
Anthropic의 2026 State of AI Agents Report를 바탕으로 기업 AI 에이전트가 멀티스텝 업무, 생산 코드, 내부 자동화로 확장되는 흐름을 정리했다.
읽기Google DeepMind Gemini Robotics-ER 1.6이 멀티뷰 이해, 계기 읽기, 작업 성공 판정, 안전 판단을 어떻게 강화했는지 정리했다.
읽기Google DeepMind Decoupled DiLoCo가 여러 데이터센터와 컴퓨트 섬을 느슨하게 묶어 LLM 사전학습의 통신 병목과 장애 대응 문제를 어떻게 다루는지 정리했다.
읽기Gemini Embedding 2 일반 제공이 멀티모달 검색, RAG, 추천 품질의 기반을 어떻게 바꾸는지 정리했다.
읽기Google Deep Research Max가 검색 요약을 넘어 장시간 리서치 에이전트로 확장되는 흐름을 정리했다.
읽기OpenAI Responses API WebSocket mode가 AI 에이전트의 병목을 모델 밖 런타임과 상태 관리 문제로 드러낸 흐름을 정리했다.
읽기OpenAI GPT-Rosalind와 Life Sciences research plugin이 생명과학 AI를 모델 단품이 아닌 연구 워크플로우 경쟁으로 옮기는 이유를 정리했다.
읽기Anthropic Project Glasswing과 OpenAI GPT-5.4-Cyber 흐름을 묶어, 사이버 AI 경쟁이 접근 통제와 책임 구조로 이동하는 이유를 정리했다.
읽기Google Cloud Next 26에서 공개된 Gemini Enterprise Agent Platform과 TPU 8t/8i가 기업용 AI 에이전트 운영 경쟁을 어떻게 바꾸는지 정리했다.
읽기OpenAI가 PII 탐지와 마스킹에 특화된 로컬 실행 가능 오픈웨이트 모델 Privacy Filter를 공개했다.
읽기현재 OpenAI 이미지 생성의 최상위 모델. 텍스트와 이미지를 받아 고품질 이미지 생성·편집에 쓴다.
읽기Artificial Analysis 상위권에 오른 Claude 최신 Opus 계열 모델.
읽기Artificial Analysis 리더보드에 오른 MiniMax 최신 M2 계열 모델.
읽기Artificial Analysis 리더보드에 오른 Qwen3.6 계열 고성능 모델.
읽기Meta의 최신 생성형 AI 모델 흐름으로 주목받은 모델.
읽기Z.ai가 내세운 8시간 장기 에이전트 모델. 코딩·자동화에는 강하지만, 무조건 메인 모델로 보기 전에 검증할 게 많다.
읽기브라우저 조작과 웹 작업 자동화를 노리는 에이전트 도구.
읽기이미지·비디오·텍스트를 이해해 GUI 작업과 비전 기반 코딩에 쓰는 모델.
읽기개발 작업 흐름을 돕는 에이전트형 도구.
읽기긴 작업과 고난도 판단에 쓰는 Claude 최상위권 모델.
읽기품질과 가격 균형이 좋은 Claude 주력 실전 모델.
읽기대량 작업과 서브에이전트에 가장 현실적인 새 기본값이다.
읽기GPT-5.4 계열에서 가장 싼 모델. 분류, 추출, 랭킹처럼 명확한 작업에 어울린다.
읽기복잡한 멀티스텝 에이전트 작업의 안정성과 처리량을 노린 모델.
읽기GPT-5.4보다 더 오래 생각하는 고성능 버전. 비용보다 정확도가 중요한 작업용이다.
읽기중요한 업무와 코딩을 한 모델로 묶고 싶다면 지금은 이쪽이 기본값에 가깝다.
읽기대량 호출과 짧은 작업을 노리는 비용 효율형 모델.
읽기터미널 기반 오픈소스 코딩 에이전트.
읽기코딩과 에이전트 활용을 노리는 최신 MiniMax 모델.
읽기효율과 성능을 같이 보는 최신 Mistral Small 계열 모델.
읽기소프트웨어 개발을 자동화하는 오픈소스 에이전트.
읽기agentic coding을 노린 최신 Qwen 코딩 모델.
읽기Nano Banana 2로 알려진 최신 이미지 생성·편집 모델.
읽기복잡한 추론과 장문 작업에 먼저 보는 Google 최신 주력 모델.
읽기품질과 속도를 같이 보는 범용 Flash 모델.
읽기느린 에이전트가 답답할 때 의미 있는 초고속 코딩 프리뷰다.
읽기코딩을 넘어 시스템 엔지니어링과 장거리 에이전트 작업을 겨냥한 GLM 5세대 모델.
읽기코딩 에이전트 성능을 크게 끌어올린 모델이지만, 범용 기본값은 GPT-5.4로 넘어갔다.
읽기ChatGPT 쪽 GPT-5.3 Instant 모델. API보다는 ChatGPT 모델 선택지로 보는 편이 맞다.
읽기문서와 이미지에서 핵심 토큰을 뽑는 경량 고성능 OCR 모델.
읽기Git 기반 페어 프로그래밍 도구.
읽기코딩과 에이전트 작업을 강화한 최신 Kimi 계열 모델.
읽기IDE 안에서 여러 모델을 연결하는 개발 보조 도구.
읽기다국어 음성 인식과 정렬을 노리는 Qwen 음성 모델.
읽기GLM-4.7의 무료·경량 계열로 코딩과 추론을 빠르게 처리하는 모델.
읽기Kimi K2 이후의 고성능 모델.
읽기고품질 텍스트 렌더링과 지식형 이미지를 강조한 Z.ai 이미지 생성 모델.
읽기멀티모달 검색과 랭킹을 위한 Qwen 모델.
읽기에이전트 워크플로우를 그래프로 구성하는 프레임워크.
읽기여러 LLM API를 통합 관리하는 게이트웨이.
읽기코딩·추론·에이전트 성능을 크게 끌어올린 GLM-4.x 후반 주력 모델.
읽기긴 코딩 작업 전용으로는 여전히 기준점이지만, 신형 Codex와 GPT-5.4를 같이 봐야 한다.
읽기이미지 보존과 편집 품질을 강화한 이전 세대 이미지 생성 모델.
읽기ChatGPT 이미지 기능에서 쓰이는 최신 이미지 모델 별칭. API 고정 모델명보다는 제품 별칭에 가깝다.
읽기GPT-5.2의 고연산 버전. 고난도 전문 업무에서 더 신중한 답을 노릴 때 쓴다.
읽기아직 쓸 수 있지만, 새 프로젝트라면 GPT-5.4부터 검토하는 게 맞다.
읽기ChatGPT에서 쓰인 GPT-5.2 모델. API 직접 선택보다 제품 모델로 이해하면 된다.
읽기50개 이상 앱에서 화면을 이해하고 ADB로 실제 행동을 수행하는 모바일 자동화 모델.
읽기다국어·억양 환경의 음성 인식을 강화한 Z.ai ASR 모델.
읽기128K 컨텍스트와 이미지 이해를 강화한 GLM-4.6 계열 비전 모델.
읽기오픈 모델 추론 서버로 많이 쓰이는 프로젝트.
읽기현재 API 별칭의 중심이 되는 DeepSeek 모델.
읽기Gemini 3 계열의 빠른 응답용 모델.
읽기Mistral의 대형 주력 모델.
읽기로컬 LLM 실행의 기준점이 된 프로젝트.
읽기DeepSeek 비추론 API 별칭.
읽기DeepSeek thinking mode API 별칭.
읽기Opus 계열의 고성능 이전 모델.
읽기오래 버티는 코딩 에이전트용이지만 지금은 신형 Codex와 비교해야 한다.
읽기Gemini 3 세대의 주력 추론 모델.
읽기Nano Banana Pro로 알려진 Google 이미지 모델.
읽기도구 호출과 긴 컨텍스트를 강조한 Grok 고속 모델.
읽기Grok 4 계열의 개선 모델.
읽기GPT-5.1을 agentic coding에 맞춘 버전. Codex나 비슷한 개발 에이전트에 어울린다.
읽기싸게 굴리는 코딩 보조로는 좋지만, 긴 작업형 메인 에이전트로 쓰기엔 한계가 있다.
읽기GPT-5보다 빠르고 토큰 효율적인 모델. 코딩과 에이전트 작업에서 반응성을 개선했다.
읽기ChatGPT에서 쓰인 GPT-5.1 모델. 일반 사용자용 응답성과 코딩 흐름을 개선했다.
읽기노드 기반 이미지 생성 워크플로우 도구.
읽기정책 기반 안전 분류를 위한 오픈웨이트 safeguard 모델의 큰 버전.
읽기더 가볍게 돌릴 수 있는 오픈웨이트 안전 분류 모델.
읽기MiniMax의 실전형 텍스트 모델.
읽기Google의 고품질 영상 생성 모델.
읽기빠르고 싼 Claude 계열 모델.
읽기Sora 2의 고품질 버전. 영상 품질을 더 챙기는 실험적 프리미엄 모델이다.
읽기동기화된 오디오와 더 나은 물리 이해를 갖춘 OpenAI 영상 생성 모델.
읽기중국 내 선도 코딩 모델을 목표로 공개 벤치와 실제 프로그래밍 작업을 강화한 모델.
읽기코딩과 에이전트 작업에서 많이 쓰인 Sonnet 계열 모델.
읽기Qwen3 계열의 상위 텍스트 모델.
읽기이미지와 텍스트를 같이 다루는 Qwen 비전 모델.
읽기텍스트·이미지·오디오·비디오를 묶는 Qwen 통합 모델.
읽기2M 컨텍스트와 비용 효율을 강조한 Grok 모델.
읽기GPT-5를 Codex용 agentic software engineering에 맞춘 모델.
읽기Mistral의 reasoning 계열 모델.
읽기프로덕션 음성 에이전트를 위한 실시간 음성-음성 모델.
읽기실시간 음성 에이전트를 더 낮은 비용으로 만들기 위한 경량 모델.
읽기공식 카탈로그의 최신 실시간 음성 모델 계열. 음성 입출력 품질을 우선한다.
읽기비디오 이해, 시각적 grounding, GUI 에이전트를 지원하는 100B급 비전 추론 모델.
읽기정보 검색과 구조화, 시각 레이아웃을 결합해 슬라이드와 포스터를 만드는 도구.
읽기GPT-5의 고연산 버전. 더 오래 생각하는 답이 필요한 사용자에게 맞다.
읽기GPT-5 계열의 저비용·저지연 모델. 명확한 프롬프트의 대량 작업에 어울린다.
읽기GPT-5 계열에서 가장 빠르고 저렴한 모델. 단순 분류와 추출에 맞다.
읽기GPT-5 계열의 첫 주력 모델. 4o와 o-series 강점을 통합한 세대 전환 모델이다.
읽기ChatGPT에서 쓰인 GPT-5 모델. 제품 안의 대화형 경험에 맞춰 제공된다.
읽기GPT-5 계열 기반 검색 API 모델. 검색형 응답과 출처 중심 질의에 맞다.
읽기단일 80GB GPU급 환경을 노린 대형 오픈웨이트 reasoning 모델.
읽기Opus 4의 개선 버전.
읽기16GB 메모리급 환경도 노리는 중형 오픈웨이트 reasoning 모델.
읽기Qwen 계열의 이미지 생성 모델.
읽기Mistral Medium 3의 개선 모델.
읽기Mistral의 코드 생성 특화 모델.
읽기추론·코딩·에이전트 성능을 강조하고 Claude Code 호환성을 내세운 모델.
읽기GLM-4.5 계열을 더 가볍게 운용하기 위한 비용 효율형 모델.
읽기Qwen의 agentic code 모델.
읽기가장 빠르고 싼 2.5 계열 선택지.
읽기시작·끝 프레임 합성을 지원하는 Z.ai 영상 생성 모델.
읽기Moonshot의 대표 오픈·에이전트형 모델.
읽기xAI의 주력 추론 모델.
읽기SWE 작업에 맞춘 Mistral 개발 모델.
읽기오디오 전사를 위한 Mistral 모델.
읽기o3가 더 오래 생각하도록 만든 고연산 버전. 신중한 문제 해결용이다.
읽기Hailuo 계열의 영상 생성 모델.
읽기고품질 이미지 생성용 Google 이미지 모델.
읽기Claude 4 세대의 고성능 모델.
읽기Claude 4 세대의 실전 주력 모델.
읽기음성 입력과 오디오 활용을 겨냥한 Kimi 계열 모델.
읽기Qwen3 세대의 대표 모델군.
읽기가격과 속도 균형이 좋은 Gemini 2.5 계열 모델.
읽기도구 사용과 깊은 추론을 결합한 o-series reasoning 모델.
읽기빠르고 비용 효율적인 소형 reasoning 모델. 도구 사용과 추론을 같이 본다.
읽기딥리서치용 경량 reasoning 모델. 긴 조사 작업을 더 싸게 돌릴 때 맞다.
읽기GPT-4.1 계열의 가장 빠르고 저렴한 모델. 자동완성과 분류에 잘 맞다.
읽기GPT-4.1의 작고 빠른 버전. 긴 컨텍스트와 비용 균형이 장점이다.
읽기코딩, 지시 따르기, 긴 컨텍스트를 크게 개선한 API 전용 GPT-4 계열 모델.
읽기Llama 4 계열의 효율형 모델.
읽기Llama 4 계열의 고성능 모델.
읽기Llama 4 계열의 대형 모델로 알려진 선택지.
읽기음성 합성과 대화형 음성 활용에 맞는 모델.
읽기이미지 이해가 필요한 작업에 쓰는 Kimi 모델.
읽기GPT-4o 기반 네이티브 이미지 생성 흐름의 API 모델.
읽기긴 문맥과 추론으로 주목받은 이전 주력 모델.
읽기GPT Image 1의 비용 효율형 버전. 많은 이미지를 싸게 만들 때 본다.
읽기GPT-4 계열에서 더 자연스럽고 창의적인 응답을 실험한 리서치 프리뷰 모델.
읽기확장 사고 흐름을 강조했던 Sonnet 모델.
읽기이전 세대 Grok 주력 모델.
읽기Grok 3의 경량 버전.
읽기긴 리서치 작업을 위한 강한 딥리서치 모델. 자료 조사와 종합에 맞다.
읽기o3의 작은 대안으로 쓰인 reasoning 모델. 이후 GPT-5 mini 계열로 대체되는 흐름이다.
읽기DeepSeek 계열의 멀티모달·이미지 모델.
읽기브라우저·컴퓨터 조작을 위한 특수 모델. 실제 화면을 보고 작업하는 에이전트에 쓰인다.
읽기오픈 reasoning 붐을 만든 대표 모델.
읽기긴 문맥과 추론을 강조한 Kimi 모델.
읽기긴 문맥을 강조한 MiniMax 텍스트 모델.
읽기이미지 이해가 필요한 MiniMax 비전 모델.
읽기효율과 성능으로 주목받은 DeepSeek 모델.
읽기Chat Completions에서 웹 검색을 결합해 쓰던 검색 프리뷰 모델.
읽기검색 결합을 더 낮은 비용으로 쓰는 소형 프리뷰 모델.
읽기이미지 이해가 필요한 DeepSeek 비전 모델.
읽기Llama 3 계열 후반의 효율 좋은 모델.
읽기o1이 더 오래 생각하도록 만든 고연산 버전. 신뢰도가 중요한 답변용이다.
읽기첫 정식 o-series reasoning 모델. 생각하는 시간을 늘려 어려운 문제를 푸는 흐름을 만들었다.
읽기이미지 이해를 지원한 Grok 2 계열 모델.
읽기이전 세대 Qwen 코딩 특화 모델.
읽기Mistral의 대형 멀티모달 모델.
읽기빠른 응답과 비용을 노린 Claude 소형 모델.
읽기Chat Completions에서 오디오 입출력을 다루는 모델 계열.
읽기오디오 입출력을 더 낮은 비용으로 처리하는 경량 모델.
읽기GPT-4o 기반 실시간 텍스트·오디오 입출력 모델.
읽기GPT-4o mini 기반 실시간 음성 모델. 낮은 비용의 대화형 경험에 맞다.
읽기GPT-4o 기반 오디오 입출력 모델. 음성과 텍스트를 섞는 앱에 쓴다.
읽기작고 효율적인 엣지 배포용 모델.
읽기GPT-4o mini 기반 오디오 모델. 비용을 낮춘 음성 기능에 맞다.
읽기텍스트와 이미지를 함께 다루는 안전성 분류 모델.
읽기Llama 3.2 계열 비전 모델.
읽기o1의 작은 대안으로 나온 reasoning 모델. 이후 deprecated 흐름에 들어갔다.
읽기첫 o-series reasoning preview. 오래 생각하고 답하는 모델 흐름의 시작점이다.
읽기MiniMax의 초기 주력 영상 생성 모델.
읽기xAI의 초기 상용 주력 모델.
읽기405B 모델로 주목받은 Llama 대표 세대.
읽기빠르고 저렴한 GPT-4o 계열 소형 모델. GPT-3.5 Turbo를 대체한 비용 효율 모델이다.
읽기많은 서비스에서 장기간 쓰인 Claude 핵심 모델.
읽기코딩 특화 DeepSeek 모델.
읽기ChatGPT에서 쓰인 GPT-4o 모델. 현재는 deprecated로 분류된다.
읽기텍스트, 이미지, 오디오를 자연스럽게 묶은 omni 모델. 멀티모달 전환점이다.
읽기OpenAI의 고성능 임베딩 모델. 검색 품질을 더 챙길 때 쓴다.
읽기작고 저렴한 최신 임베딩 모델. RAG와 검색의 기본 선택지로 좋다.
읽기이전 세대 대표 임베딩 모델. 지금은 text-embedding-3 계열과 비교해야 한다.
읽기안전 분류와 정책 적용을 위한 Llama 계열 모델.
읽기Mistral의 임베딩 모델.
읽기GPT-4 Turbo의 초기 프리뷰. 현재는 deprecated로 보는 게 맞다.
읽기더 긴 컨텍스트와 낮은 비용을 내세운 GPT-4 계열 터보 모델.
읽기품질을 우선하는 텍스트 음성 변환 모델.
읽기속도를 우선하는 텍스트 음성 변환 모델.
읽기프롬프트 이해와 텍스트 렌더링을 강화했던 이미지 생성 모델. 현재는 deprecated 흐름이다.
읽기코드 생성과 이해에 맞춘 Llama 계열 모델.
읽기GPT-3 ada/babbage 계열을 대체한 레거시 베이스 모델.
읽기GPT-3 curie/davinci 계열을 대체한 레거시 베이스 모델.
읽기GPT-4 세대의 첫 고성능 모델. 이후 Turbo, 4o, 5 계열로 이어졌다.
읽기저렴한 챗봇 API의 표준이었던 레거시 GPT 모델.
읽기화자 구분이 필요한 음성 전사 작업용 모델.
읽기GPT-4o 기반 음성 텍스트 변환 모델.
읽기더 낮은 비용으로 쓰는 음성 전사 모델.
읽기GPT-4o mini 기반 텍스트 음성 변환 모델.
읽기범용 음성 인식 모델. 오픈소스 음성 전사의 기준점이 됐다.
읽기이전 세대 텍스트 전용 모더레이션 모델. 현재는 deprecated다.
읽기이전 세대 stable 모더레이션 모델. 레거시 호환 목적에 가깝다.
읽기OpenAI의 초기 대중적 이미지 생성 모델. 현재는 deprecated 모델이다.
읽기