Google Research가 Empirical Research Assistance, 줄여서 ERA를 실제 과학 문제에 적용한 사례를 공개했습니다. 이번 글의 핵심은 새 챗봇 기능이 아닙니다. AI가 과학자의 계산 모델링, 예측, 관측 데이터 해석, 가설 생성 흐름에 들어가기 시작했다는 점입니다.
중요한 선은 먼저 그어야 합니다. ERA는 일반 사용자가 바로 쓰는 공개 제품이라기보다 Google Research의 AI-assisted science 연구 시스템입니다. 그래서 이 글에서는 "곧 모든 과학자가 쓰는 도구"처럼 과장하지 않고, 공식 글에서 확인되는 적용 사례와 아직 남은 검증 문제를 나눠 보겠습니다.
한눈에 보기
- 발표 내용: Google Research가 ERA를 역학, 우주론, CO2 모니터링, 신경과학 네 분야에 적용한 사례를 공개했습니다.
- 핵심 변화: AI가 논문 요약이나 코드 보조를 넘어 empirical software와 과학 모델 후보를 만드는 단계로 들어갔습니다.
- 확인 필요: 일반 공개 범위, API, 가격, 실제 외부 연구팀 재현성은 아직 더 봐야 합니다.
- 한 줄 결론: AI 연구조교는 이제 데모가 아니라 검증받아야 할 현장 도구가 되고 있습니다.

이번 발표, 뭐가 나왔나
Google Research는 2026년 4월 29일 Four ways Google Research scientists have been using Empirical Research Assistance를 공개했습니다. 공식 글에 따르면 ERA는 2025년 가을 preprint로 소개된 AI system이고, 과학자가 expert-level empirical software를 만드는 일을 돕는 방향입니다.
이번에 소개된 적용 분야는 네 가지입니다.
- 공중보건 예측: flu, COVID-19, RSV 입원 예측
- 우주론: cosmic strings의 gravitational energy radiation 계산
- 기후와 대기 관측: GOES-East 위성 데이터로 CO2 추정
- 신경과학: zebrafish neural circuit 메커니즘 후보 탐색
이 조합이 중요한 이유는 문제 유형이 서로 다르기 때문입니다. 한쪽은 공중보건 예측이고, 다른 한쪽은 수학적 해석, 위성 관측, 신경회로 모델링입니다. Google이 말하려는 방향은 분명합니다. AI 연구조교가 단순 텍스트 답변보다 더 깊은 계산과 검증 루프에 들어갈 수 있다는 것입니다.
핵심 변화 3가지
1. ERA는 과학용 empirical software를 만드는 쪽에 가깝다
ERA를 "논문 읽어주는 AI"로 보면 핵심을 놓칩니다. Google Research가 공개한 ERA 논문은 과학에서 병목이 되는 empirical software 제작을 직접 겨냥합니다.
여기서 empirical software는 측정 가능한 품질 지표를 개선하기 위해 만들어지는 연구용 코드와 모델에 가깝습니다. 예를 들어 감염병 입원 예측, 위성 데이터 기반 CO2 추정, 신경 활동 예측처럼 정답이나 평가 지표가 있고, 코드를 바꿔가며 더 나은 결과를 찾아야 하는 작업입니다.
즉 ERA의 역할은 "좋은 설명"보다 "실험 가능한 후보를 만들고 품질 점수를 개선하는 코드 탐색"에 가깝습니다. 이 차이가 중요합니다. 과학 현장에서는 말이 그럴듯한 답보다, 데이터와 평가 기준 앞에서 버티는 모델이 필요하기 때문입니다.
2. 공중보건 예측과 CO2 모니터링은 바로 현실 문제에 닿아 있다
공중보건 사례에서 Google은 ERA 기반 예측이 COVID-19 입원 예측에서 CDC와 주요 연구기관 도구를 retrospective 기준으로 맞추거나 일부 앞섰다고 설명했습니다. 이후 flu와 RSV까지 확장해 prospective forecasts를 제출했다고 합니다.
특히 CDC FluSight challenge 2025-26 season에서는 미국 각 주 단위로 최대 4주 앞 예측을 제출했습니다. Google은 flu와 COVID-19 공개 리더보드에서 상위권 또는 그 근처 성능을 보였다고 설명합니다. 다만 RSV는 public leaderboard가 아니라 내부 분석 기준이라고 밝히고 있어, 이 부분은 구분해서 봐야 합니다.
CO2 모니터링 사례도 실무적입니다. 기존 OCO-2, OCO-3 같은 CO2 관측 위성은 정밀하지만 지구 전체를 자주 촘촘히 보기는 어렵습니다. Google은 ERA가 개발한 physics-guided neural network가 GOES-East weather satellite의 16개 wavelength band와 기상 정보 등을 결합해 column-averaged CO2를 10분 간격으로 추정하도록 만들었다고 설명합니다.
새 위성을 띄우지 않고 기존 관측 장비에서 더 많은 신호를 뽑아내려는 접근입니다. 이건 AI가 과학 장비의 가치를 높이는 방향으로 쓰일 수 있다는 점에서 의미가 있습니다.

3. 우주론과 신경과학에서는 가설 생성까지 들어갔다
우주론 사례에서는 ERA와 Gemini Deep Think를 함께 써서 cosmic strings가 방출하는 gravitational energy radiation 문제를 다뤘다고 Google은 설명했습니다. 기존에는 가장 단순한 square loop 일부 사례만 풀렸고, 일반화된 정확한 해는 열린 문제로 남아 있었다는 설명입니다.
Google은 ERA와 Gemini Deep Think 조합으로 six general solutions와 asymptotic limit formula를 도출했고, 2026년 3월 arXiv로 공유했다고 밝혔습니다. 이건 제품 기능 발표가 아니라 연구 결과이므로, 후속 학계 검증과 독립 재현 여부를 같이 봐야 합니다.
신경과학 사례에서는 zebrafish neural circuit이 나옵니다. Google은 ERA에 simZFish wiring diagram을 제공했고, ERA가 stimulus, neural activity, motor response를 잇는 circuit 후보를 제안했다고 설명했습니다.
핵심은 새 visual stimuli로 테스트했다는 점입니다. Google 설명에 따르면 이 회로 후보는 단순한 statistical shortcut이 아니라 비슷한 상황으로 일반화되는 mechanism 후보로 평가됐습니다. AI가 예측 모델을 넘어 "왜 그런 반응이 나오는지"에 대한 기계적 설명 후보를 제안하는 방향으로 들어간 것입니다.
실제로 뭐가 달라지나
일반 사용자 기준
당장 사용자가 열어볼 새 서비스가 생긴 것은 아닙니다. ERA는 Google Research 사례이고, 일반 공개 제품이나 API로 확인된 범위는 제한적입니다.
다만 앞으로 의료, 기후, 생명과학, 기초과학 뉴스에서 "AI가 실험 설계나 모델링에 참여했다"는 사례는 더 자주 나올 가능성이 큽니다. 과학용 AI가 논문 요약에서 끝나지 않고, 실제 계산 모델과 검증 루프에 붙는 흐름입니다.
개발자 기준
개발자에게 중요한 포인트는 ERA가 단일 답변 모델이 아니라 탐색과 평가를 묶은 시스템이라는 점입니다. 평가 가능한 scientific task를 두고, 여러 후보 코드를 만들고, 점수를 개선하는 방식입니다.
이 방향은 연구용 모델링 파이프라인, 데이터 분석 코드 생성, 시뮬레이션 후보 탐색, 실험 결과 후처리 자동화에 연결될 수 있습니다. 다만 공식 글만으로는 API, 가격, 사용 권한, 배포 형태를 판단할 수 없습니다.
창업자와 업무 활용 기준
R&D가 있는 조직이라면 이번 사례를 단순 자동화 뉴스로 보면 안 됩니다. 데이터가 있고, 품질 지표가 있고, 반복 검증이 가능한 고부가 연구 업무에 AI를 붙이는 흐름입니다.
다만 도입 판단은 보수적으로 해야 합니다. 과학 연구에서는 틀린 모델 하나가 비용, 시간, 안전 문제로 이어질 수 있습니다. 그래서 중요한 질문은 "AI가 만들 수 있나"가 아니라 "그 결과를 누가, 어떤 기준으로 검증하고 폐기할 수 있나"입니다.
좋은 점
- Google 공식 글 안에서 네 가지 실제 과학 사례가 구체적으로 제시됐습니다.
- 공중보건 예측, 우주론, 기후 관측, 신경과학처럼 서로 다른 문제 유형을 함께 보여줬습니다.
- AI가 단순 텍스트 요약을 넘어 empirical software 제작과 가설 생성 보조로 확장되는 흐름이 보입니다.
- 공개 리더보드가 있는 사례와 내부 분석 기준인 사례를 Google이 구분해 설명했습니다.
아쉬운 점
- 사례 대부분은 Google 공식 발표 중심이라 외부 독립 검증은 더 필요합니다.
- ERA의 일반 공개 범위, API, 가격, 제품 형태는 아직 명확하지 않습니다.
- RSV 예측은 public leaderboard가 아니라 Google internal analysis 기준입니다.
- 우주론과 신경과학 결과는 후속 학계 검증과 독립 재현을 지켜봐야 합니다.

내 생각
이번 ERA 뉴스는 화려한 모델명보다 실무적으로 더 흥미롭습니다. 이유는 단순합니다. AI가 "똑똑한 답변"을 넘어, 과학자가 실제로 씨름하는 계산 모델링과 검증 흐름에 들어갔기 때문입니다.
OpenAI GPT-Rosalind나 Google DeepMind의 AI for Science 흐름도 결국 비슷한 질문을 향합니다. AI가 오래 걸리는 지식 작업을 얼마나 끈질기게 따라가고, 도구를 쓰고, 결과를 검증 가능한 형태로 남기느냐입니다.
다만 지금은 Google이 직접 소개한 초기 사례입니다. 다음 단계는 외부 연구팀이 같은 방식으로 성과를 재현할 수 있는지, 그리고 일반 연구자에게 얼마나 열릴지입니다.
결론
Google ERA의 핵심은 AI 연구조교가 실제 과학 현장에 들어가기 시작했다는 점입니다. 공중보건 예측부터 우주론, CO2 모니터링, 신경과학까지 사례가 넓다는 점도 눈에 띕니다.
하지만 아직은 모든 연구자가 바로 쓰는 범용 도구라고 보기는 어렵습니다. 공개 범위와 독립 검증이 따라붙어야 진짜 파급력을 판단할 수 있습니다.
한 줄로 정리하면 이렇습니다.
ERA는 AI 연구조교가 데모를 넘어 검증받아야 할 현장 도구가 되고 있음을 보여주는 Google Research의 사례입니다.