AI 거장의 경고: 지금의 AI는 진짜 지능이 아니다? – 리처드 서튼의 통찰
2025년 12월 9일
지금 우리가 열광하는 AI는 과연 ‘진짜 지능’일까요?
거대한 언어 모델들이 인간의 언어를 능숙하게 구사하고, 복잡한 문제도 척척 해결하는 시대입니다. OpenAI의 GPT 시리즈부터 구글의 제미나이(Gemini)까지, 우리는 경이로운 기술의 진보를 목격하고 있습니다. 하지만 AI 연구의 거장 리처드 서튼(Richard Sutton)은 이 모든 성공의 이면에 불편한 진실이 숨어 있다고 경고합니다. 그의 날카로운 시선은 현재 AI의 주류 방식을 정면으로 겨냥하고 있습니다.
3줄 요약
- AI 거장 리처드 서튼, 현재 AI의 주류인 지도/모방 학습은 ‘진정한 지능’과 거리가 멀다고 비판한다.
- 진정한 지능은 환경과의 능동적인 상호작용, 예측, 그리고 예측 오류를 통한 학습에서 비롯된다.
- 강화 학습(RL)이 인간과 유사한 일반 지능(AGI)을 향한 핵심 경로이며, ‘풍부한 학습에는 풍부한 과제’가 필수이다.
빅데이터 시대, AI 거장의 충격적 경고
리처드 서튼 교수는 AI 분야의 살아있는 전설이자 강화 학습(Reinforcement Learning, RL)의 아버지로 불리는 인물입니다. 그가 던진 메시지는 단순하지만 강력한 울림을 줍니다. **”풍부한 학습은 풍부한 과제(rich learning requires rich tasks)를 통해서만 가능하다”**는 것입니다.
그는 현재 AI의 압도적인 성공을 이끄는 지도 학습(Supervised Learning, SL)과 모방 학습(Imitation Learning, IL)이 근본적인 한계를 가지고 있다고 지적합니다. 방대한 데이터셋에서 패턴을 찾아 ‘곡선 맞춤(curve fitting)’을 하는 수준에 머무를 뿐, 스스로 세상을 이해하고 능동적으로 탐구하는 ‘진정한 지능’과는 거리가 멀다는 비판입니다.
우리가 착각하는 ‘지능’의 본질
서튼 교수의 주장은 현존하는 대부분의 강력한 AI, 특히 대규모 언어 모델(LLM)에 대한 근원적인 질문을 던집니다. GPT나 Gemini가 보여주는 놀라운 능력은 방대한 텍스트 데이터에서 확률적 패턴을 학습한 결과입니다. 이는 정교한 ‘모방’이자 ‘패턴 인식’일 뿐, 세상에 대한 능동적인 이해나 의사결정 능력은 아니라는 것입니다.
그는 지능의 본질을 **의사결정(decision-making)과 예측(prediction), 그리고 예측 오차를 통한 학습(learning from prediction errors)**으로 정의합니다. 즉, AI 에이전트가 직접 환경에 행동하고, 그 결과가 자신의 예측과 얼마나 다른지 학습하는 능동적인 과정이 필수라는 말입니다. 이 점에서 강화 학습이 진정한 지능으로 가는 유일한 길이라고 강조합니다.
서튼의 관점은 현 AI가 가진 ‘지식의 착시’를 꿰뚫는다. 우리는 LLM이 정답을 말하면 ‘이해했다’고 생각하지만, 이는 거대한 통계 모델이 가장 그럴듯한 다음 단어를 예측한 결과일 뿐이다. ‘생각’이 아닌 ‘계산’에 가깝다.
OpenAI와 Google, 그들의 AGI는 어디로 향하는가?
현재 AI 시장을 선도하는 OpenAI와 Google은 엄청난 규모의 모델과 데이터로 AGI(Artificial General Intelligence)를 목표로 합니다. 하지만 서튼 교수의 관점에서 보면, 이들의 접근 방식은 여전히 ‘수동적 학습’의 연장선상에 있습니다.
그들이 구축하는 모델들은 인간이 만든 데이터를 ‘소비’하며 학습합니다. 이는 AI가 스스로 탐험하고, 실패하며, 예상치 못한 상황에 대처하는 능력을 키우기 어렵게 만듭니다. **만약 AGI가 단순히 더 큰 데이터셋으로 학습된 ‘곡선 맞춤’의 정점이라면, 우리는 결코 인간과 같은 지능을 만들 수 없을 것입니다.** 진정한 AGI는 예측과 행동, 그리고 피드백을 통해 스스로 세상을 구축하는 능동적인 에이전트에서 나올 가능성이 크다는 뜻입니다.
미래 AI의 지도: 능동적 탐구와 강화 학습
서튼 교수의 통찰은 AI 연구의 방향성을 재정립할 필요성을 역설합니다. 이제 우리는 단순히 데이터를 퍼붓는 방식에서 벗어나, AI가 스스로 학습 대상을 선택하고, 환경과 능동적으로 상호작용하며 지식을 습득하는 방법을 모색해야 합니다. 이는 시뮬레이션 환경에서의 강화 학습, 그리고 실세계와의 상호작용을 통한 학습의 중요성을 더욱 부각시킵니다.
진정한 지능은 완벽한 데이터셋에서 오는 것이 아닙니다. 불확실하고 예측 불가능한 환경에서 끊임없이 시도하고, 예측하며, 오류로부터 배우는 과정에서 탄생합니다. 인간의 지능이 그러했듯이 말입니다. AI 연구 커뮤니티는 이러한 ‘능동적 탐구’에 더 많은 노력을 기울여야 할 때입니다.
마치며: AI의 다음 진화, 어디서 시작될까?
리처드 서튼 교수의 비판은 현재 AI 기술의 화려함 뒤에 가려진 근본적인 질문들을 우리에게 던집니다. 우리가 지금 바라보는 AI의 성공은 경이롭지만, 과연 이것이 지능의 궁극적인 형태일까요? 아니면 더 큰 패러다임 전환을 위한 하나의 과정일 뿐일까요?
강화 학습은 단순한 게임 플레이를 넘어 로봇 공학, 자율 주행, 심지어 과학 발견에 이르기까지 다양한 분야에서 능동적인 지능을 구현할 잠재력을 품고 있습니다. 진정한 지능을 향한 여정은 이제 시작되었으며, ‘풍부한 과제’를 통해 스스로 진화하는 AI 에이전트를 만드는 것이 그 핵심이 될 것입니다.
여러분은 현재의 AI가 ‘진정한 지능’으로 가고 있다고 생각하시나요? 아니면 서튼 교수의 견해에 동의하시나요? 댓글로 의견을 남겨주세요!
Comments
댓글 기능이 준비 중입니다. (Coming Soon)
곧 의견을 남기실 수 있습니다.