코레이 카부쿠오글루 구글 딥마인드 최고 기술책임자(CTO)가 7일(현지시간) 파이낸셜 타임스와 인터뷰를 진행했습니다.
그는 데미스 허사비스 CEO와 딥마인드를 초기부터 이끌어 온 핵심 인물로, 딥러닝 분야의 개척자 중 한명으로 꼽힙니다. '알파고’와 ‘알파폴드’ 개발에 관여했으며, 최근에는 '제미나이’와 '젬마’의 개발을 지휘했습니다. 또 마크 저커버그 메타 CEO가 슈퍼인텔리전스 랩(MSL) 수장으로 영입하려고 했다가 실패할 정도로, 구글 AI의 핵심으로 꼽힙니다.
구글은 그를 지난해 6월 '최고 AI 아키텍트(Chief AI Architect)'에 임명했습니다. 이를 통해 일반적으로 구분된 모델 개발과 제품화를 총괄하게 됐습니다. 그의 비중이 어느 정도인지 가늠할 수 있는 부분입니다.
그리고 그 결과는 대성공으로 드러났습니다. 그는 11월 ‘제미나이 3’ 출시 이후 팟캐스트 등에 몇차례 등장해 성능 향상 비결을 밝힌 바 있는데, 이날 인터뷰에서도 이런 점이 강조됐습니다.
우선 "사전 학습은 주로 아키텍처 개선에 중점을 둔다. 이를 통해 더 효율적인 아키텍처를 구축하고, 학습에 사용되는 데이터를 훨씬 더 잘 이해할 수 있게 된다. 우리는 성능을 상당히 향상했고, 이에 매우 만족한다"라고 말했습니다.
이는 이전에도 알려졌던 바와 일치합니다. 사전 훈련을 통한 성능 향상이 벽에 부딪혔다는 것을 제미나이 3가 반박했다는 내용입니다. 이번에는 구체적으로 '아키텍처의 개선’이라고 설명했습니다.
어떤 방식을 도입했는지는 자세하세 설명하지 않았습니다만, 아직도 대형언어모델(LLM)의 아키텍처는 아직 개선의 여지가 많다는 것을 보여줍니다. 이 때문에 'LLM으로는 인공일반지능(AGI)에 도달할 수 없다’라는 얀 르쿤 AMI 랩 창립자의 말에 구글은 동의하지 않는 것입니다. LLM의 한계는 있겠지만, 아직 여기에 도달한 것은 아니라는 것입니다.
또 "사전 학습은 모델을 통해 데이터의 잠재력을 발휘할 수 있도록 해준다. 모델을 통해 데이터는 단순히 정보만을 포착하는 것이 아니라, 그 잠재력까지도 파악할 수 있게 된다"라며 "이런 잠재력이 제품에 반영되는 방식은 사후 학습을 통해 이루어지는데, 이 과정에서 모델은 사용자와 상호작용하는 방법을 학습하게 된다"라고 전했습니다.
즉, 데이터 학습은 단순한 AI의 암기 과정이 아니라, 데이터에 내재된 패턴과 규칙 등을 통해 모델이 스스로 무언가를 창조하고 추론할 수 있는 능력을 배양하는 과정이라는 말입니다. 그리고 이런 능력을 발휘해 사용자의 질의에 창조적으로 답변하는 능력을 갖춘다는 내용입니다.
그 예로, 카부쿠오글루 CTO는 제미나이 3가 질의에 맞춰 답을 내기 위해 모델 내부에서 스스로 코딩하는 능력을 갖췄다고 설명했습니다. "질문하면, 모델은 시뮬레이션이나 위젯 등 간단한 프로그램을 작성하기로 한다"라며 "모델이 이런 것들을 스스로 결정하는 것으로, 이는 모델의 코딩과 에이전트 기능 덕분"이라고 전했습니다.
이는 이전에도 강조됐던 것으로, 제미나이 3의 가장 중요한 성장 영역으로 꼽힙니다. 제미나이 3가 이전 모델과 가장 다른 점은 바로 '에이전트 능력으로 스스로 코딩할 수 있다는 것’입니다.
이전처럼 답변을 자연어로 출력하기에 앞서, 모델 내부에서 이를 검증할 수 있는 시뮬레이션이나 프로그램을 만드는 것이 가능하다고 판단하면 이를 실행한다는 것입니다. 이를 통해 맞춤형 인터렉티브 도구나 시뮬레이터, 계산기 등을 코딩, 이를 통해 답변을 검증하고 정확도를 높인다는 말입니다.
어찌 보면 월드 모델과 흡사한 역할을 하는 것으로 볼 수 있습니다. 월드 모델은 현실과 흡사한 환경을 구축하고, 여기에 모델의 답변을 에이전트가 액션으로 시뮬레이션하며 가상 세계에서 어떤 결과로 이어질지를 검증합니다. 제미나이 3는 월드 모델 대신, 간단한 검증 도구를 만드는 것입니다.
그는 "이 모든 것들이 사전 교육 단계와 사후 교육 단계, 그리고 회사 전체에 걸쳐 하나로 통합되면서 가능해졌다"라고 덧붙였습니다. 이는 구글이 진정한 풀 스택 강점을 갖췄다는 점을 강조하는 말입니다.
그의 발언은 최근 모델의 '정제(Refinement)'가 왜 주요 이슈가 됐는지를 보여줍니다. 정제란 LLM이 생성한 답을 모델 내부에서 비판하고 수정하고 검증하며 정확도를 높이는 과정입니다.
이는 오픈AI와 구글이 지난해 국제수학올림피아드 등에서 금메달을 획득하는 데에도 활용한 것으로 알려지며 화제가 됐습니다. 구글은 이를 활용한 ‘딥 싱크’ 모델을 출시했습니다. 이 모델은 현존 모델 중 가장 뛰어난 성능을 자랑합니다. 대신 엄청난 컴퓨팅이 필요해, 최고급 요금제에서만 사용할 수 있습니다.
이처럼 카부쿠오글루 CTO는 제미나이 3의 가장 흥미로운 성장으로 '에이전트 동작(Agentic Actions)'을 꼽았습니다. 여기에 "코드는 디지털 세계에서 일어나는 모든 것의 기반이며, 코딩 능력을 통해 모델은 아이디어를 현실로 가져오는 능력을 갖게 된다"라고 설명했습니다. 그 결과로 제미나이 3는 도구 호출과 함수 호출 능력이 크게 향상됐다고 강조했습니다.
이를 위해 필요한 모델의 능력은 멀티모달과 코딩입니다. 멀티모달은 이미 구글이 가장 강한 분야입니다. 또 그는 "코딩은 소프트웨어 엔지니어만을 위한 것이 아니다. 코딩은 점점 AI 학습의 한 분야가 되고 있다"라고 말했습니다.
AGI에 대해서는 "딥마인드의 궁극적인 목표이며, 인간의 능력과 지능을 뛰어넘는 AGI 구축이 목표"라고 선언했습니다. 그리고 AGI는 순수한 학술 연구가 아니라, "제품을 통해, 사용자와 연결하며, 세상과 함께하는 공동 노력"이라고 설명했습니다.
이에 따라 모델의 발전 척도는 벤치마크 점수가 아니라, "실제 세계에서 과학자, 학생, 변호사, 엔지니어 등 다양한 사용자가 모델을 활용하여 가치를 창출하는 것"이라고 강조했습니다.
그의 이런 발언은 2026년초 가장 두드러진 트렌드인 '실행하는 AI’와 연구 방향에 큰 영향을 미친 것으로 볼 수 있습니다. 또 뉴립스에서 떠오른 ‘AI 근본 원리로의 회귀 (Return to Fundamentals)’, 즉 대형언어모델(LLM)과 스케일링의 한계를 넘는 근본적인 AI의 연구가 필요하다는 흐름과 일치합니다.
이처럼 제미나이 3는 시간이 지나며 전체 AI 업계에 큰 영향을 미친 것이 점점 드러나고 있습니다.
그리고 오픈AI는 이미 이를 파악, 제미나이 3 출시 직전부터 새 모델 개발을 시작한 것으로 알려졌습니다. 이달 중 그 결과가 나올 것으로 보입니다.
오픈AI가 내놓을 차기 모델이 어떤 형태이고 어떤 성능을 보일지에 관심이 모입니다. 이는 앞으로 AI 모델이 어떻게 진화할지를 보여주는 잣대가 될 수도 있기 때문입니다.