[1월13일] 앤트로픽의 코딩 능력이 오픈ai의 agi 야망을 위협하는 이유 - ai타임스

디 인포메이션은 12일(현지시간) 칼럼을 통해 앤트로픽의 최근 상승세가 심상치 않다고 소개했습니다.

지난 몇주간 기술 전문가들 사이에서 '클로드 코드’에 대한 기대감은 폭발적으로 늘어났는데, 이는 단순히 코드를 짜주는 수준을 넘어섰기 때문입니다.

지난 11월 출시한 '클로드 오퍼스 4.5’로 인해 제품의 안정성이 크게 향상된 데다, 지난 9일에는 ‘클로드 코드 v2.1.0’ 업데이트를 통해 자율적으로 소프트웨어를 구축하고 AI 에이전트를 구동하며 다양한 컴퓨터 작업을 수행할 수 있는 개발 환경을 강화했기 때문입니다.

또 이런 열풍은 엔지니어에 국한되지 않는다는 것입니다. 비기술직 직원들도 클로드 코드를 이용해 직접 고객 데이터 분석용 대시보드를 구축하는 등 작업을 수행하고 있습니다. 이는 기존의 ‘커서’ 같은 도구들을 중심으로 한 바이브 코딩 수준을 넘어선다는 것입니다. 이제 클로드 코드는 소프트웨어 개발의 전 영역을 아우르는 독립적인 생태계로 진화하고 있다고 강조했습니다.

앤트로픽은 이미 연간 90억달러의 수익(ARR)을 창출하고 있습니다. 구글과 같은 경쟁사 엔지니어들조차 X와 레딧에서 찬사를 보낼 만큼 제품력이 압도적입니다. 최근 4개월 만에 두배 몸값으로 100억달러 규모의 추가 투자 유치에 성공한 원인도 여기에 있습니다.

여기에서 중요한 것은 AI 코딩이 소프트웨어 개발의 진입 장벽을 낮춰 수조달러 규모의 시장을 창출한다는 점 때문만은 아닙니다.

한 연구원의 설명처럼 코딩 자동화는 단순히 개발 진입 장벽을 낮추는 수준을 넘어, 'AI 연구의 자동화’를 가능케 합니다. 수만개의 연구 실험을 동시에 실행하고 코드로 검증할 수 있다면, AI가 스스로 다음 단계의 AI를 설계하는 속도는 상상할 수 없을 만큼 빨라집니다.

그리고 이는 오픈AI가 오랫동안 꿈꿔왔던 인공일반지능(AGI) 구현의 핵심 로드맵이기도 합니다. 오픈AI는 2028년까지 고도화된 AI 연구원을 구축하겠다고 밝혔지만, 정작 그 이정표를 실현할 코딩 기술의 주도권은 앤트로픽이 주도하는 모양새라는 것입니다.

코딩 자동화가 AGI로 가는 지름길이자 핵심으로 불리는 이유는, 단순히 인간 개발자의 일을 돕는 수준을 넘어 AI가 자신을 개선하는 '재귀적 자기 개선(Recursive Self-Improvement)'의 루프를 완성하기 때문입니다.

이는 지난 2018년 논문에서 등장한 용어로, AI가 자체 연구를 수행해 더 정교한 AI 시스템을 만드는 피드백 루프를 말합니다. 구글 딥마인드는 지난해 4월 보고서를 통해 2030년까지 AGI가 등장할 수 있으며, 이 때문에 인류가 치명적인 위기를 맞을 수 있다고 경고한 바 있습니다. 그리고 그 근거로 '재귀적 AI 개선(recursive AI improvement)'을 들었습니다. 즉, AI가 AI를 만들면 위험해진다는 내용입니다.

그리고 앤트로픽이 보여주는 기술 발전이 바로 이를 가능하게 만든다는 것입니다. 즉, AI가 앞으로 모든 것을 코딩화로 검증할 수 있다는 내용입니다.

우선 현실 세계의 논리를 ‘디지털 검증’ 영역으로 소환할 수 있습니다.

과거의 AI 연구는 사람이 가설을 세우고 코드를 짜고 실험 결과를 기다린 뒤 분석하는 과정을 거쳤습니다. 하지만 이제 모든 물리적 법칙, 경제 모델, 심지어 생물학적 구조까지 코드(Software-defined everything)로 시뮬레이션됩니다.

현실 문제를 코드로 추상화하면, AI는 '가상 실험실’에서 수만개의 변수를 동시에 통제하며 실험할 수 있는 ‘디지털 트윈’ 환경을 갖추게 됩니다.

그리고 코드는 실행했을 때 성공 아니면 실패라는 명확한 답을 줍니다. 이 명확한 피드백 루프가 AI의 학습 속도를 인간이 따라올 수 없는 수준으로 끌어올릴 수 있습니다.

이런 코딩 자동화가 완성되면 AI 연구 자체가 하나의 거대한 소프트웨어 파이프라인이 됩니다. 즉, AI 연구자가 "이런 신경망 구조가 더 효율적일 것 같다"라고 말하면, 클로드 코드 같은 에이전트가 즉시 그 구조를 설계하고 학습 코드를 작성한 뒤 클라우드 서버에서 실험을 돌리고 결과 보고서까지 제출합니다.

인간 연구자는 한번에 한두개의 실험에 집중하지만, 자동화된 시스템은 수천개의 서로 다른 모델 구조를 동시에 테스트하고 그중 가장 뛰어난 코드만 골라 다음 세대 AI의 설계도로 채택합니다. 이것이 바로 오픈AI와 앤트로픽이 노리는 'AI 연구원’의 실체라는 분석입니다. ‘AI가 AI를 설계하는’ 연구 자동화를 가속하는 것입니다.

현실의 복잡한 논리를 코드로 시뮬레이션해 논리적 무결성을 확보한다면, 지금까지 LLM의 한계로 지적됐던 부분도 해결됩니다. 이제까지 AI의 언어 출력은 거짓말인지 확인하기 어렵지만, 코드로 답을 내놓으면 컴파일러(Compiler)가 그 논리적 결함을 즉시 잡아낼 수 있습니다. 이는 환각 현상을 줄이는 데에도 크게 기여할 수 있습니다.

실제로 이런 시도는 이미 시작됐습니다. 지난해 6월에는 MIT 연구진이 파이썬 프로그램을 생성하고 실행해 자연어, 수학 및 데이터 분석, 기호 추론 작업을 해결할 수 있도록 하는 방법을 소개한 바 있습니다.

일반적으로 AI 모델은 자연어만 사용해 정보를 처리하고 쿼리에 응답하기 때문에, 수치나 기호적 추론이 필요한 작업을 수행하기 어려울 수 있습니다. 예를 들어 미국 역대 대통령의 생일을 알려줄 수는 있지만, 반대로 "1950년 이후에 선출된 미국 대통령 중 월요일에 태어난 사람은 누구인가"라는 질문에 취약합니다.

MIT가 개발한 NLEP는 LLM이 간단한 파이썬 프로그램을 생성하도록 유도, 파이썬 인터프리터가 생성된 코드를 실행한 다음 답을 자연어로 출력하도록 만드는 방식입니다.

이는 일부 모델에 이미 도입된 것으로 알려져 있습니다. LLM 답변을 검증하는 '정제 루프(Refinement Loop)'에도 이런 방식이 활용되고 있습니다.

코레이 카부쿠오글루 구글 딥마인드 최고 기술책임자(CTO)도 최근 인터뷰에서 "제미나이 3에 질문하면, 모델은 시뮬레이션이나 위젯 등 간단한 프로그램을 작성하기로 한다"라며 "모델이 이런 것들을 스스로 결정하는 것으로, 이는 모델의 코딩과 에이전트 기능 덕분"이라고 말했습니다.

이처럼 자연어를 검증 가능한 코드로 변환하는 것은 LLM의 문제 해결을 넘어, AI 연구의 자동화와 다른 과학 분야의 발전을 이끌 수 있습니다.

나아가 AI가 스스로 코드를 짜고, 그 코드가 맞는지 스스로 검증하며, 그 결과물을 바탕으로 다시 자신의 지능을 높이는 코드를 짜는 순간 우리는 그것을 AGI의 기점이라고 부르게 될 것입니다.

이런 흐름이 이어지면, 어느 순간 차세대 모델의 핵심 알고리즘을 AI가 직접 코딩했다는 발표가 등장할지 모릅니다. 결국 코딩을 잘하는 AI는 단순히 개발자를 대체하는 존재가 아니라, 스스로 지능을 업그레이드할 수 있는 능력을 갖춘 AI가 된다는 내용입니다.

아직은 SF 같은 이야기로 들릴지 모르지만, 이는 이미 진행 중인 일입니다. 그래서 앤트로픽의 코딩 능력 향상에 큰 관심이 모이는 것입니다. 또 앤트로픽이 최근 xAI의 클로드 코드 사용을 금지한 것이 어떤 이유에서인지를 엿볼 수 있게 합니다.

인포메이션은 "전반적으로 클로드 코드의 부상은 앤트로픽의 제품뿐만 아니라, 전체 AI 산업에 긍정적인 영향을 미칠 것으로 예상된다"라고 강조했습니다.