오픈AI가 지난 주 출시된 'GPT-5.2’를 기반으로 하는 첨단 코딩 모델 'GPT-5.2-코덱스(Codex)'를 공개했다. 소프트웨어 엔지니어링 성능은 물론, 사이버 보안 기능이 강화됐다는 점을 강조했다.
오픈AI는 18일(현지시간) GPT-5.2-코덱스를 출시하며, "복잡하고 실제적인 소프트웨어 엔지니어링을 위한 가장 진보된 에이전트 코딩 모델"이라고 소개했다. 이날부터 유료 챗GPT 사용자를 위해 모든 코덱스 플랫폼을 통해 서비스되며, 몇주 안에 API로도 제공할 예정이다.
전체 컨텍스트를 유지하면서 장시간 세션 동안 대규모 저장소에서 작업하는 능력이 향상됐다고 밝혔다.
또 대규모 리팩토링, 코드 마이그레이션과 기능 빌드와 같은 복잡한 코드 변경 작업을 안정적으로 완료할 수 있으며, 계획이 변경되거나 시도가 실패하더라도 추적을 잃지 않고 지속적으로 반복 작업을 수행할 수 있다고 설명했다. 윈도우 환경에서도 성능이 개선됐다고 덧붙였다.
여기에 향상된 이미지 처리 성능 덕분에 스크린샷과 기술 다이어그램, 차트, UI 화면 등을 더 정확하게 해석할 수 있다고 전했다. 이를 통해 디자인 목업을 작동 가능한 프로토타입으로 빠르게 변환할 수 있다는 것이다.
특히, 지금까지 출시된 어떤 모델보다 강력한 사이버 보안 기능을 갖추고 있다는 점을 강조했다.
오픈AI는 "정보 분야에서 모델이 지속적으로 발전함에 따라, 이런 개선 사항이 사이버 보안과 같은 전문 영역에서도 역량 향상으로 이어지는 것을 확인했다"라고 소개했다.
실제로, 지난주에는 프리비(PrivY)의 보안 연구원들이 이전 버전인 'GPT-5.1-코덱스-맥스’와 '코덱스 CLI’를 활용, 일주일 만에 리액트(React)의 알려지지 않은 취약점 3가지를 발견하고 공개했다고 밝혔다.
GPT-5.1-코덱스-맥스로 소프트웨어 취약점을 발견한 과정 (사진-오픈AI)
이처럼 모델의 보안 능력은 'GPT-5-코덱스’부터 급격히 향상됐고, GPT-5.1-코덱스-맥스에서 또 한번 크게 향상됐으며, 이제 GPT-5.2-코덱스에서 세번째 도약을 이뤘다고 설명했다.
아직 ‘높음(High)’ 수준의 사이버 역량에는 도달하지 않았지만, 앞으로 출시될 모델도 이런 추세를 이어갈 것으로 예상했다.
오픈AI는 이처럼 모델의 사이버 보안 기능 향상으로 '방어 능력’도 발전했지만, 이를 오용할 가능성도 커졌다고 밝혔다. 이에 따라 안전 관리 프레임 워크를 통해 위험을 관리하고 있다고 강조했다.
복잡하고 실제적인 소프트웨어 이슈 해결 능력을 평가하는 'SWE-벤치 프로’와 터미널 환경에서 다양한 작업에 대한 에이전트 성능을 테스트하는 '터미널-벤치 2.0’에서 각각 56.4%와 64%를 기록, 기존 최고 기록을 달성했던 GPT-5.2를 모두 넘어섰다.
이중 터미널-벤치 2.0 성적은 구글의 '제미나이 3 프로(54.2%)'와 앤트로픽의 '클로드 오퍼스 4.5(59.3%)'를 능가한다.
한편, 오픈AI는 사이버 방어를 위한 파일럿 프로그램도 시작한다고 밝혔다. 모델의 사이버 공격 기능을 제한적으로 실시, 각 조직의 방어 능력을 향상하기 위한 것이다.
오픈AI는 "이 모델은 고급 AI가 실제 소프트웨어 엔지니어링과 사이버 보안과 같은 전문 분야 지원의 한 단계 진전을 나타낸다"라며 "보안 커뮤니티와 긴밀히 협력, 오용 위험을 최소화하며 방어 효과를 극대화할 것"이라고 밝혔다.
AI가 발전할수록 항상 같이 따라오는 게 보안 문제였는데, 아예 보안 기능을 강화한 코딩 모델을 내놓은 게 인상적이네요. 아직은 고위험 사이버 공격을 직접 수행할 수준은 아니라고 하지만, 앞으로 나올 모델들에서는 보안을 중요한 축으로 계속 가져가겠다는 신호로 보입니다. AI가 코드를 더 많이 맡게 될수록 이런 방향성은 필수일 것 같아요.