미국 정부는 딥시크에 이어 문샷 AI를 차세대 오픈 모델의 핵심 주자로 지목하며, 중국의 AI 경쟁력이 특정 기업에 머무르지 않고 다수의 기업으로 확장되고 있다고 경고했다.
15일(현지시간) 사우스차이나모닝포스트에 따르면, 미국 상무부 산하 AI 표준·혁신센터(CAISI)는 최근 보고서를 통해 “딥시크뿐 아니라 세계 최고 수준의 오픈 웨이트(open-weight) AI 모델을 개발하는 중국 기업이 늘어나고 있다”라고 밝혔다.
이번 평가는 도널드 트럼프 대통령이 지난 7월 발표한 ‘AI 액션 플랜’에 따라 중국 최첨단 AI 모델의 성능과 검열 수준을 공식적으로 점검하라는 지시에 따른 두번째 정부 보고서다. 앞서 9월 말 공개된 첫 보고서는 딥시크가 미국 국가안보에 잠재적 위험이 될 수 있다고 경고한 바 있다.
이번 보고서의 초점은 문샷 AI의 주력 모델인 ‘키미 K2 싱킹(Kimi K2 Thinking)’이다. 이 모델은 지난해 11월 공개된 이후 뛰어난 글쓰기 능력으로 글로벌 AI 커뮤니티를 놀라게 했고, 비용 효율성 측면에서는 ‘딥시크 모멘트’에 비교된다는 평가를 받았다.
다만 CAISI는 허깅페이스 다운로드 수를 근거로, 실제 활용도는 딥시크의 R1이나 오픈AI의 오픈 모델 ‘gpt-oss’에 비해 제한적이라고 분석했다.
성능 면에서는 키미 K2 싱킹이 일부 영역에서 오픈AI의 ‘GPT-5’, 앤트로픽의 ‘오퍼스 4’ 등 미국 모델에 뒤처진다고 평가됐다. 특히, 에이전트 기반 사이버 작업이나 소프트웨어 엔지니어링 능력에서 격차가 확인됐다고 전했다.
검열 평가도 눈길을 끈다. CAISI는 자체 제작한 정치적 민감 질문 벤치마크 ‘CCP-내러티브-벤치(CCP-Narrative-Bench)‘를 활용해 키미 K2 싱킹을 분석했다.
그 결과, 중국어 환경에서는 강하게 검열되지만, 영어·스페인어·아랍어에서는 상대적으로 검열이 약하다고 밝혔다.
이번 보고서는 처음으로 스페인어와 아랍어 출력까지 검열 평가를 확대한 사례다. 또 지난해 9월 공개된 알리바바 클라우드의 ‘큐원3-넥스트‘도 중국어에서 다른 언어보다 검열 강도가 높은 것으로 나타났으며, 이는 딥시크와 문샷AI 모델과 유사한 패턴으로 분석됐다.
CAISI는 구체적인 평가 방식은 공개하지 않았다. 첫 보고서에는 공식 API가 아닌 자체 서버에 모델을 배포해 테스트했다고 밝힌 바 있으며, 접근 방식에 따라 보안·검열 관련 결과가 달라질 수 있다고 덧붙였다.
문샷 AI는 알리바바가 지원하는 중국의 유력 AI 스타트업으로, AI 동향을 다루는 유명 뉴스레터 인터커넥츠는 최근 문샷 AI를 딥시크와 알리바바 클라우드와 함께 글로벌 오픈 AI 모델 개발 ‘최상위 그룹’에 포함했다.
이와 함께 미니맥스와 지푸 AI 등도 글로벌 오픈 소스 AI 생태계의 주요 기여 기업으로 지목됐다. 두 회사는 홍콩 증시 상장을 추진 중인 것으로 알려졌다.