코히어, 검색 정확도 높인 ai 에이전트용 모델 ‘리랭크 4’ 공개 - ai타임스

기업 전문 인공지능(AI) 스타트업 코히어(Cohere)가 검색 정확도를 크게 끌어올리고 AI 에이전트의 효율을 극대화할 최신 검색 모델 '리랭크 4(Rerank 4)'를 공개했다. 특히, 컨텍스트 창을 3.5 버전에 비해 4배 확장한 것이 특징이다

코히어는 11일(현지시간) 검색 모델 최신 버전인 ‘리랭크 4 패스트(Fast)’와 ‘리랭크 4 프로(Pro)’를 공개했다. ‘리랭크(Rerank) 3.5’를 공개한 지 약 1년 만이다.

패스트는 비교적 작은 모델로, 속도와 정확도가 모두 중요한 전자상거래, 프로그래밍, 고객 지원과 같은 실시간 응답 중심의 활용 사례에 적합하다는 설명이다.

프로는 더 깊은 추론과 정밀한 분석이 필요한 리스크 모델(Risk Model) 생성, 데이터 분석 등 고난도 업무에 최적화됐다.

리랭크 4는 컨텍스트 창이 3만2000토큰으로, 리랭크 3.5보다 4배 확대됐다. 이를 통해 긴 문서를 처리하고 여러 문단을 동시에 평가하며, 짧은 컨텍스트에서는 놓치기 쉬운 문서 간 관계까지 포착할 수 있다는 설명이다.

코히어는 올해 들어 기업 환경에서 엔터프라이즈 검색의 중요성이 크게 커졌다고 설명했다. AI 에이전트가 조직 내부의 방대한 정보와 맥락에 접근해야 하는 상황이 늘어나면서, 단순한 검색 결과를 정제하는 리랭커(reranker)가 핵심 기능으로 떠올랐다는 것이다.

리랭크 4는 쿼리와 문서를 함께 처리하는 ‘크로스 인코더(cross-encoder)’ 아키텍처를 활용해, 벡터 기반 임베딩 방식에서 발생하는 미묘한 의미 차이 문제를 보완한다. 이를 통해 쿼리와 후보 문서 간의 미세한 의미적 관계를 포착하고, 가장 관련성 높은 결과를 상위에 노출한다.

리랭크 4를 금융·헬스케어·제조 분야의 다양한 작업에서 ‘큐원 리랭커(Qwen Reranker) 8B’ ‘엘라스틱 리서치 지나 리랭크(Jina Rerank) v3’ ‘몽고DB 보이지 리랭크(MongoDB Voyage Rerank) 2.5’ 등과 비교 평가했다. 그 결과, 경쟁 모델과 대등하거나 일부 영역에서는 앞서는 성능을 보였다.

또 이전 버전의 강점이었던 다국어 지원도 유지·강화됐다. 리랭크 4는 100개 이상의 언어를 이해하며, 주요 비즈니스 언어 10종에 대해서는 최상위 수준의 검색 성능을 제공한다.

가장 큰 차별점은 자가학습(self-learning) 기능이다. 리랭크 4는 라벨링한 데이터를 추가하지 않아도, 사용자가 선호하는 콘텐츠 유형이나 문서 코퍼스를 알려주면 이를 학습해 검색 품질을 개선한다. 이는 사용자의 선호를 기억하는 최신 파운데이션 모델과 유사한 접근이다.

특히 리랭크 4 패스트에 자가학습을 적용하면, 더 큰 모델에 맞먹는 정밀도를 확보할 수 있어 경량 모델의 경쟁력을 크게 끌어올릴 수 있다. 의료 데이터셋을 활용한 실험에서도, 자가학습을 활성화했을 때 새로운 검색 도메인 전반에서 일관된 성능 향상이 확인됐다.

리랭크 4는 코히어의 에이전트형 AI 플랫폼 ‘노스(North)’의 핵심 구성 요소로, 기존의 하이브리드·벡터·키워드 기반 검색 시스템에 최소한의 코드 변경만으로 통합할 수 있다.

코히어는 “에이전트형 AI에서는 복잡한 다단계 상호작용으로 인해 모델 호출 횟수와 컨텍스트 사용량이 급증할 수 있다”라며, 리랭크 4가 저품질 정보를 사전에 걸러내 토큰 사용량과 재시도 횟수를 줄인다고 강조했다.

리랭크 4는 코히어 플랫폼, 아마존 세이지메이커 AI, 마이크로소프트 파운드리에서 사용할 수 있으며, 곧 추가 플랫폼을 지원할 예정이다.

리랭크는 처음 알았는데, 에이전트나 RAG에서 꽤 중요한 역할을 하네요. 특히 자가학습으로 도메인에 맞게 검색 품질을 끌어올리는 점이 인상적입니다. 모델 성능 경쟁만큼, 이제는 검색·정렬 같은 보조 레이어의 완성도가 체감 품질을 좌우하는 것 같아요.