이 결과를 보면 아직은 국내 모델이 따라가야 할 거리가 꽤 남아 있는 단계라는 게 분명해 보이네요. 단순 질의응답이나 도구 호출은 어느 정도 따라왔지만, 여러 일을 엮어서 계획을 세우고 끝까지 밀어붙이는 에이전트형 사고력에서는 빅테크와 차이가 크게 느껴집니다.
이 결과를 보면 아직은 국내 모델이 따라가야 할 거리가 꽤 남아 있는 단계라는 게 분명해 보이네요. 단순 질의응답이나 도구 호출은 어느 정도 따라왔지만, 여러 일을 엮어서 계획을 세우고 끝까지 밀어붙이는 에이전트형 사고력에서는 빅테크와 차이가 크게 느껴집니다.