
중국 인공지능(AI) 스타트업 문샷AI가 최근 공개한 AI 모델이 글로벌 IT업계 관심을 모으고 있다. 적은 비용으로 오픈AI의 최신형 모델을 뛰어넘는 성능을 구현해서다. 지난 1월 전 세계를 놀라게 한 ‘딥시크 쇼크’ 이후 중국발(發) ‘가성비(가격 대비 성능) AI’ 혁명이 본격화하고 있다는 평가가 나온다.
박경민 기자 17일 IT업계에 따르면 문샷AI가 최근 공개한 오픈소스 대형언어모델(LLM) ‘키미 K2 씽킹’(Kimi K2 Thinking)은 주요 국제 벤치마크 평가에서 오픈AI의 ‘GPT-5’와 엔스로픽의 ‘클로드 소네트 4.5’ 등 미국 AI 기업 모델보다 더 높은 점수를 받은 것으로 나타났다. 특정 분야에서 인간 전문가의 수행능력과 얼마나 근접한지 평가하는 HLE(인간 수준 평가) 테스트에서 키미 K2 씽킹은 44.9점을 받았다. 같은 조건에서 평가한 GPT-5(41.7점), 클로드 소네트 4.5(32점), 딥시크의 V3.2(20.3점)보다 더 좋은 결과다. 웹 검색 능력을 평가하는 ‘브라우즈콤프’에서도 키미 K2 씽킹은 60.2점으로 GPT-5(54.9점), 클로드 소네트 4.5(24.1점), V3.2(40.1점)보다 높은 점수를 받았다. 다만 코딩 능력을 평가하는 SWE 벤치마크에서는 GPT-5와 클로드 소네트 4.5에 미치지 못하는 점수를 받았다.
키미 K2 씽킹이 주목받는 이유는 이 모델을 훈련하는 데 투입된 비용 때문이다. 문샷AI는 정확한 모델 학습 비용을 공개하지는 않았지만, 미국 경제 전문 매체 CNBC는 최근 소식통을 인용해 460만 달러(약 67억원) 수준 비용이 투입됐다고 보도했다. 이는 수십억 달러 규모로 추정되는 오픈AI의 모델 훈련 비용과 비교하면 크게 적은 금액이다. 가성비 AI 원조격인 딥시크의 모델 훈련 비용(560만 달러)보다도 적다. 업계 한 관계자는 “딥시크는 미국 AI 모델보다 훨씬 적은 금액으로 그들과 비슷한 성능의 AI 모델을 처음으로 만들었다는 데서 충격이 컸다”며 “이번 문샷AI 모델은 일부 영역이지만, 오픈AI 모델의 성능을 뛰어넘었다는 데 주목하고 있다”고 말했다.
중국 AI 기업들은 미국의 최신 그래픽처리장치(GPU) 통제에 대응하기 위해 강력한 ‘가성비’ 모델을 구축하는 데 집중하고 있다. 키미 K2 씽킹 역시 이를 위해 AI 모델의 성능을 결정하는 파라미터(매개변수)의 수는 1조개에 달하지만, 특정 작업을 수행할 때 모든 파라미터를 쓰지 않고 필요한 일부만 사용하는 구조(MoE 아키텍처)를 구축해 비용을 줄였다. GPU 사용을 통한 훈련 비용을 낮추기 위해서다. 값비싼 GPU를 대량으로 확보하지 않더라도 고성능 AI 모델을 개발할 수 있다는 걸 중국 기업들이 실전에서 증명하고 있다는 측면에서 놀랄 만한 결과라는 평가다. 국내 AI 스타트업 한 개발자는 “키미 K2 씽킹은 딥시크 기술을 계승해 성능을 더욱 개선한 것”이라며 “개념적으로는 알려진 기술들이지만, 실제 구현하기는 힘들다는 점에서 국내 개발자들도 이들이 공개한 오픈소스를 참고하고 있다”고 말했다.
다만 벤치마크 점수가 높다고 글로벌 AI 생태계 주도권을 쥘 수 있는 건 아니라는 평가도 있다. 한 미국 AI 기업 한국지사 관계자는 “시험을 잘 보는 것과 실제 현장에서 일을 잘하는 것이 다르듯 벤치마크는 참고용일 뿐”이라며 “미국 본사에서도 중국 AI 모델에 대한 위협을 크게 느끼는 분위기는 아니고 이용자들의 활용을 높이는 데 집중하는 추세”라고 말했다.
키미 K2 씽킹이 주목받는 이유는 이 모델을 훈련하는 데 투입된 비용 때문이다. 문샷AI는 정확한 모델 학습 비용을 공개하지는 않았지만, 미국 경제 전문 매체 CNBC는 최근 소식통을 인용해 460만 달러(약 67억원) 수준 비용이 투입됐다고 보도했다. 이는 수십억 달러 규모로 추정되는 오픈AI의 모델 훈련 비용과 비교하면 크게 적은 금액이다. 가성비 AI 원조격인 딥시크의 모델 훈련 비용(560만 달러)보다도 적다. 업계 한 관계자는 “딥시크는 미국 AI 모델보다 훨씬 적은 금액으로 그들과 비슷한 성능의 AI 모델을 처음으로 만들었다는 데서 충격이 컸다”며 “이번 문샷AI 모델은 일부 영역이지만, 오픈AI 모델의 성능을 뛰어넘었다는 데 주목하고 있다”고 말했다.
중국 AI 기업들은 미국의 최신 그래픽처리장치(GPU) 통제에 대응하기 위해 강력한 ‘가성비’ 모델을 구축하는 데 집중하고 있다. 키미 K2 씽킹 역시 이를 위해 AI 모델의 성능을 결정하는 파라미터(매개변수)의 수는 1조개에 달하지만, 특정 작업을 수행할 때 모든 파라미터를 쓰지 않고 필요한 일부만 사용하는 구조(MoE 아키텍처)를 구축해 비용을 줄였다. GPU 사용을 통한 훈련 비용을 낮추기 위해서다. 값비싼 GPU를 대량으로 확보하지 않더라도 고성능 AI 모델을 개발할 수 있다는 걸 중국 기업들이 실전에서 증명하고 있다는 측면에서 놀랄 만한 결과라는 평가다. 국내 AI 스타트업 한 개발자는 “키미 K2 씽킹은 딥시크 기술을 계승해 성능을 더욱 개선한 것”이라며 “개념적으로는 알려진 기술들이지만, 실제 구현하기는 힘들다는 점에서 국내 개발자들도 이들이 공개한 오픈소스를 참고하고 있다”고 말했다.
다만 벤치마크 점수가 높다고 글로벌 AI 생태계 주도권을 쥘 수 있는 건 아니라는 평가도 있다. 한 미국 AI 기업 한국지사 관계자는 “시험을 잘 보는 것과 실제 현장에서 일을 잘하는 것이 다르듯 벤치마크는 참고용일 뿐”이라며 “미국 본사에서도 중국 AI 모델에 대한 위협을 크게 느끼는 분위기는 아니고 이용자들의 활용을 높이는 데 집중하는 추세”라고 말했다.
댓글목록
등록된 댓글이 없습니다.