0003941761_001_20251118184221089.jpg?type=w800

미스트랄 AI./AFP 연합뉴스
최근 몇 년간 경쟁적으로 덩치를 키워 온 AI 모델 경쟁의 패러다임이 바뀌고 있다. 오픈AI나 구글 등 주요 빅테크는 더 많은 양의 데이터를 학습하고 처리하도록 수천억, 많게는 조(兆) 단위의 파라미터(매개변수)를 갖춘 AI 모델을 개발했다. AI가 학습과 추론할 때 연결해 주는 단위인 파라미터는 그 수가 많을수록 더 똑똑해진다. 하지만 거대 AI 모델을 개발하려면 막대한 비용이 들고, 효율성 측면에서도 불리해 점점 한계에 다다르고 있다. 이에 AI 스타트업들을 중심으로 작지만 강한 경량 AI 모델 경쟁이 본격 시작됐다. 통상 매개변수 1000억개 이하를 경량 AI 모델로 분류한다.


AI에 수많은 데이터를 학습시키려면 막대한 비용이 든다. AI 개발 초기만 해도 빅테크는 비용이 들더라도 거대한 AI 모델 개발 경쟁에 나섰다. 오픈AI의 GPT나 구글의 제미나이 등이 대표적인 거대 AI 모델이다. 모든 분야에 적용할 수 있는 일종의 범용 제품이라고 볼 수 있다. 그러나 거대 AI 모델은 개발 과정뿐 아니라 운영할 때에도 많은 전력 소모와 비용이 드는 것으로 알려졌다.

빅테크와의 경쟁에서 살아남기 위해 AI 스타트업들은 경량화된 AI 모델에 뛰어들었다. 모든 것을 다 잘하지 못하더라도 특정 분야에서는 다른 모델보다 월등히 뛰어난 모델이다. 예컨대 법률, 의료 등에 특화된 AI 모델들이다. 특히 경량 AI 모델은 구동하는 데 전력 소모가 적어 온디바이스 AI에 적합하다. 클라우드(가상 서버)와 연결 없이도 기기 내에서 작동한다는 장점도 있다.

프랑스 AI 스타트업인 미스트랄AI가 경량 AI 모델의 선두 주자다. 미스트랄AI는 ‘미스트랄 스몰 3.1’ ‘매지스트랄 1.2’ 등 경량화된 AI 모델을 잇따라 출시하고 있다. 미스트랄 스몰 3.1 모델 같은 경우 약 200억개의 매개변수로도 높은 성능을 내고, 클라우드 없이 애플의 컴퓨터 맥에서도 구동할 수 있다. 캐나다 AI 스타트업 코히어는 GPU(그래픽 처리 장치) 2개만을 사용해도 오픈AI의 GPT-4 모델을 뛰어넘는 성능을 보이는 것으로 알려졌다. 대규모 데이터센터가 필요 없어 비용 측면에서 유리한 것이다.

국내에서도 경량 AI 모델 경쟁이 치열하다. 노타는 AI 모델 경량화와 최적화 기술을 앞세운 회사다. 노타는 “AI 모델의 정확도는 유지하면서 크기와 연산량을 최소화하는 기술”이라고 했다. 업스테이지 ‘솔라 프로2’는 매개변수가 310억개 수준이지만, LLM 분석 기관 애널리시스 선정 세계 상위 20개 프런티어(선두) 모델로 선정됐다. 순위 내 대부분 모델은 매개변수가 1000억개가 넘는 거대 AI 모델들이었다. 모티프 역시 GPU 1개로 구동되는 경량 AI 모델을 개발했다.


미국과 AI 대결을 벌이는 중국은 경량 AI 모델로 미국을 추격하고 있다. 미국의 대중 제재로 AI 모델 학습과 운영에 필요한 GPU 확보가 어려운 중국으로서는 경량화가 중요한 과제다. 적은 GPU로도 좋은 성능의 AI를 구동할 수 있어야 하기 때문이다. 중국의 딥시크가 대표적인 경량 AI 모델 개발 기업이다. 중국 알리바바는 오픈AI에 대항해 ‘통이 딥리서치’라는 AI 에이전트(비서)를 공개했다. 300억 매개변수로 거대 AI 모델인 오픈AI의 성능에 필적한다고 알리바바는 주장한다.

주요 빅테크들도 후발 주자들의 추격에 대응하고 있다. 구글 딥마인드는 매개변수 2억7000만개의 초경량 AI 모델을 공개했다. 모바일 기기에 최적화된 모델이다. 오픈AI의 ‘gpt-oss-120B’와 ‘gpt-oss-20B’도 경량 모델이다. 삼성전자의 연구 조직 SAIT 캐나다 몬트리올 연구소도 매개변수 700만개의 초소형 추론 AI 모델을 공개했다. 테크 업계 관계자는 “적자에 시달리는 AI 개발 기업들이 결국 이익을 내기 위해서는 비용을 줄이고 효율을 높이는 것이 관건”이라며 “이를 위해 범용 제품보다는 가볍고 특정 업무를 잘하는 AI 모델을 잇따라 내놓고 있는 것”이라고 말했다.