0005592400_001_20251119010108910.jpg?type=w800

추론·코딩·데이터 처리 등
전 영역서 성능 대폭 강화
주요 지표서 경쟁모델 앞서




구글이 18일(현지시간) 새 인공지능(AI) 모델 '제미나이(Gemini) 3'를 전격 공개했다.

공개와 동시에 검색, 애플리케이션(앱), 개발 도구 전반에 적용되는 제미나이 3는 기존 모델인 2.5 프로 대비 추론 능력과 코딩, 멀티모달(문자·이미지·영상·PDF 등 복합 입력) 이해력이 크게 향상됐다는 평가다. 구글은 제미나이 3에 대해 "가장 지능적인 모델이자 검색 경험의 세대교체"라고 규정하며 챗GPT와 클로드 같은 경쟁 모델과의 정면 승부에 나섰다.

구글에 따르면 제미나이 3는 인간의 고난도 사고력을 평가하는 '휴머니티 라스트 이그잼(HLE)'에서 37.5%를 기록해 GPT-5(25%)와 클로드 소넷 4.5(13.7%)를 앞섰다. 대학원 수준의 과학·수학 문제 해결력을 측정하는 'GPQA 다이아몬드' 평가에서도 91.9%를 받아 GPT-5(89.4%)와 클로드 소넷 4.5(75.4%)보다 높은 점수를 받았다. 사용자 평가 기반 글로벌 언어모델 비교 플랫폼 'LM 아레나'에서는 1501점을 기록해 제미나이 2.5 프로보다 50점 이상 높았다. 경쟁 모델은 1450~1470점대에 머문 것으로 나타났다. 구글은 "추론과 분석 정확도에서 가장 큰 폭의 개선이 이뤄졌다"고 설명했다.

구글은 제미나이 3의 멀티모달 처리 능력이 전 세대보다 크게 강화됐다고 강조했다. 사용자가 학술 논문 PDF를 올리면 모델이 내용을 파악해 주요 개념을 3차원(3D)으로 시각화한 인터랙티브 앱 형태로 자동 생성하는 기능이 대표적이다.

코딩 성능도 대폭 개선됐다. 웹 개발 성능을 평가하는 '웹데브 아레나'에서 제미나이 2.5 프로보다 88점 높았으며, 경쟁 모델보다도 우위에 있는 것으로 전해졌다. 단일 지시만으로 3D 시뮬레이션, 게임, 데이터 시각화 도구를 자동 제작하는 '바이브 코딩' 기능도 새롭게 탑재됐다.

일반 사용자를 위한 기능도 대폭 손질됐다. 제미나이 앱에는 시각 중심 답변을 구성하는 '비주얼 레이아웃'과 요청에 따라 화면 구성을 실시간으로 만들고 바꿔주는 '다이내믹 뷰'가 적용된다. 검색에서는 긴 질문이 입력되면 제미나이 3가 이를 하위 질문으로 나눠 조사해 여행 일정표나 대출 계산기처럼 직접 눌러보고 값을 넣어볼 수 있는 결과 화면을 자동으로 만들어준다.

구글은 제미나이의 월간 활성 사용자가 이미 6억5000만명을 넘어섰다고 밝혔다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO)는 "제미나이 3는 구글이 만든 가장 강력한 에이전틱 모델이자 코딩 모델"이라며 "범용 AI(AGI)를 향한 또 하나의 큰 걸음을 내디뎠다"고 평가했다. 순다르 피차이 구글 CEO도 "AI는 텍스트나 이미지를 읽는 수준에서 상황을 파악하고 눈치 보는 AI로 발전했다"며 "제미나이 3는 지금까지 나온 모든 기능을 결합한 가장 지능적인 모델"이라고 강조했다.

[실리콘밸리 원호섭 특파원]