
피차이 CEO “AI가 분위기도 파악”
구글이 18일(현지 시각) 제미나이 3을 출시했다./구글
“로마 여행 3일 일정 짜줘”
구글의 인공지능(AI) 모델인 ‘제미나이’에 이렇게 질문했더니, 곧바로 화면에 여행 일정과 함께 여행 경로가 표시된 지도, 가볼 만한 곳의 사진 등이 떴다. 이전에 웹 브라우저나 AI 챗봇에 이 같은 질문을 하면, 단순하게 숫자·글자로 이뤄진 답만 받을 수 있었지만 이제는 사진·그래프·표·시뮬레이션 화면 등을 활용해 답변해 주는 것이다. 이용자가 관심 있는 부분을 클릭해 더 많은 정보를 얻을 수도 있다.
이는 구글이 18일(현지 시각) 공개한 ‘제미나이 3′의 기능 일부이다. 구글은 이날 새로운 기능이 대거 추가된 ‘제미나이 3 프로(프로)’와 추론 기능을 강화한 ‘제미나이 3 딥싱크(딥싱크)′를 공개했다. 순다르 피차이 구글 최고경영자(CEO)는 “제미나이 3는 창의적인 아이디어 속 미묘한 단서를 포착하거나, 복잡한 문제를 풀어낼 수 있는 등 전례 없는 수준의 깊이와 뉘앙스를 이해할 수 있도록 설계됐다”며 “2년 만에 AI가 단순히 텍스트와 이미지를 읽는 데서 나아가 ‘분위기를 파악하는(reading the room)’ 수준으로 진화했다”고 밝혔다.
제미나이 3의 진화한 성능은 주요 AI 성능 평가 지표에서 드러난다. 프로는 AI 모델 평가 사이트 LM아레나(Arena) 리더 보드에서 1501점을 기록해 기존 1위였던 제미나이 2.5 프로를 제쳤다. 다른 도구의 도움을 전혀 받지 않고 치른 인간의 고난도 추론·문제 해결 능력 시험(Humanity’s Last Exam)에서 프로는 37.5%, 딥싱크는 41%를 기록했다. 기존 AI 모델들은 대부분 20%대이고 오픈AI의 GPT 5 프로가 30.7%를 기록한 바 있다. 박사급 지식을 측정하는 벤치마크(GPQA Diamond)에서도 프로는 91.9%, 딥싱크는 93.5%의 정답률을 보였고, 이미지와 텍스트가 혼합된 문제를 풀어 멀티모달 이해력을 평가하는 시험(MMMU-Pro)에서도 프로가 최고점인 81%를 기록했다.
제미나이는 텍스트 중심 AI에서 벗어나 이용자의 검색 의도에 맞춰 즉석에서 생성되는 시각 레이아웃, 대화형 도구, 시뮬레이션 같은 다양한 양식으로 정보를 제공하는 멀티모달 AI로 진화했다. 예를 들어 “반 고흐 작품을 전시하고 시대적 배경을 소개하는 반 고흐 갤러리를 만들어달라”고 요구하면 제미나이는 반 고흐 작품이 시대별로 정리돼 있고, 각각 배경 설명이 돼 있는 ‘디지털 갤러리’를 답변으로 제공한다. 이용자는 갤러리를 둘러보고, 작품들을 실제 클릭해보며 원하는 답을 탐색할 수 있다. “주택 담보대출을 알아보고 있다”고 하면 제미나이가 곧바로 맞춤형 대출 계산기를 생성해 두 가지 옵션을 나란히 비교하고, 어떤 선택이 장기적으로 비용을 더 절약할 수 있는지 시각적으로 보여준다.
제미나이는 복잡한 다단계 업무도 우선순위를 정해 처리해 주는 AI 에이전트로 진화했다. 이용자 물음에 수동적으로 답변만 하거나 “호텔 예약해 줘” 같은 간단한 지시를 처리해 주는 수준을 넘는다. 예를 들어 “이메일 내용을 참고해 다음 주 여행 때 이용할 중형 SUV를 하루 12만원 미만으로 예약해 줘”라는 복잡한 요청에도 순서에 맞춰 이행할 수 있다.
이런 기능은 구글 검색의 ‘AI 모드’에도 적용된다. 구글 측은 “서비스 출시 첫날부터 제미나이 모델을 검색에 적용하는 경우는 이번이 처음”이라며 “모든 사람에게 진정으로 유용한 AI를 만들겠다”고 했다.
“로마 여행 3일 일정 짜줘”
구글의 인공지능(AI) 모델인 ‘제미나이’에 이렇게 질문했더니, 곧바로 화면에 여행 일정과 함께 여행 경로가 표시된 지도, 가볼 만한 곳의 사진 등이 떴다. 이전에 웹 브라우저나 AI 챗봇에 이 같은 질문을 하면, 단순하게 숫자·글자로 이뤄진 답만 받을 수 있었지만 이제는 사진·그래프·표·시뮬레이션 화면 등을 활용해 답변해 주는 것이다. 이용자가 관심 있는 부분을 클릭해 더 많은 정보를 얻을 수도 있다.
이는 구글이 18일(현지 시각) 공개한 ‘제미나이 3′의 기능 일부이다. 구글은 이날 새로운 기능이 대거 추가된 ‘제미나이 3 프로(프로)’와 추론 기능을 강화한 ‘제미나이 3 딥싱크(딥싱크)′를 공개했다. 순다르 피차이 구글 최고경영자(CEO)는 “제미나이 3는 창의적인 아이디어 속 미묘한 단서를 포착하거나, 복잡한 문제를 풀어낼 수 있는 등 전례 없는 수준의 깊이와 뉘앙스를 이해할 수 있도록 설계됐다”며 “2년 만에 AI가 단순히 텍스트와 이미지를 읽는 데서 나아가 ‘분위기를 파악하는(reading the room)’ 수준으로 진화했다”고 밝혔다.
제미나이 3의 진화한 성능은 주요 AI 성능 평가 지표에서 드러난다. 프로는 AI 모델 평가 사이트 LM아레나(Arena) 리더 보드에서 1501점을 기록해 기존 1위였던 제미나이 2.5 프로를 제쳤다. 다른 도구의 도움을 전혀 받지 않고 치른 인간의 고난도 추론·문제 해결 능력 시험(Humanity’s Last Exam)에서 프로는 37.5%, 딥싱크는 41%를 기록했다. 기존 AI 모델들은 대부분 20%대이고 오픈AI의 GPT 5 프로가 30.7%를 기록한 바 있다. 박사급 지식을 측정하는 벤치마크(GPQA Diamond)에서도 프로는 91.9%, 딥싱크는 93.5%의 정답률을 보였고, 이미지와 텍스트가 혼합된 문제를 풀어 멀티모달 이해력을 평가하는 시험(MMMU-Pro)에서도 프로가 최고점인 81%를 기록했다.
제미나이는 텍스트 중심 AI에서 벗어나 이용자의 검색 의도에 맞춰 즉석에서 생성되는 시각 레이아웃, 대화형 도구, 시뮬레이션 같은 다양한 양식으로 정보를 제공하는 멀티모달 AI로 진화했다. 예를 들어 “반 고흐 작품을 전시하고 시대적 배경을 소개하는 반 고흐 갤러리를 만들어달라”고 요구하면 제미나이는 반 고흐 작품이 시대별로 정리돼 있고, 각각 배경 설명이 돼 있는 ‘디지털 갤러리’를 답변으로 제공한다. 이용자는 갤러리를 둘러보고, 작품들을 실제 클릭해보며 원하는 답을 탐색할 수 있다. “주택 담보대출을 알아보고 있다”고 하면 제미나이가 곧바로 맞춤형 대출 계산기를 생성해 두 가지 옵션을 나란히 비교하고, 어떤 선택이 장기적으로 비용을 더 절약할 수 있는지 시각적으로 보여준다.
제미나이는 복잡한 다단계 업무도 우선순위를 정해 처리해 주는 AI 에이전트로 진화했다. 이용자 물음에 수동적으로 답변만 하거나 “호텔 예약해 줘” 같은 간단한 지시를 처리해 주는 수준을 넘는다. 예를 들어 “이메일 내용을 참고해 다음 주 여행 때 이용할 중형 SUV를 하루 12만원 미만으로 예약해 줘”라는 복잡한 요청에도 순서에 맞춰 이행할 수 있다.
이런 기능은 구글 검색의 ‘AI 모드’에도 적용된다. 구글 측은 “서비스 출시 첫날부터 제미나이 모델을 검색에 적용하는 경우는 이번이 처음”이라며 “모든 사람에게 진정으로 유용한 AI를 만들겠다”고 했다.
댓글목록
등록된 댓글이 없습니다.