[스냅드래곤X딥다이브] 퀄컴 무향실에서 본 차세대 오디오 AI
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다.
[샌디에이고(미국)=디지털데일리 김문기기자] 문이 닫히는 순간 공기가 바뀐다. 바닥과 벽, 천장까지 일정한 각도로 뻗은 회색 흡음재가 드러나면서 주변 소리가 급격히 사라진다.
퀄컴이 ‘스냅드래곤 X 시리즈’의 오디오 기술을 시험하는 이 무향실은 실내 소음을 10~15dB SPL 수준까지 떨어뜨린다. 숨소리도 들릴 만큼 조용한 이 공간에서 엔지니어들은 노트북이 만들어내는 소리 하나하나를 ‘처음부터 다시 듣는다’.
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다. AI PC 경쟁이 본격화되면서 오디오는 더 이상 부수적인 기능이 아니라 사용자 경험 전체를 가르는 요소로 부상했다. 노트북에서의 영상 통화, 게임 보이스챗, 음악 재생처럼 일상적인 기능은 대부분 오디오를 기반으로 한다. 퀄컴이 오디오 기술을 독립된 축으로 구축해온 이유도 여기에 있다는 설명이다.
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다.
◆ “목소리만 남기고 모두 지운다”
첫 번째 공간은 이날 행사의 백미였다. 스냅드래곤 X2 엘리트에 탑재된 ‘개인 음성 분리(Personal Voice Call)’ 기능이다.
데모는 실제 화상 연결을 통해 진행됐다. 옆방의 엔지니어 팀이 마이크를 켜고 동시에 여러 명이 큰 목소리로 대화를 시작하자 화면에서는 곧바로 ‘시장통’ 같은 소음이 들려왔다. 시연자는 “기능 OFF 상태”라고 설명했다.
이어 기능을 다시 켜자, 소리가 바뀌었다. 앞서 들리던 사람들의 대화는 거의 사라지고, 프로필로 지정된 화자의 목소리만 또렷이 남았다. 시연자는 “이 기능은 CPU도, NPU도 사용하지 않고 초저전력 센싱 허브와 마이크로-NPU만 사용한다”며 “수 밀리와트(mW) 수준의 전력으로 동작한다”고 설명했다.
여기서 중요한 차별점이 하나 드러난다. 대부분의 AI 기반 노이즈 억제 기술은 키보드 소음이나 자동차 경적같은 ‘소음’은 제거할 수 있어도, 다른 사람이 말하는 ‘목소리’는 분리하기 어렵다. 하지만 퀄컴 기술은 음악·소음·사람 목소리가 뒤섞인 환경에서 특정 사용자만 골라내 제거한다.
시연자는 감기 걸린 목소리, 흥분한 목소리, 평소보다 낮은 톤 등 다양한 변화를 직접 시연했다. 프로필을 다시 만들지 않아도 동일 인물의 음성으로 인식된다는 점이 인상적이었다.
그는 “기본 구조 자체가 전력 예산이 극도로 낮은 영역에서 돌아간다. 통화 시간이 길어지고, 노트북이 발열이나 전력 소모 걱정 없이 고품질 통화 환경을 유지할 수 있다"고 말했다.
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다.
◆ 키보드 울림까지 억제하는 알고리즘, 어쿠스틱 스피커 맥스
세 번째 데모는 스피커 품질을 개선하는 어크스틱 스피커 맥스(Aqstic Speaker Max)였다. 바스데브 노약(Vasudev Noyak) 퀄컴 엔지니어는 “노트북 스피커는 크기·진동·전력·응답 특성 등 모든 면에서 제약이 많은 장치”라며 알고리즘의 등장 배경을 설명했다.
특히 진동 억제(Vibration Noise Suppression) 데모가 인상 깊었다. 키보드 아래에 부착된 가속도 센서가 매우 민감하게 반응해, 음악 재생과 동시에 화면 그래프가 크게 흔들렸다. 진동 억제 OFF 상태에서는 음악과 함께 키보드 울리는 소리가 들렸고, ON으로 바꾸자 진동이 즉시 줄어들었다.
연구원이 “스피커가 왜곡될 타이밍을 실시간으로 예측해 그 순간에만 억제를 건다”고 설명하자 기자들의 관심은 더 높아졌다. 가혹한 제약 속에서 노트북 스피커의 물리적 한계를 최대한 보정하는 구조다. 이 기능은 X2 전용이 아니며, 스피커 앰프 제품군과 결합한 소프트웨어 솔루션으로 어디서든 적용할 수 있다는 점도 확인됐다.
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다.
◆ 무향실에서 시작된 ‘재현 가능한 오디오 품질’
안드레 셰브치우(Andre Schevciw) 퀄컴 어쿠스틱 시니어 디렉터는 무향실을 가리키며 “이 공간이야말로 우리가 신뢰할 수 있는 오디오 테스트의 출발점”이라고 말했다.
스피커가 꺼진 상태에서 무향실은 거의 무음에 가깝다. 하지만 스피커가 켜지면 최대 110~120dB SPL까지 정확하게 재현할 수 있는 환경이 된다. 센터 테이블에는 사람 모양의 헤드 앤 토르소 시뮬레이터(Head & Torso Simulator)가 놓여 있고, 머리 양옆에는 사람의 귓속 구조를 실제와 유사하게 구현한 바이노럴 마이크가 장착됐다.
그는 “우리는 여기서 팀즈(Teams), 줌(Zoom), 디스코드(Discord) 같은 화상 통화 품질도 테스트합니다. 공간 음향과 헤드 트래킹을 검증하기도 하고, 빛 변화까지 포함한 실제 사용 환경을 최대한 정밀하게 재현하죠.”
엔지니어의 설명대로 무향실은 단순한 테스트 룸이 아니라 ‘환경을 만드는 공간’이다. 완전 무반사 상태를 재현하거나, 필요하면 인위적 반사음을 만들어 실제 회의실처럼 들리게 하는 것도 가능하다. AI PC 시대의 오디오는 ‘좋은 마이크와 스피커를 갖추는 것’을 넘어 ‘환경까지 만들어낼 수 있어야 한다’는 점을 보여준다.
[샌디에이고(미국)=디지털데일리 김문기기자] 문이 닫히는 순간 공기가 바뀐다. 바닥과 벽, 천장까지 일정한 각도로 뻗은 회색 흡음재가 드러나면서 주변 소리가 급격히 사라진다.
퀄컴이 ‘스냅드래곤 X 시리즈’의 오디오 기술을 시험하는 이 무향실은 실내 소음을 10~15dB SPL 수준까지 떨어뜨린다. 숨소리도 들릴 만큼 조용한 이 공간에서 엔지니어들은 노트북이 만들어내는 소리 하나하나를 ‘처음부터 다시 듣는다’.
12일(현지시간) 퀄컴은 ‘스냅드래곤 X 시리즈 아키텍처 딥다이브 2025’ 행사 일환으로 미국 샌디에이고 퀄컴 본사에서 오디오 데모 세션을 진행했다. AI PC 경쟁이 본격화되면서 오디오는 더 이상 부수적인 기능이 아니라 사용자 경험 전체를 가르는 요소로 부상했다. 노트북에서의 영상 통화, 게임 보이스챗, 음악 재생처럼 일상적인 기능은 대부분 오디오를 기반으로 한다. 퀄컴이 오디오 기술을 독립된 축으로 구축해온 이유도 여기에 있다는 설명이다.
◆ “목소리만 남기고 모두 지운다”
첫 번째 공간은 이날 행사의 백미였다. 스냅드래곤 X2 엘리트에 탑재된 ‘개인 음성 분리(Personal Voice Call)’ 기능이다.
데모는 실제 화상 연결을 통해 진행됐다. 옆방의 엔지니어 팀이 마이크를 켜고 동시에 여러 명이 큰 목소리로 대화를 시작하자 화면에서는 곧바로 ‘시장통’ 같은 소음이 들려왔다. 시연자는 “기능 OFF 상태”라고 설명했다.
이어 기능을 다시 켜자, 소리가 바뀌었다. 앞서 들리던 사람들의 대화는 거의 사라지고, 프로필로 지정된 화자의 목소리만 또렷이 남았다. 시연자는 “이 기능은 CPU도, NPU도 사용하지 않고 초저전력 센싱 허브와 마이크로-NPU만 사용한다”며 “수 밀리와트(mW) 수준의 전력으로 동작한다”고 설명했다.
여기서 중요한 차별점이 하나 드러난다. 대부분의 AI 기반 노이즈 억제 기술은 키보드 소음이나 자동차 경적같은 ‘소음’은 제거할 수 있어도, 다른 사람이 말하는 ‘목소리’는 분리하기 어렵다. 하지만 퀄컴 기술은 음악·소음·사람 목소리가 뒤섞인 환경에서 특정 사용자만 골라내 제거한다.
시연자는 감기 걸린 목소리, 흥분한 목소리, 평소보다 낮은 톤 등 다양한 변화를 직접 시연했다. 프로필을 다시 만들지 않아도 동일 인물의 음성으로 인식된다는 점이 인상적이었다.
그는 “기본 구조 자체가 전력 예산이 극도로 낮은 영역에서 돌아간다. 통화 시간이 길어지고, 노트북이 발열이나 전력 소모 걱정 없이 고품질 통화 환경을 유지할 수 있다"고 말했다.
◆ 키보드 울림까지 억제하는 알고리즘, 어쿠스틱 스피커 맥스
세 번째 데모는 스피커 품질을 개선하는 어크스틱 스피커 맥스(Aqstic Speaker Max)였다. 바스데브 노약(Vasudev Noyak) 퀄컴 엔지니어는 “노트북 스피커는 크기·진동·전력·응답 특성 등 모든 면에서 제약이 많은 장치”라며 알고리즘의 등장 배경을 설명했다.
특히 진동 억제(Vibration Noise Suppression) 데모가 인상 깊었다. 키보드 아래에 부착된 가속도 센서가 매우 민감하게 반응해, 음악 재생과 동시에 화면 그래프가 크게 흔들렸다. 진동 억제 OFF 상태에서는 음악과 함께 키보드 울리는 소리가 들렸고, ON으로 바꾸자 진동이 즉시 줄어들었다.
연구원이 “스피커가 왜곡될 타이밍을 실시간으로 예측해 그 순간에만 억제를 건다”고 설명하자 기자들의 관심은 더 높아졌다. 가혹한 제약 속에서 노트북 스피커의 물리적 한계를 최대한 보정하는 구조다. 이 기능은 X2 전용이 아니며, 스피커 앰프 제품군과 결합한 소프트웨어 솔루션으로 어디서든 적용할 수 있다는 점도 확인됐다.
◆ 무향실에서 시작된 ‘재현 가능한 오디오 품질’
안드레 셰브치우(Andre Schevciw) 퀄컴 어쿠스틱 시니어 디렉터는 무향실을 가리키며 “이 공간이야말로 우리가 신뢰할 수 있는 오디오 테스트의 출발점”이라고 말했다.
스피커가 꺼진 상태에서 무향실은 거의 무음에 가깝다. 하지만 스피커가 켜지면 최대 110~120dB SPL까지 정확하게 재현할 수 있는 환경이 된다. 센터 테이블에는 사람 모양의 헤드 앤 토르소 시뮬레이터(Head & Torso Simulator)가 놓여 있고, 머리 양옆에는 사람의 귓속 구조를 실제와 유사하게 구현한 바이노럴 마이크가 장착됐다.
그는 “우리는 여기서 팀즈(Teams), 줌(Zoom), 디스코드(Discord) 같은 화상 통화 품질도 테스트합니다. 공간 음향과 헤드 트래킹을 검증하기도 하고, 빛 변화까지 포함한 실제 사용 환경을 최대한 정밀하게 재현하죠.”
엔지니어의 설명대로 무향실은 단순한 테스트 룸이 아니라 ‘환경을 만드는 공간’이다. 완전 무반사 상태를 재현하거나, 필요하면 인위적 반사음을 만들어 실제 회의실처럼 들리게 하는 것도 가능하다. AI PC 시대의 오디오는 ‘좋은 마이크와 스피커를 갖추는 것’을 넘어 ‘환경까지 만들어낼 수 있어야 한다’는 점을 보여준다.
댓글목록
등록된 댓글이 없습니다.