베가레이서2 (VEGA Racer2) 음성인식 개발 스토리
+ Category : VEGA 시리즈 + Date : 2012. 6. 15. 15:25 + Author : 스카이 베가+ URL : http://skyvega.tistory.com/199
안녕하세요 VEGA Brand Editor 1기 기경진입니다.
혹시 베가 레이서 2 광고를 보신 적 있으신가요? 훈훈한 외모의 모델 안재현씨가 등장해서인지 저는 TV에서
광고가 나올 때 마다 절로 고개가 돌아가는데요~ 카메라, 촬영, 업로드 이 세 마디밖에 하지 않았는데 왜 이렇게
제 마음을 흔드시는 건지! 알고 보니 이 마음은 저만 그런 것이 아닌지, 추천 검색어에 “베가 레이서 2 광고”
보다 “베가 레이서 2 광고 모델”이 먼저 뜨더라고요~
짧지만 강렬한 인상을 남기는 이 광고에서처럼! 베가 레이서 2의 가장 큰 특징이 바로 이 대화형 음성 인식
서비스입니다. 애플이 ‘시리Siri’를 도입해서 영어권 사용자들을 열광케 했다면, 베가 레이서 2의 ‘스마트 보이스’
는 한국 사용자들을 위해 초점을 맞췄다고 할 수 있답니다.
한국말에 강한 스마트 보이스
사실 음성 인식에 가장 중요한 것은 “얼마나 훌륭한 음성 DB가 뒷받침 되는가?” 입니다. 억양, 발음 등 사람마다
제각각 같은 말을 다르게 말하기도 하고, 이런 맥락에선 어떤 단어가 사용될까? 등을 마치 ‘사람’처럼 인식해야
하기 때문입니다. 때문에 이 한국어 인식을 위해 모은 음성 DB가 얼마나 풍부하게 음성 데이터를 가지고 있는지,
얼마나 우수한 퀄리티의 음성 데이터를 가지고 있느냐에 따라 인식률이 달라지게 됩니다.
이처럼 음성 DB의 중요성 때문에, 팬택의 ‘스마트 보이스’ 역시 음성 인식에 관한 데이터를 훌륭하게 수집해 온
기술을 기반으로 서비스를 제공하고 있는데요. 팬택의 음성 인식 기능은 아쉽게도 한국 기업이 아닌 미국의
‘블링고Vlingo’ 라는 기업의 기술입니다. 블링고는 한국어 뿐만 아니라, 세계 여러 나라의 언어에 대한 다양하고
폭 넓은 데이터를 가지고 있는 기업인데요. 이번 컨텐츠에서는 실제로 이 블링고라는 기업과 함께 팬택의
스마트 보이스를 위해 애쓰신 UX팀의 최지은 과장님과 함께 이야기를 나눠보았습니다 :D
Q 안녕하세요 :D 간단히 자기 소개 부탁 드립니다.
최지은 과장 안녕하세요. UX 프로젝트 리더를 담당하고 있는 최지은입니다. 이번에 출시된 베가 레이서 2
모델을 진행했습니다.
Q 이번에 광고에도 나올 정도로 인상 깊은 점이 바로 “스마트 보이스" 기능인데요.
핵심 포인트를 말씀해 주세요
최지은 과장 무엇보다 가장 중요한 점은 한국어를 지원한다는 점이겠지요. 물론 시간이 지나면 다른 회사의
모델들도 한국어 지원을 점차 늘려가겠지만, 빨리 안정화된 기능을 사용자에게 제공할 수 있는 것이 베가 레이서
2의 목표였습니다. 이 전에도 마켓에서 음성으로 명령어를 지원하는 경우도 있었지만, 제한적인 기능만 제공
하거나, 영어만 지원하는 경우가 많았습니다. “스마트 보이스"에는 한글을 잘 인식할 수 있도록 한글 최적화
작업을 진행한 점이 가장 큰 강점이라고 할 수 있습니다.
Q 한글화 작업 외에도, 카메라 앱에서 “하나 둘 셋"을 외치면 사진을 찍는다든지, 사진을 찍고 나면
바로 업로드가 가능한 것처럼 자연스러운 시나리오도 인상적인 것 같습니다.
최지은 과장 네. 물론 음성으로 기능을 실행하는 “스마트 보이스"가 핵심이지만, 음성인식을 보다 자유롭게
사용 할 수 있도록 개발했다고나 할까요. 음성인식이 편리할 상황에서는 최대한 자연스럽게 사용할 수 있도록
개발되어 있습니다. 흔히 NUI라고 말하는 Natural UI, 즉 자연스러운 사용자 경험의 관점에서 음성 인식이 될
수 있도록 진행했기 때문인데요. 비단 “스마트 보이스" 어플리케이션만을 음성 인식으로 구분한 것이 아니라,
“스마트 보이스"를 통해 카메라 어플리케이션을 불러오면, 촬영과 업로드도 음성으로 사용하려 하지 않을까?
하는 사용자의 자연스러운 경험에 더 포커스를 두었다고 할 수 있습니다.
Q 정말 사용자의 관점을 많이 고려한 것 같습니다. 작업에 독특한 에피소드가 있었나요?
최지은 과장 기존의 베가 유저들의 타겟에 맞게 UI 환경을 구성해야 하는데, “스마트 보이스"같은 경우에는
말이 가장 사용자들에게 많이 어필하는 부분이었습니다. 때문에 “스마트 보이스"에서 나오는 말투, 성격 등이
이 UI 환경에 굉장히 중요한데요. 그냥 여자 성우의 목소리 같지만, 실제로는 다양한 리서치가 반영된 결과입니다.
같은 단어를 인지하는데에는 여자 목소리가 더 쉽게 인지되기 때문에 여자 목소리가 반영되었고, 정보를 알려주는
것이 중요한 역할이기 때문에 유사한 직업군을 가진 사람들의 말투를 가지고 있는 것이 중요했습니다. 이렇게
종합하여 말씀 드리면 하나의 캐릭터로 표현되지만, 실제로는 리서치부터 설정, 구체화 등 까지 다양한 프로세스
를 밟아가며 진행해야 한답니다.
Q 스마트 보이스 개발에서 가장 어려웠던 점은 무엇이었나요?
최지은 과장 음성 인식 자체는 이미 오랫동안 음성 인식을 진행해온 솔루션 업체와 함께 일해야 하는 작업입니
다. 때문에 이 솔루션을 사용해서, “스마트 보이스"의 컨셉에 맞게 최적화 하는 작업 자체가 쉽지 않았습니다.
여러 부서, 여러 사람, 기존의 솔루션의 방식 등 굉장히 많은 사람들의 협업이 필요하기 때문에, 이 사이에서
커뮤니케이션을 돕는 일이 가장 어려웠습니다. 실제로 새로운 기능들을 개발 진행하면서 동시에 새로운 “스마트
보이스"도 진행해야 했기 때문에, 새 기능들과 연동되는 스마트 보이스의 품질을 안정화 하는데도 어려움이
많았습니다.
Q 점점 발전하는 것이 이 음성 인식 기술의 장점이라고 하는데, 어떻게 업그레이드 되는 것인가요?
최지은 과장 새로운 어플리케이션을 계속 설치해야 하는 것이 아니라, 이 음성 인식을 분석하는 서비스가 스스로
성장한다고 보면 됩니다. 음성인식 서비스를 사용하면 사용할 수록 데이터 베이스에 더 다양한 내용들이 쌓이고,
이를 통해 인식률이 높아지는 것 뿐만이 아니라 다양한 상황의 다양한 표현도 배우게 됩니다. 천천히 자라는
어린 아이처럼요. 때문에 시간이 지날 수록 다양한 말투나 표현, 패턴들을 자연스럽게 쓸 수 있게 될 것 입니다.
<베가레이서2 음성 인식 기능 개발을 담당한 UX팀 최지은 연구원>
Q 마지막으로 스마트 보이스를 사용하거나, 사용하고 싶은 독자들에게 하실 말씀이 있으신지요?
최지은 과장 음성인식이라는 것은 사실 앞으로도 계속 사용할 일종의 컨트롤 방식입니다. 한 번만 사용 후
끝나는 것이 아니라, 앞으로 모든 형태의 기술을 사용하는데 풍부하게 발전해 갈 수 있는 새로운 ‘범위'라고
생각하는 것이 맞을 것 같습니다. 공상과학 영화에서나 나왔던 손을 이용한 기능들도 사실 이전의 모션 인식
부터 앞으로 차근차근 발전해 나갈 기능이라고 할 수 있겠죠. 때문에 지금의 스마트 보이스가 마지막이라고 생각
하지 않습니다. 좀 더 자연스럽게 활용할 수 있는 방법은 점차 발달시키게 될 것입니다. 이런 새로운 기능들이,
미디어나 상상을 통해 기대했던 것들을 점차 실현해 가는 과정이 아닐까요? :D
*본 글은 기술전략본부 기술전략실 UX팀 기경진 연구원님이 VEGA를 위해 기고한 글입니다.
'VEGA 시리즈' 카테고리의 다른 글
[기능 리뷰] 베가레이서2 효도폰 모드? 심플모드 괜찮네~ (2) | 2012.06.18 |
---|---|
VEGA RACER2 음성인식 사용법 (3) | 2012.06.15 |
베가레이서2 (VEGA Racer2) 음성인식 개발 스토리 (1) | 2012.06.15 |
음성인식 기술과 스마트 보이스 (10) | 2012.06.12 |
베가레이서2의 특별한 깨알 같은 기능 소개 (4) | 2012.06.11 |
VEGA의 카메라는 진화한다 – 더욱 업그레이드 된 베가레이서2의 카메라 기능 (4) | 2012.06.07 |
제가 중1인데 커서 베가 디자인 팀으로 들어가고 싶어요,그럼 지금부터 무슨 일으해야해요?