LG유플러스, 통화 중 AI 비서 ‘헤이 익시’ 공개... ‘보이스 투 보이스’로 3초 응답
‘익시오 2.0’ 출시… 구글 제미나이 2.5 플래시 라이브 적용 온디바이스 AI로 보안 강화·사용자 질문만 서버 전송 내년 후반 익시오 3.0은 초개인화 에이전트 계획
# 친구와 등산 계획을 논의하던 통화 중에 갑자기 인왕산 정상까지의 거리가 궁금해졌다. 통화를 끊고 검색할 필요 없이 인공지능(AI) 비서 익시를 호출해 “헤이 익시 경복궁역에서 인왕산 정상까지 얼마나 걸려?”라고 묻자 3초 만에 도보로 약 1시간 30분 걸립니다’라는 답이 돌아왔다.
LG유플러스가 13일 공개한 ‘익시오(ixi-O) AI 비서’의 시연 모습이다. 13일 서울 종로 센트로폴리스에서 열린 기자간담회에서 이재원 LG유플러스 컨슈머부문장(부사장)은 “익시오는 지난 1년간 고객에게 안심을 제공하며 AI의 실질적 가치를 증명해왔다”며 “이제는 고객의 시간을 아끼고 삶을 편하게 지원하는 맞춤형 AI로 더 빠르게 진화할 것”이라고 밝혔다.
익시오 AI 비서는 통화 중 ‘헤이 익시’ 음성 명령이나 버튼 터치로 즉시 호출할 수 있다. LG유플러스에 따르면 일평균 135만 명의 고객이 통화 화면을 이탈해 앱을 실행하거나 검색을 수행하고 화면을 캡처하거나 복사해 메신저로 공유한 뒤 통화 화면으로 복귀하는 패턴을 보였다. 이상협 CTO는 “통화가 끝나고 난 뒤에 검색한다는 것은 이제 옛말”이라며 “통화 중 AI 검색은 국내 통신사 중 최초라고 할 수 있다”고 강조했다.
통화 연결 상태에서 ‘헤이 익시’라고 AI를 호출하면 정보 검색 및 핵심 요약할 수 있다. 대답도 음성과 텍스트로 동시에 제공된다. 상대방에게도 이 정보가 즉시 공유될 수 있도록 들리게 했다. 또 통화 후에는 AI에 질문했던 내용과 답변이 그대로 남아 정보를 공유할 수 있다.
◇ ‘보이스 투 보이스’ 기술로 3초 AI 응답 가능
‘익시오 AI 비서’ 기술의 핵심은 ‘보이스 투 보이스(Voice to voice)’이다. 이를 위해 LG유플러스는 구글과 전략적 협력을 맺고 제미나이 2.5 플래시 라이브 모델을 적용했다. 이 모델은 초저지연 스트리밍 기술이 적용돼 음성 입력을 받는 동시에 실시간으로 처리하고 응답을 생성할 수 있다.
구글 모델을 통해 통화 중 응답 시간을 8초에서 3초로 단축할 수 있었다. 이상협 LG유플러스 CTO는 “기존에는 음성을 STT(Speech-to-Text) 기술을 통해 텍스트로 변환하고, LLM에서 처리한 뒤, 검색하고, 다시 TTS(Text-to-Speech) 기술을 통해 텍스트에서 음성으로 바꾸는 과정이 8초가 걸렸는데 너무 길다고 판단했다”며 “보이스를 보이스로 바로 바꿀 수 있는 제미나이 라이브 모델을 활용해 기존 8초에서 3초로 응답 시간을 단축했다”고 설명했다.
캐런 티오(Karen Teo) 구글 아시아태평양 플랫폼·디바이스 파트너십 부사장은 “AI 전환의 핵심 파트너로서 제미나이 API가 탑재된 익시오 출시는 전략적 협력을 보여주는 것”이라며 “익시오는 제미나이, 구글 드라이브, 구글 원 등이 결합된다”고 말했다.
LG유플러스는 오는 11월 중 구글과 통신 요금제도 출시할 계획이다. 구글 드라이브와 연계되는 번들 요금제로 기존 통신 요금제에 구글 서비스를 결합한 단독 요금제를 준비하고 있다.
다만 LG유플러스는 단일 LLM에 의존하지 않는다고 밝혔다. 최윤호 상무는 “익시오는 멀티 LLM 서비스”라며 “구글 제미나이 LLM만 쓰고 있는 건 아니며 통화 중 AI 비서 기능에서만 구글 모델을 쓰고 있다”고 설명했다.
이를 기반으로 B2B 사업도 연계할 계획이다. 또한 검색증강기술(RAG)을 활용해 직업군이나 산업 분야별 특화된 정보를 제공할 수 있다. 이재원 부사장은 “부동산, 보험 등 여러 가지 영업하시는 분들이 유용하게 쓰고 있다”며 “직업군이나 지역에 따라 세그먼트를 나눠 특화된 회의록을 제공할 계획”이라고 밝혔다.
나아가 글로벌 진출도 준비하고 있다. 현재 LG유플러스는 동남아시아 통신사들과 익시오 AI 비서 서비스 제공을 논의하고 있다. 이재원 부사장은 “소프트웨어를 클라우드 기반으로 제공하는 방식으로 사업 모델로 구체화하고 있다”며 “B2B와 글로벌 시장 모두 익시오의 기술력을 기반으로 사업 영역을 확장해 나갈 것”이라고 말했다.
익시오 AI 비서는 올해 말까지 베타 서비스로 운영된다. 일주일에 5회가 기본적으로 제공되며 하루 10회 무료 추가 지급도 가능하다. 내년 상반기에는 전체 익시오 사용자에게 오픈될 예정이다. 이재원 부사장은 “보안·신뢰에 대한 서비스들을 고객에게 별도로 과금을 한다거나 할 생각은 없다”며 “고객의 편의성과 생산성에 대해 과금 모델을 고민하고 있다”고 말했다.
◇ 온디바이스 AI로 프라이버시 보호
익시오 AI 비서는 ‘보이스 시큐어’ 아키텍처를 통해 프라이버시를 보호한다. 통화 내용은 서버에 전송하지 않고 AI 비서 호출 후 발화 내용만 AI 검색에 활용한다. 통화 내용은 디바이스에만 저장되고 검색 시에도 사용자의 질문만 서버로 전송된다. 예를 들어 “경복궁역에서 인왕산 정상까지 거리를 알려줘”라는 질문에서 경로 검색 의도와 ‘출발지-도착지’ 개체만을 추출해 제미나이로 보내 AI 검색 답변을 듣는 것이다. 이상협 CTO는 “학습을 위해서는 동의를 받고 있고, 통화 기록이 전송될 때 민감한 데이터는 마스킹 처리해서 올라간다”며 “질문에 대한 응답이 끝나면 서버에서는 질문 조차도 지우는 식으로 보안을 철저히 했다”고 말했다.
오는 12월 중으로 보안을 더욱 강화할 예정이다. 이상협 CTO는 “보안을 강화하기 위해 온디바이스에 저장되는 음성 통화 자체를 암호화해서 저장하는 기술을 12월 중 도입할 것”이라며 “음성 파일 자체를 암호화할 예정”이라고 밝혔다. 엔드-투-엔드 암호화를 적용해 디바이스에 저장되는 통화 내용까지 보호하겠다는 계획이다.
◇ 익시오 3.0 청사진 공개…‘초개인화’ AI 에이전트로
이날 LG유플러스는 향후 출시할 ‘익시오 3.0’의 청사진도 공개했다. 핵심 컨셉은 ‘나를 제일 잘 아는 비서 AI’다. 이를 위해 LG AI연구원이 개발한 엑사원(Exaone) 모델 기반의 관계 추론 소형언어모델(sLLM)을 적용할 예정이다.
LG유플러스는 지난해 11월 온디바이스 AI로 통화 내용을 요약해 주는 익시오 1.0를 출시했다. 이는 AI 기반 보이스 피싱 차단 기능인 ‘안티딥보이스’를 탑재했다. 이번에 발표한 통화 AI 비서 ‘익시’는 익시오 2.0 버전이다. 이상협 CTO는 “전통적인 통화 서비스는 연결에 집중했다면 지금은 관계에 집중하려고 한다”며 “개인을 넘어서 관계에 집중하는 단계로, 검색 이후 고객이 원하는 행동으로 이어질 수 있도록 하려고 한다”고 밝혔다.
익시오 3.0에는 ‘익시오 AI 빌더’도 도입된다. 사용자가 직접 자신만의 AI 에이전트를 만들 수 있는 기능이다. 이상협 CTO는 “설정 화면에서 AI 에이전트를 실행하고 추가하기를 통해 일정, 건강관리, 메일 등 기능을 넣을 수 있다”며 “통화를 분석해서 메일을 보내는 AI 기능을 넣고 싶다면, 통화 내용을 요약해 이메일로 보내는 나만의 AI 에이전트를 만들어 가질 수 있다”고 설명했다.
익시오 3.0은 내년 후반 이후 출시될 예정이다. 이재원 부사장은 “익시오 3.0은 협업과 제휴가 핵심”이라며 “초개인화된 AI, 설명 가능한 AI 검색, 그리고 실행으로 이어지는 협력이 필요하다”고 말했다. 이어 “개인 페르소나와 검색을 풍성하게 하려면 특정 분야에 대한 전문성이 필요하며 이를 위해 다양한 파트너십을 추진할 것”이라고 덧붙였다.