그들에게는 그것이 의미가 없었습니다. 그는 영어와 스페인어에 능통했고 매우 친절했으며 시스템 엔지니어링 전문가였습니다. 그는 왜 콜센터에서 일을 할 수 없었습니까?
그 친구는 그의 억양 때문에 많은 고객들이 그를 이해하기 어렵다고 말했습니다. 어떤 사람들은 그의 말투 때문에 모욕을 주기까지 했습니다.
세 학생은 문제가 친구들의 경험보다 더 크다는 것을 깨달았습니다. 그래서 그들은 그것을 해결하기 위해 스타트업을 세웠다.
이제 그들의 회사인 Sanas는 실시간으로 사람들의 억양을 변경하여 잘못된 의사 소통을 제거하는 것을 목표로 하는 AI 기반 소프트웨어를 테스트하고 있습니다. 예를 들어 필리핀의 콜센터 직원은 일반적으로 마이크에 대고 말할 수 있으며 상대방의 고객에게 KS의 사람처럼 보일 수 있습니다.
이 스타트업의 설립자들은 콜센터는 시작에 불과하다고 말합니다. 회사의 웹사이트는 그 계획을 “재창조된 이야기”라고 설명합니다.
궁극적으로 그들은 자신이 개발하는 앱에 대해 희망합니다. 그들은 다양한 산업과 개인에 의해 사용될 것입니다. 의사가 환자를 더 잘 이해하는 데 도움이 되거나 손자가 조부모를 더 잘 이해하는 데 도움이 될 수 있습니다.
CEO인 Maxim Serebryakov는 “우리는 Sanas에 대한 매우 큰 비전을 가지고 있습니다.
그리고 Serebryakov와 그의 공동 설립자들에게 이 프로젝트는 개인적인 것입니다.
당신은 사람들의 억양만큼 사람들의 목소리를 듣지 않습니다.
Sanas를 설립한 세 사람은 스탠포드 대학에서 만났지만 원래는 모두 다른 나라 출신입니다. 현재 CFO인 Andrés Pérez Sodiri는 베네수엘라 출신입니다. 그리고 현재 CTO인 Shun Zhang은 중국 출신입니다.
그들은 더 이상 스탠포드 학생이 아닙니다. Serebryakov와 Peres는 졸업했습니다. Chang은 Sanas를 되살리는 데 집중하기 위해 자리를 떴습니다.
그들은 작년에 회사를 설립했으며 “사람들을 하나로 모으려는 우리의 글로벌 사명과 열망을 강조하기 위해” 다른 언어로 쉽게 발음할 수 있는 이름을 부여했습니다.
수년에 걸쳐 세 사람 모두 방언이 방해가 될 수 있는 방법을 실험했다고 말합니다.
Serebryakov는 “우리는 모두 국제적 배경에서 왔습니다. 단지 당신이 말하는 방식 때문에 사람들이 당신을 어떻게 다르게 대하는지 직접 보았습니다.”라고 말합니다. “때로는 가슴이 아프다.”
Zhang은 20여 년 전에 중국에서 미국으로 온 그의 어머니가 창피함을 느끼기 때문에 함께 식료품 쇼핑을 갈 때 여전히 계산원과 이야기하게 한다고 말합니다.
“이것이 내가 Max와 Andres와 합류하여 이 회사를 설립하고 자신의 목소리가 억양만큼 들리지 않는다고 생각하는 사람들을 도우려는 이유 중 하나입니다.”라고 그는 말합니다.
세레브리야코프는 부모가 미국에 방문했을 때 호텔에서 어떻게 대우받는지, 즉 사람들이 자신의 억양을 들을 때 추측하는 방식을 본 적이 있다고 말합니다.
“그들은 조금 더 크게 말하고 행동을 바꿉니다.”
Perez는 영국 학교에 다니고 나서 미국에 도착했을 때 처음에는 미국 방언을 이해하는 데 어려움을 겪었다고 말합니다.
그리고 그의 아버지가 그의 가족이 크리스마스에 그에게 준 Amazon Alexa를 사용하려고 할 때 일어나는 일에 대해 시작하지 마십시오.
Perez는 “Alexa가 집안의 임의의 장소에서 조명을 켜고 분홍색으로 만들 때 Alexa가 아버지의 억양을 전혀 이해하지 못했다는 것을 빨리 알아냈습니다.”라고 말합니다.
콜센터는 기술을 시험하고 있다
이로 인해 사용자가 영어 발음을 연습하는 데 도움이 되는 앱 시장이 성장하고 있습니다. 그러나 Sanas는 AI를 사용하여 다른 접근 방식을 취하고 있습니다.
전제: 단어를 다르게 발음하는 법을 배우는 대신 기술이 대신 할 수 있습니다. 더 이상 악센트를 줄이기 위해 비용이 많이 들고 시간이 많이 소요되는 교육이 필요하지 않습니다. 그리고 이해는 거의 즉각적일 것입니다.
Serebryakov는 사람들의 방언과 정체성이 밀접하게 연결될 수 있다는 것을 알고 있으며 회사가 방언을 지우려고 하지 않거나 한 가지 방식이 다른 방식보다 낫다고 제안하지 않는다고 강조합니다.
“우리는 사람들이 직위를 차지하고 직업을 갖기 위해 말하는 방식을 바꾸지 않아도 되도록 합니다. 정체성과 방언은 매우 중요합니다. 그것들은 서로 얽혀 있습니다.”라고 그는 말합니다. “당신은 누군가가 누군가를 기쁘게 하기 위해 목소리를 바꾸는 것을 결코 원하지 않습니다.”
Sanas의 알고리즘은 현재 영어를 미국, 호주, 영국, 필리핀, 힌디어 및 스페인어 방언으로 변환할 수 있으며 팀은 더 추가할 계획입니다. 그들은 전문 배우의 오디오 녹음과 기타 데이터로 신경망을 훈련함으로써 시스템에 새로운 톤을 추가할 수 있습니다. 이 과정은 몇 주가 소요됩니다.
Sanas 팀은 두 번의 CNN 쇼를 했습니다. 하나는 인도 억양을 가진 남자가 일련의 문학적 문장을 읽는 소리가 들렸습니다. 다음과 같은 동일한 문구가 미국 방언으로 변환됩니다.
콜 센터 설정에서 더 일반적일 수 있는 문구의 또 다른 예입니다. 예를 들어 “성함과 주문 번호를 알려주시면 수정 작업을 시작할 수 있습니다.”
미국식 억양을 사용한 결과는 Siri 및 Alexa와 같은 가상 비서 음성처럼 다소 인공적이고 통합된 것처럼 들리지만 Perez는 팀이 기술을 개선하기 위해 노력하고 있다고 말합니다.
“음조는 바뀌지만 억양은 보존됩니다.”라고 그는 말합니다. “우리는 결과를 가능한 한 자연스럽고 감정적이며 흥미진진하게 만드는 방법을 계속 연구하고 있습니다.”
Perez는 이 기술을 시도한 콜 센터의 초기 피드백이 긍정적이었다고 말합니다. 따라서 프로젝트에 대한 소문이 퍼지면 웹 사이트에 의견을 제출하십시오.
스타트업 창업자는 어떻게 미래를 보는가
이를 통해 Sanas는 직원 수를 늘릴 수 있었습니다. 캘리포니아에 본사를 둔 Palo Alto의 직원 대부분은 다국적 배경에서 왔습니다. 이것은 우연이 아니라고 Serebryakov는 말합니다.
“우리가 만들고 있는 것은 우리가 고용한 사람들까지도 포함하여 많은 사람들의 공감을 얻었습니다. 보는 것은 정말 흥미진진합니다.”라고 그는 말합니다.
회사가 성장함에 따라 Sanas가 App Store에 나타나거나 가까운 휴대 전화에 나타나기까지 다소 시간이 걸릴 수 있습니다.
팀은 현재 가장 큰 콜센터 아웃소싱 회사와 협력하고 있으며 개별 사용자에 대해 더 느린 롤아웃을 선택하여 기술을 개선하고 보안을 보장할 수 있다고 말합니다.
그러나 그들은 결국 그것을 필요로 하는 모든 사람이 다른 분야에서도 그것을 사용하기를 희망합니다.
Perez는 사람들이 의사와 연결되도록 돕는 데 중요한 역할을 한다고 생각합니다.
그는 “시간 손실로 인한 오해나 잘못된 메시지로 인한 1초 손실은 매우 큰 영향을 미칠 것”이라고 말했다. “우리는 번역에서 손실이 없는지 확인하고 싶습니다.”
언젠가는 사람들이 언어를 배우고, 영화 더빙을 개선하고, 가정의 스마트 스피커와 자동차의 음성 비서가 다양한 방언을 이해하는 데 도움이 될 수 있다고 그는 말합니다.
그리고 영어뿐만 아니라 Sanas 팀은 알고리즘에 다른 언어를 추가하기를 희망합니다.
세 명의 설립자는 여전히 세부 사항에 대해 작업하고 있습니다. 그러나 이 기술이 미래에 연결성을 어떻게 향상시킬 수 있는지는 이해하기 쉬운 것이라고 그들은 말합니다.