지난 해에는 텍스트 프롬프트를 사용하여 이미지, 예술 작품 또는 비디오를 만들 수 있는 인공 지능(AI) 도구가 등장했습니다.

또한 앞으로 큰 발전을 이루었습니다. AI 타이핑OpenAI의 ChatGPT 사용 광범위한 흥분을 일으켰습니다. – 그리고 두려움 – 글쓰기의 미래에 대한.

이제 2023년을 며칠 앞두고 또 다른 강력한 AI 사용 사례가 주목받고 있습니다. 바로 사람의 목소리를 정확하게 시뮬레이션할 수 있는 텍스트 음성 변환 도구입니다.

마이크로소프트가 개발한 VALL-E는 3초 동안 사람의 목소리를 녹음하고, 그 목소리를 반복하고, 텍스트의 맥락에 따라 사실적인 어조와 감정으로 쓰여진 단어를 음성으로 변환할 수 있습니다.

60,000시간의 영어 음성 녹음 교육을 받은 그는 “무의미한 상황”에서 연설을 할 수 있습니다.

VALL-E를 소개합니다 코넬 대학교에서 발행한 논문개발자들은 녹음 데이터가 7,000명 이상의 고유한 화자로 구성되어 있다고 설명했습니다.

팀은 TTS(텍스트 음성 변환) 시스템이 기존 텍스트 음성 변환 시스템보다 수백 배 더 많은 데이터를 사용하여 미결제 문제를 극복하는 데 도움이 되었다고 말합니다.

이 도구는 현재 공개적으로 사용할 수 없지만 누군가의 목소리에서 나오는 모든 텍스트를 생성하는 데 실질적으로 사용될 수 있다는 점에서 안전성에 대한 의문을 제기합니다.

Microsoft는 인공 지능에 큰 투자를 하고 있습니다.

그러나 그는 졌다. 나는 제안을 했다여러 3초 스피커 프롬프트와 실행 중인 텍스트 음성 변환 프로세스에 대한 설명을 표시하여 음성을 적절하게 시뮬레이션합니다.

스피커 프롬프트 및 VALL-E 출력과 함께 결과를 “ground truth”(인스턴트 텍스트를 읽는 실제 스피커)와 기존 텍스트 음성 변환 기술의 “ground” 결과와 비교할 수 있습니다.

Microsoft는 인공 지능에 막대한 투자를 했으며 ChatGPT 및 텍스트를 이미지로 변환하거나 아트 도구인 DALL-E를 지원하는 회사인 OpenAI의 후원자 중 하나입니다.

이 거대 소프트웨어 회사는 2019년에 OpenAI에 10억 달러(9억 3천만 유로)를 투자했으며 이번 주 semafor.com의 보고서에 따르면 이 회사에 100억 달러(93억 유로)를 추가로 투자할 계획이라고 밝혔습니다.

READ  다리에 LED 조명이 장착된 갤럭시 버즈 3 프로 헤드폰의 이미지가 첫 번째 이미지에서 유출되었습니다.
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

Razer의 Kishi Ultra 게이밍 컨트롤러는 USB-C 휴대폰, PC 또는 태블릿에 터치 기능을 제공합니다.

Razer의 최신 휴대용 게임 콘솔이 오늘 출시되었습니다. 울트라 키슈는 여러 장치 간에…

Ray-Ban Meta 안경을 통해 스마트 안경에 대한 믿음이 생겼습니다.

스마트 안경은 새로운 것이 아니며 사실 오랫동안 사용되어 왔습니다. 그러나 수년에 걸쳐…

GTA 온라인 업데이트는 오늘 몇시에 출시되나요? 탐색된 모든 플랫폼의 예상 출시 시간

Rockstar Games는 GTA 온라인 겨울 DLC 2023, Chop Shop이 게임의 다음 주요…

PC Building Simulator의 속편은 아직 공사 중인 것 같습니다.

나는 후속작을 플레이하는 것에 대해 터무니없이 흥분했다. PC 빌딩 시뮬레이터. 오리지널 게임은…