지난 해에는 텍스트 프롬프트를 사용하여 이미지, 예술 작품 또는 비디오를 만들 수 있는 인공 지능(AI) 도구가 등장했습니다.

또한 앞으로 큰 발전을 이루었습니다. AI 타이핑OpenAI의 ChatGPT 사용 광범위한 흥분을 일으켰습니다. – 그리고 두려움 – 글쓰기의 미래에 대한.

이제 2023년을 며칠 앞두고 또 다른 강력한 AI 사용 사례가 주목받고 있습니다. 바로 사람의 목소리를 정확하게 시뮬레이션할 수 있는 텍스트 음성 변환 도구입니다.

마이크로소프트가 개발한 VALL-E는 3초 동안 사람의 목소리를 녹음하고, 그 목소리를 반복하고, 텍스트의 맥락에 따라 사실적인 어조와 감정으로 쓰여진 단어를 음성으로 변환할 수 있습니다.

60,000시간의 영어 음성 녹음 교육을 받은 그는 “무의미한 상황”에서 연설을 할 수 있습니다.

VALL-E를 소개합니다 코넬 대학교에서 발행한 논문개발자들은 녹음 데이터가 7,000명 이상의 고유한 화자로 구성되어 있다고 설명했습니다.

팀은 TTS(텍스트 음성 변환) 시스템이 기존 텍스트 음성 변환 시스템보다 수백 배 더 많은 데이터를 사용하여 미결제 문제를 극복하는 데 도움이 되었다고 말합니다.

이 도구는 현재 공개적으로 사용할 수 없지만 누군가의 목소리에서 나오는 모든 텍스트를 생성하는 데 실질적으로 사용될 수 있다는 점에서 안전성에 대한 의문을 제기합니다.

Microsoft는 인공 지능에 큰 투자를 하고 있습니다.

그러나 그는 졌다. 나는 제안을 했다여러 3초 스피커 프롬프트와 실행 중인 텍스트 음성 변환 프로세스에 대한 설명을 표시하여 음성을 적절하게 시뮬레이션합니다.

스피커 프롬프트 및 VALL-E 출력과 함께 결과를 “ground truth”(인스턴트 텍스트를 읽는 실제 스피커)와 기존 텍스트 음성 변환 기술의 “ground” 결과와 비교할 수 있습니다.

Microsoft는 인공 지능에 막대한 투자를 했으며 ChatGPT 및 텍스트를 이미지로 변환하거나 아트 도구인 DALL-E를 지원하는 회사인 OpenAI의 후원자 중 하나입니다.

이 거대 소프트웨어 회사는 2019년에 OpenAI에 10억 달러(9억 3천만 유로)를 투자했으며 이번 주 semafor.com의 보고서에 따르면 이 회사에 100억 달러(93억 유로)를 추가로 투자할 계획이라고 밝혔습니다.

READ  미국 연방거래위원회(FTC)는 마이크로소프트의 액티비전 인수를 막아야 한다고 주장하고 있다.
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

iOS 15 및 macOS 12, 암호없는 미래를 향한 작지만 중요한 단계

Apple의 곧 출시 될 iOS 15 및 macOS Monterey는 “iCloud 키 체인의…

Kurious Kamera의 Blue Creatures를 찾을 수있는 곳

어제, 진신 효과S 플레이어는 먼저 Five Flushes of Fortune 이벤트를 경험합니다. 새로운…

Epic Games Store가 마침내 괜찮은 성과를 거두었습니다.

그림: 서사시 2018년에 출시된 Epic Games Store는 2021년 10월에 다시 돌아왔고 그곳에서…

Surface Laptop Studio는 물론 스탠드로 변합니다.

작년에 배운 것이 있다면 서피스 북 3그게 다야, 마이크로소프트의 탈착식 태블릿 디자인은…