반응형 나레이션 AI1 인간다운 음성 합성을 목표로 감정 표현도 가능한 오픈 소스 독서 AI 「StyleTTS 2」가 등장 대규모 음성 언어 모델(SLM)과 확산 모델에 의한 적대적 학습을 이용하여 인간 수준의 음성을 합성할 수 있는 Text-to-Speech AI 「StyleTTS 2」를 콜롬비아 대학의 연구자들이 개발했습니다. StyleTTS 2는 참조 음성도 필요 없으며, 읽는 텍스트에 가장 적합한 스타일을 자동 생성하며, 네이티브만큼 부드럽게 영어를 읽을 수 있습니다. [2306.07691] StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models https://arxiv.org/abs/2306.07691 StyleTTS 2: Towards Hu.. 2023. 11. 23. 이전 1 다음 반응형