반응형 구글 음성 모델1 구글이 텍스트와 음성을 처리 · 생성하며 음성 인식 및 번역 등을 지원하는 모델 'AudioPaLM' 발표 Google이 ' AudioPaLM '을 발표했습니다. AudioPaLM은 텍스트 기반 언어 모델인 'PaLM 2'와 음성 기반 언어 모델인 'AudioLM'을 통합한 멀티모달 아키텍처로, 텍스트와 음성을 처리 · 생성하며 음성 인식 및 음성 번역 등의 애플리케이션 사용할 수 있습니다. [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLM은 AudioLM에서 말하는 속도, 음성 강도, 높이, 침묵, 억양 등의 준.. 2023. 6. 28. 이전 1 다음 반응형