NVIDIA 研究 AI 語音模仿真實人聲助語言障礙者日常生活

| 徐慧兒 | 02-09-2021 16:13 |

在Google
追蹤《e-zone》

NVIDIA 研究 AI 語音模仿真實人聲助語言障礙者日常生活

NVIDIA 研究將 AI 人工智能合成的聲音與真實人聲作整合，並於 INTERSPEECH 2021 大會上展示現時研製出的 AI 語音對話模型，打破人類說話時不同的語調、節奏和音色，使全新的 AI 語音系統可用於線上客服、遊戲，甚或是讓語言障礙患者在日常生活中應用。

NVIDIA 研究整合 AI 合成聲音和真實人聲的差異
打破人類說話時不同的語調、節奏和音色
是次研發的 AI 語音模型，可捕捉及模仿人類說話聲音的細節

NVIDIA 是次研發出的 AI 語音模型，可以捕捉和模仿人類說話時聲音的細節，使 AI 合成出來的聲音與真實的人聲更加相似。AI 語音模型可應用於配音、文字轉語音、遊戲上，甚至可以幫助語言障礙患者用自己的聲音翻譯成不同的語言。另外，還可配合歌曲旋律，模擬歌手唱歌時，還可模仿出歌手唱歌時的感情。

此研究的部分成果已在 NVIDIA NeMo 工具套件中成為開放式原始碼，有興趣的用家可在 NVIDIA GPU Cloud（NGC）或其他軟件中心取得，經最佳化調整後，可配合 NVIDIA 的高效能 GPU 執行。

與此同時，研究團隊仍持續研究 AI 對話功能，包括自然語言處理、自動語音識別、關鍵字偵測、音訊增強等。

【相關報道】網民以 AI 將動漫遊戲角色換成真人！Thanos 竟變鬍子老伯？【下一頁】

【相關報道】【AI炒魷】人工智能判定員工不敬業! 俄羅斯遊戲公司因而裁掉近 150 名員工【下一頁】

即刻【按此】，用 App 睇更多產品開箱科技影片

Source：Digital Trends

Page 1 of 9

在Google
追蹤《e-zone》