OpenAI 公布語音 AI 工具初步成果 15 秒音訊樣本即可合成不同人聲

| 蘇家華 | 03-04-2024 06:37 |

在Google
追蹤《e-zone》

OpenAI 不只勁在有 ChatGPT 這款 AI 工具，近日都公布 Voice Engine 這款新語音 AI 工具的初步成果，特別之處是只要有 15 秒音訊樣本在手，即可合成不同人聲，且表明可以產生「自然的語音」和「情感豐富且真實的聲音」。

即刻按此，用 App 睇更多產品開箱影片

OpenAI 表示，新語音 AI 工具 Voice Engine 基於品牌現有可由文字轉為語音的 API，自 2022 年以來一直研究中。有關技術的出現，對於輔助閱讀、語言翻譯，又或者那些患有突發或退化言語疾病的人而言都相當有用，例如以在美國布朗大學進行的試驗點計劃為例，透過從學校 project 錄製的音訊重現當中應有的聲帶，確是幫助治療患有言語障礙問題病人。

↓點擊圖片放大↓

+12

+11

當然，OpenAI 也承認以上技術存在嚴重風險，但品牌在開發 Voice Engine 過程，同時吸納了來自政府、傳媒、娛樂、教育、民間社會等範疇合作夥伴的意見，以確保產品正式發布時的風險會是最小。例如任何使用該技術人士，都必須向觀眾透露這些聲音是以 AI 產生的，品牌也會使用浮水印等形式來追蹤音訊來源，以及主動對系統的使用方式進行監控。當中亦會有禁止語音清單，能夠檢測並阻止 AI 生成與現今名人太相似的聲帶。現時 OpenAI 尚未公布 Voice Engine 推出時間表。

【熱門報道】