OpenAI 公布語音 AI 工具初步成果 15 秒音訊樣本即可合成不同人聲

| 蘇家華 | 03-04-2024 06:37 |
OpenAI 公布語音 AI 工具初步成果  15 秒音訊樣本即可合成不同人聲

OpenAI 不只勁在有 ChatGPT 這款 AI 工具,近日都公布 Voice Engine 這款新語音 AI 工具的初步成果,特別之處是只要有 15 秒音訊樣本在手,即可合成不同人聲,且表明可以產生「自然的語音」和「情感豐富且真實的聲音」。

即刻按此,用 App 睇更多產品開箱影片

OpenAI 表示,新語音 AI 工具 Voice Engine 基於品牌現有可由文字轉為語音的 API,自 2022 年以來一直研究中。有關技術的出現,對於輔助閱讀、語言翻譯,又或者那些患有突發或退化言語疾病的人而言都相當有用,例如以在美國布朗大學進行的試驗點計劃為例,透過從學校 project 錄製的音訊重現當中應有的聲帶,確是幫助治療患有言語障礙問題病人。

當然,OpenAI 也承認以上技術存在嚴重風險,但品牌在開發 Voice Engine 過程,同時吸納了來自政府、傳媒、娛樂、教育、民間社會等範疇合作夥伴的意見,以確保產品正式發布時的風險會是最小。例如任何使用該技術人士,都必須向觀眾透露這些聲音是以 AI 產生的,品牌也會使用浮水印等形式來追蹤音訊來源,以及主動對系統的使用方式進行監控。當中亦會有禁止語音清單,能夠檢測並阻止 AI 生成與現今名人太相似的聲帶。現時 OpenAI 尚未公布 Voice Engine 推出時間表。

【熱門報道】

【熱門報道】

【熱門報道】

Source: Engadget

Page 1 of 10