Meta AI 支援 200 種語言 NLLB 單一人工智能模型

| 陳裕邦 | 10-07-2022 23:23 | |
Meta AI 支援 200 種語言 NLLB 單一人工智能模型

語言讓我們能向世界展現自己的文化及身分,亦是我們的命脈。但由於缺乏支援過百種語言的翻譯工具,全球有數十億人無法使用慣用語言或母語在網絡上存取數碼內容,或全面地參與對話及加入社群,當中以非洲、亞洲語言的數億人尤其明顯。Meta AI 研究人員展開了「不遺下任何語言」(No Language Left Behind,簡稱 NLLB)項目,為協助人們建立更好的聯繫,並於未來進入元宇宙。

Meta 近日宣布 NLLB 的重大突破,建造名為 NLLB-200 的單一 AI 模型,能翻譯 200 種不同語言並取得最佳的成果。目前現有的最佳翻譯工具中,仍有許多語言(例如:坎巴文和寮國文)沒有完善支援或甚至無法支援。常用的翻譯工具目前只能支援少於 25 種非洲語言,且多數質素不佳。相比之下,NLLB-200 支援 55 種非洲語言,並能夠提供高質素的翻譯成果。

據指,NLLB-200 的雙語替換評測分數(BLEU score)在 FLORES-101 基準的所有 10,000 個方向中,較現有的先進翻譯工具分數平均提升了 44%。在部分非洲和印度語言中,提升幅度相較最新的翻譯系統更提升了 70%。

【相關消息】

NLLB-200 模型的原始碼現已開放,並發布一系列研究工具,讓其他研究人員能夠將此作為基礎並擴大支援至更多語言,以及開發更具包容性的技術。此外,Meta AI 亦向非牟利組織提供 $200,000 美元的補助金,以推廣 NLLB-200 的實際應用。

NLLB 的研究進展將支援 Facebook 動態消息、Instagram 和我們其他平台上每日所提供超過 250 億則翻譯內容。舉例說,當瀏覽 Facebook 群組,看到一則以伊博文或盧干達文撰寫的帖文,只須點擊一個按鈕,便能透過自己的語言了解帖文的內容。此外,支援更多語言的超精準翻譯還能協助辨別有害內容和錯誤資訊、維護廉正選舉,以及遏制網絡性剝削和人口販賣的情況發生。現時維基百科編輯人員所用的翻譯系統亦採用源自 NLLB 研究的建模技術和學習成果。

【相關消息】

即刻【按此】,用 App 睇更多產品開箱科技影片

Source:Meta

Page 1 of 8