日前,Meta 因使用包含大量盜版書籍的「Books3」數據集訓練其 LLAM 1 和 LLAM 2 模型,面臨包括喜劇演員 Sarah Silverman 和作家 Richard Kadrey 在內的作者集體訴訟。Meta 對訴訟的合法性提出異議,並否認故意侵犯版權,聲稱其使用 Books3 資料集屬於合理使用範疇,無需獲得許可、署名或支付補償。想知更多,即睇內文!
即刻【按此】,用 App 睇更多產品開箱影片
AI 模型是經由機器學習或深度學習所產生,故此 AI 模型需要吸收海量資訊及使用大量數據,這衍生出「AI 侵權」的相關爭議。而 Meta 日前已遭到喜劇演員 Sarah Silverman 和作家 Richard 等作家的集體訴訟;Books3 包含大量從盜版網站 Bibliotik 爬取的受版權保護作品,Meta 承認採用了包含大量盜版書籍的「Books3」數據集,來集訓練其 LLAM 1 和 LLAM 2 模型,但拒絕向相關作家賠償。
然而,Meta 對訴訟的合法性提出異議,並否認故意侵犯版權,聲稱其使用 Books3 資料集屬於合理使用範疇,無需獲得許可、署名或支付補償。值得注意的是,Books3 數據集中的部分內容來自盜版網站 Bibliotik,該數據集在2023年被丹麥反盜版組織 Rights Alliance 要求下架,目前面臨數字存檔禁令。
【相關報道】
Source:hket