史丹福大學 AI 團隊近日被爆出早前開發的 Llama3-V 模型抄襲中國清華大學「面壁智能」MiniCPM-Llama3-V2.5 大模型數據。「面壁智能」的員工經了解後表示,「不僅對的一模一樣,連錯的都一模一樣。」,事件引起討論。
即刻【按此】,用 App 睇更多產品開箱影片
史丹福AI 團隊抄襲中國模型數據
綜合外媒報道,史丹福大學 AI 團隊上月發布Llama3-V 模型,宣稱500美元成本所開發的模型能超越 GPT-4V SOTA 模型效果,引起業內人士討論。隨後,馬上有人分析出Llama3-V 模型與中國清華大學「面壁智能」MiniCPM-Llama3-V2.5 兩者的模型結構及程式碼十分相似。大學團隊日前下架模型並公開就事件道歉。
有網民在開源平台 Github 上傳相關數據資料。其中,Llama3-V 和 MiniCPM-Llama3-V2.5 在辨識戰國時代古文字方面的表現最為明顯看出抄襲痕跡。這些古文字可以被準確識別,並且它們來自清華大學的收藏,而且這些古文字數據是由面壁團隊親自逐字掃描,從未對外公開。面壁團隊員工直言,「不僅對的一模一樣,連錯的都一模一樣。」。
在撤下 Llama3-V 模型的同時,AI 團隊作者承認抄襲,並向面壁團隊公開道歉。不過,面壁團隊對此事的態度相對寬容,CEO 李大海呼籲業界共同創造一個「開放、合作、有信任」的環境,同時他也開玩笑地表示「是一種受到國際團隊認可的方式」。
【熱門報道】
Source:hk.finance.yahoo、github.com