Google 公布全新 AI 模型 Gemini,結合文字、代碼、音頻、圖片及視頻處理能力於一身,號稱多模態超級AI模型。Gemini 設有 3 個版本,分別為全方位的Gemini Ultra、多功能的Gemini Pro和高效的Gemini Nano,為不同場境使用而設。
據Google指,Gemini Ultra在自然語言處理、影像和音頻理解等方面,會有更強表現,特別是在多任務語言理解(MMLU)方面,首次超越人類專家,在32個最廣泛使用的行業基準中,30個取得領先成績。這亦意味著Gemini在解答複雜問題時,能夠更加精準和深入。
Gemini應用場景廣泛,從輔助學生完成物理學作業,到幫助科學家快速搜索和提取科學文獻中的關鍵信息,展示Gemini在理解複雜主題和數據上的能力。
同時,Gemini在訓練過程中優化TPU,使其能夠更快速高效地運行。Pixel 8 Pro將成為首款搭載Gemini Nano的智能手機,支援多個新功能,包括錄音機應用程式中的「摘要」,並在 Gboard 中新增智能回覆功能,此功能將率先應用於 WhatsApp,明年會陸續推出至更多通訊應用程式。在未來數月,Gemini 將應用於Google更多產品和服務中,例如搜尋、廣告、Chrome 和 Duet AI 等;今天起,Google Bard會升級採用Gemini Pro;明年推出更先進的Bard Advanced版本,將應用Gemini Ultra。
採用Gemini Pro的Google Bard,會首先在 170 多個國家和地區以英語提供服務,Google 指會在不久的將來,擴展支援新的語言和地區,並應用於更多Google產品和服務中,包括搜尋、廣告、Chrome等。同時,Google 宣佈推出目前最強、高效和具可擴充性的 TPU 系統 Cloud TPU v5p,專為訓練尖端 AI 模型而設。
比較Google的Gemini與OpenAI的GPT-3.5時,Google表示Gemini擁有多方面的優勢,包括:提供多模態能力、超越人類專家的性能表現、三種版本的高度靈活性、多元化的編碼能力等。Google 又指,12 月 13 日起,開發人員和企業客戶可以透過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 使用 Gemini Pro。Android 開發人員還可以透過 Android 14 提供的新系統功能 AICore 使用為裝備內置任務而設的最高效模型 Gemini Nano 進行開發工作。為確保Gemini的安全可靠,Google稱已進行全面的安全評估,並應用最先進的對抗測試技術。
Source:Google、ezone.hk