Google 對旗下多款人工智能(AI)工具進行更新,當中包括為個人化研究及寫作助理 NotebookLM 增添多項強化功能,並正式推出由 Gemini AI 模型驅動的最新影片生成模型 Veo 2。新的 AI 功能透過 Google Workspace Enterprise 版本及 Gemini Advanced 向企業用戶提供,提升企業與專業人士在處理資訊、學習新知及內容創作方面的效率。
由 Google 實驗室團隊開發的 NotebookLM,目標在於協助用戶理解和探索複雜的資訊。用戶可上傳包括文件、簡報、PDF 以至網頁內容等可信來源,NotebookLM 能運用 Gemini 的多模態理解能力,快速生成摘要、輔助筆記,並幫助用戶深入拆解龐大或艱澀的內容。是次更新重點強化多項實用功能,使其更貼合實際工作需求。
其中一項重大改進是 NotebookLM 對 PDF 檔案的理解能力。新版本能識別並分析 PDF 中的所有內容,包括以往難以處理的圖像和圖表等視覺元素,對於經常需要處理包含大量圖文數據報告的用戶而言極為實用。另一備受歡迎的「語音摘要」(Audio Overviews)功能亦實現大規模語言擴展,現已支援全球超過 200 個國家或地區的語言。
該功能利用 Gemini 2.5 Pro 技術,將用戶上傳的資料轉換成類似 Podcast 的語音內容,方便用戶以聆聽方式吸收資訊。用戶更可在設定中選擇語音回覆的輸出語言,輕鬆創建多語言內容。此外,NotebookLM 還新增了兩項核心功能:「心智圖」(Mind Map)能生成互動式視覺圖表,幫助用戶掌握資料結構和概念關聯;而「探索來源」(Discover Sources)則允許用戶直接在工具內搜尋並匯入網上相關主題的精選資訊來源,簡化資料搜集流程。
與 NotebookLM 更新同步推出的,還有令人矚目的影片生成模型 Veo 2。這項由 Gemini 驅動的技術,允許用戶透過簡單的文字提示,便能生成長達八秒鐘的高清(HD)影片。Veo 2 在影片生成的真實感和流暢度方面有顯著提升,能更好地理解物理規律和人體動態,呈現更精細的視覺細節和接近電影級的運鏡效果。
用戶只需在 Gemini 界面中詳細描述想創建的場景或故事,Veo 2 即可將文字轉化為影片。描述越細緻,對影片風格、畫面內容的控制度就越高,支援從寫實到奇幻等多種風格,為創意表達提供了極大空間。這項功能目前已向 Gemini Advanced 的企業用戶及透過 Gemini API 的開發者開放。
Source:Google
【延伸閱讀】