
Google 於本月的 Google I/O 2026 大會宣布調整 Gemini 用量上限,從過去單純的「指令次數」調整為「Token 實際運算量」以扣除額度。雖然文字問答、圖片生成、Deep Research 及影音生成的算力消耗本就不同,按運算量計費似乎更合理,但對用戶而言,現在極難預測每次發送訊息會吃掉多少配額。 不少用家亦抱怨現在只用一下子便直接爆額,甚至有網民分享,自己僅輸入一條影片生成的指令,Gemini 的 5 小時用量額度直接飆升,引起科技界廣泛討論。
為什麼一個失敗影片指令會用盡用量?Gemini 負責人親自回應
據外媒報導指,一位名為 Ashutosh Shrivastava 的 Google AI Pro 訂閱用戶爆料。他當時正在使用 Gemini 的 Avatar 影片生成功能,原本 Gemini 的「5 小時限額」進度條顯示為 0%。
當他輸入了一個簡單的影片生成指令後,Gemini 運算約 3 至 4 分鐘,最終畫面顯示「影片生成失敗」。然而最令人震驚的是,儘管任務失敗,Gemini 的 5 小時用量限制卻瞬間從 0% 直接飆升至 100%。
Google 官方如何回應?
該貼文隨即驚動了 Google Gemini 負責人 Josh Woodward,他親自在下方回應:「糟糕,讓我們看一下(Yikes, let us look into this)。」
雖然官方截至目前為止仍未明確說明這是單純的漏洞、特定 Avatar 影片功能的計算異常,還是新用量制度在某些特定情境下的扣額方法,但此個案已令不少重度用家感到崩潰。外界普遍推測,Google 此次收緊用量與算力緊繃直接相關。Google 官方指出,過去一年用戶消耗的 Token 數量就暴增了 7 倍。
五大實測有效節省 Gemini Token 配額秘訣
目前 Gemini 的用量限制主要劃分為 5 小時限額與每周限額。傳送給 Gemini 的每一個字、歷史紀錄及文件,都在燃燒 ASR 算力與 Token 數量。為了避免頻繁達到每日上限,小編整理出以下五個實測有效的「省配額、降用量」秘技:
1. 定期重開新對話視窗
在同一個對話串中,每次送出新訊息,Gemini 都必須重新讀取整段歷史紀錄來理解脈絡,Token 消耗會以等比級數暴增。
解決方案:
- 建議將對話長度控制在 5 至 7 輪內便開啟新視窗,且不要在同一個串裡問不相關的問題。
- 若中途需要延續,可先請 Gemini「摘要目前討論重點」,再用該摘要在新視窗發問。
2. 上傳長篇文件前預先處理
Gemini 支援上傳 PDF、長篇文章等文件,但直接把整份幾十頁的文件丟進去,是最浪費配額的行為之一。每一頁龐大的字數都會讓 Token 消耗極快,如果用家只想問其中一個段落,等於白白燒掉很多不必要的配額。
解決方案:
- 先把文件中真正需要的段落複製出來,只貼相關部分。
- 若要處理冗長文件,可透過其他工具將其簡化成初步摘要。
3. 根據任務難易度挑選合適模型
用家消耗的 Token 數量與選用的模型等級直接相關。盲目調用 Pro 模型、Deep Research、影片生成等高階功能,會導致 5 小時限額快速封頂。日常使用下,Gemini 3.5 Flash 模型已經十分足夠。若有需要使用高階功能,則建議分配好使用頻率,可能每 5 小時僅使用 1 至 3 次,才能保留餘裕處理其他工作。
4. 精簡指令、刪除廢話
最立竿見影的省配額方法,就是讓提示詞更精準、更短。許多人習慣用客氣的疑問句跟 AI 說話(例如:「麻煩你能不能幫我詳細解釋一下……」)。這會白白燒掉數倍 Token,但得到的答案未必會變得更好。
實用技巧:
- 用肯定句取代疑問句:「摘要以下文章」比「你可以幫我摘要這篇文章嗎?」更省 Token。
- 指定格式與長度:使用「用條列式、100 字內回答」等明確指令。
- 刪除重複背景說明:不要在每次對話都重新解釋一次你是誰、你在做什麼。建議可以活用 Gemini 的 Gem 設定角色。
5. 硬性限制 Gemini 輸出回答長度
很多人不知道,讓 Gemini「少講一點」,比讓用家自己「少問一點」更能節省配額。
實用技巧:
- 在指令明確要求「請用 XX 字以內回答」
- 要求 Gemini「只輸出結論,不需要解釋過程」。
Gemini 用量限制常見問題 FAQ
Q1:如何查詢自己目前消耗的 Gemini 剩餘額度?
用家可以不時檢查目前的額度狀況。不論是使用 Gemini 應用程式(App)或是網頁版,只需點擊左下角的【設定】,再點選【用量限制】選項,系統便會以百分比的形式清晰顯示目前的消耗進度條,並標明距離下一次重置的倒數時間。
Q2:如果對話過程中不幸遇到系統生成失敗,被扣除的額度會自動退還嗎?
目前 Google 官方並未詳細說明功能出錯時的扣額處理機制。根據目前 AI Pro 用戶 Ashutosh Shrivastava 影片生成的失敗個案,生成失敗後系統依然扣除了 5 小時的完整額度,並未自動退還,目前仍需等待官方進一步調查或等候 5 小時重置。因此在系統陣痛期內,建議高消耗任務要謹慎提交提示詞。
🎯 重點速睇:
- 計費改依運算量計算:Gemini 2026 年 5 月新制打破過去算次數的限制,改依提示複雜度、模型等級及功能消耗算力,新增與 Claude 相似的 5 小時及每週百分比限額條。
- 影片生成出錯爆用量爭議:有國外用戶實測使用 Avatar 影片生成功能,歷時 3-4 分鐘後宣告失敗,但 5 小時限額卻無故從 0% 直接扣至 100% 爆滿,引來負責人 Josh Woodward 介入調查。
- 算力緊繃核心原因曝光:由於過去一年用戶 Token 消耗數暴增 7 倍,導致各 AI 巨頭算力吃緊;實測顯示高階 Deep Research 功能一輪便可燒掉 45% 額度, Veo 3 影片生成亦會消耗約 26%。
- 實測五招有效節省配額:用家可透過將對話控制在 5-7 輪內即開新視窗、上傳 PDF 前截取特定段落、使用肯定句精簡提示詞、硬性要求 AI「50字內條列回答」,以及切換至 CP 值高的 Gemini 3.5 Flash 模型來避開超量限制。
即刻【按此】,用 App 睇更多產品開箱影片
【熱門報道】
Source:Android Authority、X@AshutoshShrivastava
【相關話題】同AI徹夜長談已成歷史?Gemini 使用限制大縮水 Pro版竟然只比免費版多X倍!
Google全面更新Gemini用量計算方式,由「每日固定次數」改為「按運算量計算」,系統將根據提示詞複雜度、對話長度及功能類型等因素扣除額度。新制設有每5小時定期重設與每週總上限的雙軌制機制,額度耗盡後會自動切換至小型模型。配合新計費邏輯,Google亦於2026年5月起調整訂閱架構,推出全新Plus、Pro及Ultra三大方案,並有外媒傳將上線用量限制儀表板。
Source:ezone.hk
【相關話題】Gemini登陸Chrome:Gemini側邊欄殺到一鍵執相兼跨Tab格價 必學5大最強神技
Gemini Chrome 教學、Chrome 一鍵執相 Nano Banana 2。Google 震撼宣佈 Gemini 登陸 Chrome!由 2026 年 4 月 21 日凌晨 6 時起,最強 AI 助理正式入駐瀏覽器。以為又係普通 Chatbot?錯了!全新側邊欄支援跨分頁對比購物格價、YouTube 影片問答,更內置 Nano Banana 2 引擎做到「一鍵執相」!即睇實測 5 大神級功能與隱藏防伏貼士,教你秒速提升辦公效率,比 Google AIO 答案更實用!
Source:ezone.hk
