
ChatGPT 2、GPT 2整圖、GPT 2做圖、GPT 2 指令。OpenAI 昨日(21日)正式推出全新影像生成模型「ChatGPT Images 2.0」!是次更新的核心亮點在於引入具備推理能力的「思考模式」,並大幅改善了繁體中文的文字處理與構圖精確度。GPT Image 2 的推出隨即震撼各大用家,更於 AI 評測網站 Image Arena 一舉取代 Nano Banana 2,成為目前最強的 AI 圖像生成工具。小編亦同步實測了 GPT Image 2 以及 Nano Banana 2,只能說結果確實是相當震驚!
ChatGPT Images 2 核心亮點
推理模式強化視覺一致性:首創「思考模式」結合搜尋功能,能精準分析任務並單次生成 8 張具連續性的圖像,確保角色與風格高度統一,完美支援漫畫分鏡與設計方案。
繁體中文排版商用化飛躍:大幅修正中文生圖的錯字與扭曲痛點,能生成字跡清晰、設計感強的繁體中文海報與產品宣傳照,文字準確度與排版美感均達到「直接出稿」的專業水準。
專業級構圖與畫質控制:支援最高 2K 解析度及多種畫面比例,對複雜構圖與空間關係的掌控力顯著提升,在 Image Arena 評測中橫掃三項冠軍,視覺細節與品牌還原能力遠超同類模型。
ChatGPT Images 2「思考模式」強化視覺一致性 支援一鍵生成分鏡
據 OpenAI 指,ChatGPT Images 2.0 最大的技術突破,在於將推理功能與影像生成結合。在「思考模式」下,AI 不再只是被動按照指令畫圖,而是會先分析任務需求,甚至透過網絡搜尋獲取資訊,目前模型擁有的最新資訊為 2025 年 12 月前。同時,ChatGPT Images 2.0 具備處理「連續性任務」的能力,用戶只需輸入一次提示詞,即可生成最多八張圖像,並能確保跨場景的角色、物件及視覺風格上完全一致,適用於製作漫畫分鏡,或室內設計改造方案等。
ChatGPT Images 2繁體中文排版不「碰運氣」 直擊商用痛點
對於香港及繁體中文用戶而言,新模型在多語言處理上的提升最具衝擊力。過去 AI 生圖常出現字體扭曲、語法不通或筆劃錯誤等情況。Images 2.0 針對此項弱點大幅改善。小編本人實測後,發現其生成短標題、主視覺文字以至複雜的資訊欄位時,精準度均有質的飛躍。這意味著 AI 產出的內容可直接應用於產品宣傳相、店內告示甚至是活動海報,大幅降低後期改圖的成本。
GPT 2 剛推出不久,坊間則有AI 達人出了750+ 指令給大家參考。小編根據那些建議指令實試成效,實在太強大,比Nano Banana 的AI 圖更細致及有質感,完全是平面廣告級水準。
ChatGPT Images 2 畫質與構圖控制邁向專業級
在視覺表現方面,新模型支援由 3:1 超寬橫額到 1:3 超高直屏的多種比例,解像度最高提升至 2K。OpenAI 表示,Images 2.0 提升了對密集資訊與複雜構圖的控制力,能精準放置多個物件並處理空間關係。無論是寫實攝影、電影劇照還是細緻的 UI 介面設計,光影與材質的還原度均較前代有明顯進步。網上因此亦有不少人驚呼:「廣告界危險了!」
市場反響與供應安排
根據 Arena.ai 最新公佈的 Image Arena 排行榜,GPT-Image-2 一推出即席捲 Text-to-Image、Single-Image Edit 及 Multi-Image Edit 三項冠軍,其中在「文字轉圖像」方面更以 242 分的顯著差距拋離第二名的 Nano Banana 2。
目前 ChatGPT Images 2.0 已正式開放予所有 ChatGPT 及 Codex 用戶使用。不過「思考模式」則優先提供予 ChatGPT Plus、Pro 及 Business 付費用戶,企業版亦將於短期內上線。
如何啟用 ChatGPT Images 2?
目前香港尚未開放 ChatGPT,因此須透過 VPN 翻牆使用。讀者可以到此篇報道,尋找免費的 VPN,再按照以下步驟註冊 ChatGPT 帳戶。
手機版:
目前香港 App Store 以及 Google Play 亦未有 ChatGPT,須透過外國帳戶下載。讀者可以透過此報道了解如何設定外國 App Store 帳戶。小編登入的是日本 App Store。
- 於 App Store 下載 ChatGPT
- 啟用任何一個 VPN 服務,再使用 Google、Microsoft 或 App 帳戶註冊
- 成功登入到 ChatGPT 的頁面後,直接點擊「圖像」,即可使用最新的 ChatGPT Image 2.0
電腦版:
- 啟用任何一個 VPN 服務,並打開 ChatGPT 網頁
- 點擊左下方的註冊鍵註冊
- 成功登入到 ChatGPT 的頁面後,直接點擊「圖像」,即可使用最新的 ChatGPT Image 2
小編實測:ChatGPT Images 2 對決 Nano Banana 2
小編是次實測將從三個方面入手,單純透過指令生成隨機圖片、給予實物圖片並生成另一張圖片,和生成一張網上有參考來源的圖片,以測試兩個模型均有的即時搜索功能。
1. 生成逼真的日本周刊八卦雜誌封面,包含狗仔隊風格攝影,聳人聽聞的標題以及多張插圖
先看看 GPT Images 2 生成的圖片,圖片中的字型、顏色以及排版,幾乎完全接近真實的八卦雜誌字體。甚至雜誌上的內容亦完全真實。例如大谷翔平飼養的狗隻,以及廣末涼子出軌的消息。整體而言,小編認為圖片有達到全部的要求。
再看 Nano Banana 2 生成的圖片,雖然圖片確實展示一個八卦雜誌封面,惟雜誌封面的相片離奇地與背景的日本街頭融入一起。雜誌封面的文字夾雜著日文與中文,而且圖中亦有出現錯字。其餘的新聞插圖為隨機生成,排版相對簡單,整體比不上 GPT Images 2。
2. 按照上傳的垂直滑鼠相片生成一張產品宣傳圖,並介紹一下其性能。
小編隨意利用桌上的Mouse來做圖,實試GPT Images 2 由簡樸圖片到大師級海報的水準。
GPT Images 2 生成的圖片背景簡潔,排版與構圖都彷如一張真實的產品宣傳圖。字體及顏色亦有按照產品的性質來生成,圖片整體有一種專業的科技感,完美符合垂直滑鼠背後人體工學的設計概念。而最重要的是,圖中完全沒有錯字,而且沒有 AI 生圖常見的字體扭曲,確實是相當驚人。
小編用同一隻Mouse丟給Nano製圖, Nano Banana 2 顯得稍為遜色。產品介紹的文字是以字卡呈現,沒有自然地融入圖片。文字排版只是粗暴地生成多段文字;字體與顏色亦只用了最基礎的設計。儘管圖中沒有錯字,但可見部分字體仍然會扭曲。背景則隨機生成一張木桌,整體而言沒有產品宣傳圖應有的專業感。
3. 生成一張 Bonaqua 礦泉水的產品宣傳圖
這次實測,兩個模型的表現則較為相近,不過小編認為仍是 GPT Images 2 技高一籌。
兩個模型都理解到 Bonaqua 礦泉水的設計並能夠生成出來。但就產品宣傳圖的概念而言,與上述實測二一樣,在沒有準確指令的情況下,Nano Banana 2 只會直接將文字貼在圖片上,似乎不會考慮排版設計方面的美感;而 GPT Images 2 的主標題、副標題、產品資訊等細節都十分出色。字體顏色亦會按照 Bonaqua 的品牌設計來調整,完全是一幅可以直接使用的宣傳相片。
GPT Images 2:
Nano Banana 2:
總結而言,ChatGPT Images 2 在商用化上已有壓倒性優勢, 甚至進化至「自動設計」階段,其對文字與排版的理解,已經達到「直接交稿」的專業水平。Nano Banana 2 則仍停留在「AI 繪圖」的階段,需要大量提示詞修正才能生成理想的相片。而且 ChatGPT 有一點小編特別喜歡,便是 ChatGPT Images 2.0 的圖片全部沒有水印!而 Nano Banana 生成的圖片右下角仍會有個 Gemini 水印,需要額外用第三方工具移除。
用戶若希望自行試玩 ChatGPT Images 2.0,可以參考這篇 GPT 2 Images 指令大全。
ChatGPT Images 2 vs. Nano Banana 2 性能評測對比
評測維度 |
ChatGPT Images 2 (GPT-Image-2) |
Nano Banana 2 |
文字準確度 |
極高。無錯字、無扭曲,繁體中文處理極其精準。 |
一般。會出現錯字、字體扭曲,中日文字夾雜。 |
視覺排版美感 |
專業級設計。字體、顏色能自動適應品牌特質,具備標題與副標題層次感。 |
基礎水平。文字多以「字卡」形式粗暴呈現,缺乏設計感與排版邏輯。 |
品牌還原能力 |
精準。能捕捉品牌色調與設計語言。 |
中等。能辨識產品形態,但未能延伸出品牌視覺風格。 |
真實感與細節 |
極致真實。圖片內容、字型與排版與現實出版物或宣傳照幾無分別。 |
遜色。相片與背景融合生硬,細節處理較隨機。 |
構圖一致性 |
優異。構圖彷如真實商業攝影,背景簡潔且符合產品概念。 |
普通。背景多為隨機生成,缺乏專業感或場景針對性。 |
資訊真實度 |
強大。能生成具備真實時事內容的文字。 |
弱。內容多為隨機生成的生字或簡單排版。 |
水印 |
沒有。 |
有。 |
🎯 重點速睇:
- 首創思考模式:模型在生成前會進行推理並搜尋 2025 年 12 月前的資訊,單一指令可生成最多 8 張具連續性的圖像。
- 繁體中文大進化:解決過往亂碼及缺筆畫痛點,能準確生成拼寫正確、語意流暢的中文排版,適用於海報及餐牌。
- 專業規格提升:支援最高 2K 解析度,構圖比例涵蓋 3:1 至 1:3,對複雜指令及物件擺放的理解力顯著增強。
- 橫掃業界榜單:於權威評測 Image Arena 奪得三項榜首,以大幅領先優勢成為目前最強的文字轉圖像工具。
即刻【按此】,用 App 睇更多產品開箱影片
【熱門報道】
Source:OpenAI
【相關話題】Gemini 圖像生成終極攻略!Google 親自教路 4 大指令秘技 附 5 大實用場景示範
隨著 Google Gemini 於香港全面開放,相信不少讀者都已經試用過其強大嘅 AI 寫文功能。但其實 Gemini 內置嘅「圖像生成」工具同樣極具殺傷力!官方早前將 Gemini 嘅生圖模型升級為 「Nano Banana 2」,並同步公開詳細嘅終極指令(Prompt)教學。
Source:ezone.hk
【相關話題】向 Nano Banana 挑機!國產 AI 製圖工具 Seedream 5.0 上線 兩者到底有咩分別?
繼影片生成模型 Seedance 2.0 引發熱議後,字節跳動再度發力,發布 Seedream 5.0 圖像生成模型。新版本目前已在「剪映」、海外版「CapCut」及 AI 創作平台「小雲雀」全面上線,並於「即夢AI」平台啟動小規模測試。該模型以「國產免費工具」定位,明確對標目前高階 AI 圖像工具 Nano Banana Pro。
Source:ezone.hk
