ChatGPT-4o如何使用?OpenAI 發布了 ChatGPT-4o!整體感覺如同與及真人一樣自然地溝通互動!零延遲即時翻譯、可打斷回覆要求即時回應、可感受人類情緒並回饋建議、可以2隻ChatGPT-4o即時交流、完全看懂圖片、包括文字、數字及線圖、教人類計數…轉語音與人類溝通。人工智能的聰明及感情進一步被提升。即睇以下ChatGPT-4o新功能懶人包。
在 OpenAI 春季發布會中,推出了全新的旗艦 AI 模型— ChatGPT-4o,當中 o 代表 omni 全向,這個新一代的人工智能不僅展示了前所未有的技術進步,而且在多模態交互、語言理解、創意生成、無障礙通信和定制化學習等方面均有重大突破。OpenAI 的 ChatGPT-4o 模型,在之前的基礎上進行了顯著的改進和創新,ChatGPT-4o 不僅展示了更進一步的技術突破,還在人工智能與人類互動的便捷性、準確性、多樣性、創意生成及個性化學習等方面設定了新的標準。
Table of Contents
ChatGPT-4o哪些能力被提升?
語言處理大躍進
GPT-4o在語言理解和生成方面有更強大的能力,能夠處理更複雜的語句結構和語意。這使得在寫作輔助、內容生成和語言翻譯等方面表現更出色,更能理解上下文並提供貼切的回應。
反應時間快速
相比於GPT-4,GPT-4o的運算速度有了顯著提升,短至232毫秒(0.232秒)的時間內回應問題,平均為320毫秒(0.32秒)。相比之下,GPT-3.5和GPT-4的語音模式平均反應時間分別為2.8秒和5.4秒。當用戶與GPT-4o互動時,能夠感受到明顯的速度提升,更像是與真人自然對話。
生動的語音生成
在語音方面,GPT-4o有顯著的技術進步,能夠生成更自然及流暢的語音。
優秀的視覺辨識能力
GPT-4o強調提升了視覺辨識的能力,可以快速且準確地識別圖片或動態影像中的周遭人物表情、環境和物體活動。
GPT-4o的功能有哪些?
視訊對談
OpenAI測試者模擬一次面試前,請求GPT-4o給予外觀上的建議。雖然測試者頭髮亂糟糟的,想要戴上漁夫帽掩飾,但GPT-4o建議他去梳頭髮!在對話中,測試者展現出情緒並與GPT-4o互動,仿佛與真實朋友對話一般。在對談過程中,用戶可以隨時打斷GPT-4o的回應,然後又接應之後對話。
即時翻譯
GPT-4o精通達50種語言,加上語音回應時間被優化,能夠實現「零Delay」即時翻譯。翻譯效果迅速,準確度高,跨越語言地域障礙。例如當OpenAI測試者需要英文轉意大利文 / 意大利文轉英文時,GPT-4o快速且幾乎無時間差進行即時翻譯。
判斷人類情緒
測試者在緊張的簡報前請求GPT-4o幫忙判讀呼吸。透過觀察測試者的呼吸節奏,GPT-4o能給予建議,例如調整呼吸節奏以緩解緊張情緒。據OpenAI的說法,GPT-4o能夠「讀懂」用戶的表情和情緒,並做出更生動、符合情境的語氣作回覆。GPT-4o能模仿多種語音風格和語調,甚至在聽完笑話後像真人一樣自然地笑,讓人難以分辨出是AI機械人!
環境辨識
GPT-4o強調提升了視覺辨識的能力,這項功能有助視障人士外出時,利用GPT-4o代替視覺辨識並透過語音傳達周遭情況。從測試者示範影片中看到,GPT-4o清楚地描述周圍環境,例如白金漢宮在哪裡,如何叫的士,並提醒使用者舉手叫的士等。
解讀用戶動作行為
測試者玩剪刀石頭布遊戲,Chat GPT-4o看明了用戶動作,並正確判斷出勝負。還能邀請GPT-4o為你開心自然地唱生日歌,如同真人朋友一樣。
圖像、文字、文本轉語音
GPT-4o看懂圖片、包括文字、數字、線圖、編碼,用語音解釋圖內的細節及內容,也可教人類計數!圖像、文字、文本轉語音等日常文書處理功能難不到Chat GPT-4o。
線上會議當助手
由於GPT-4o具備識別畫面的能力,使用電腦版的ChatGPT時,可以與它分享螢幕畫面,GPT-4o能夠辨識畫面內容並與用戶進行討論。用戶也可將ChatGPT-4o加入線上視訊會議中,讓AI充當會議的主持人,隨時向它提問或請它作會議總結。
線上家教引導做作業
可汗學院創辦人Salman Khan發布了一條利用GPT-4o引導學生解題的影片。ChatGPT-4o像家教老師一樣,透過語音耐心引導學生思考及作答。家長可以要求AI不提供答案,而是透過逐步教導讓學生自己解答。整個過程中,AI都表現出鼓勵學生的態度。
按圖多了解ChatGPT-4o 五大賣點︰
ChatGPT-4o 5樣最大賣點
1. 快速反應能力
ChatGPT-4o 的顯著特色在於對音頻輸入的迅速反應。其平均回應時間為 320 毫秒,最快可達 232 毫秒,接近人類的對話速度。這種提升使得 ChatGPT-4o 在現有模型中表現更加高效和成本效益。特別是在英語文本和編程方面,它達到了 GPT-4 Turbo 的水平,在非英語語言的處理上也表現優異,而且成本比通過 API 的方式降低了 50%。
2. 視聽處理能力的提升
ChatGPT-4o 在視覺和聽覺理解方面取得了重大進步。相比之下,先前的模型如 GPT-3.5 和 GPT-4 在使用 Voice Mode 時,需進行多步驟處理音頻輸入,導致延時增加(GPT-3.5為2.8秒,GPT-4為5.4秒)並丟失了大量上下文信息。這些模型需將音頻轉換為文本、處理文本再轉換回音頻,限制了它們在識別語氣、處理多個講話者或解析背景噪音方面的能力。
3. 即時語音對話功能
ChatGPT-4o 不僅在智能水平上與 GPT-4 相當,還在速度和功能上有所增強。例如,用戶可以拍攝不同語言的餐牌,直接與 ChatGPT-4o 交談,翻譯並了解食物的歷史和重要性,同時獲得餐點建議。OpenAI 期望未來能夠推出更自然的即時語音對話功能,並能在實時視頻中與 ChatGPT 互動,例如解說直播體育賽事的規則。
4. 支援超過 50 種語言
ChatGPT-4o 在語言處理的質量和速度上都有顯著的提升,現已支援超過 50 種語言。OpenAI 已開始向 ChatGPT Plus 和 Team 使用者推廣 ChatGPT-4o,企業用戶也將很快獲得該服務。此外,所有用戶均可使用ChatGPT-4o,但免費用戶將有使用限制,其中 Plus 用戶的消息限制是免費用戶的五倍,Team 和企業用戶則擁有更高的限制。
5. 新功能適用於免費用戶
OpenAI 致力於為更多人提供先進的 AI 工具。目前,每週已有超過一億人使用 ChatGPT。在接下來的幾週內,OpenAI 將逐步為免費用戶提供更多智能工具和功能,這包括享受 GPT-4 級的智能體驗、獲得模型和網絡的回應、進行數據分析和創建圖表、討論照片內容、上傳文件以獲得摘要、寫作或分析的協助、探索和使用 GPTs 以及 GPT Store,以及利用記憶功能打造更為貼心的使用體驗。
ChatGPT-4o費用多少?
付費版
ChatGPT Plus用戶可自由切換至GPT-4o使用,付費訂閱的用戶比免費版本用戶擁有較少的訊息限制。
免費版
免費版用戶無法自由切換至GPT-4o,需透過ChatGPT Plus用戶切換。而且使用免費版的GPT-4o額度有限,超過使用上限後,需等待大半日時間才可再使用。
2023年3月推出的 GPT-4 供每個月支付 20 美元訂閱 ChatGPT Plus 的用戶使用。以前只向付費用戶開放的功能,如記憶體和網頁瀏覽,如今開放用戶免費使用。
有GPT-4o,還要買ChatGPT Plus?
如果是頻繁使用ChatGPT的用戶,訂閱付費版的ChatGPT Plus仍然是有必要的。因為免費版的GPT-4o有使用額度。問了6-7個問題已到每日限制,被要求在大半日後約9個鐘才能再用。OpenAI 的研究負責人Barret Zoph曾表示:「透過 Plus,用戶可以使用的次數更多。」與非訂閱者相比,ChatGPT Plus的訂閱者可以發送比 GPT-4o 多5倍的指令。
GPT-4o app/desktop幾時有?
最後,ChatGPT-4o提供的語音服務,預計在下個月(2024年6月)釋出訂閱用戶的測試版。
不過,OpenAI提到,他們擔憂語音功能遭濫用,因此語音功能暫時不會開放給所有API用戶,未來幾星期內會先提供給部份值得信賴的合作夥伴使用,之後的功能釋出要再等候消息。目前,美國地區以外的用戶可能還沒有在 iOS 或 Android 上見到 GPT-4o,而新的 Mac Desktop應用程式仍未發布。 OpenAI計劃在未來幾星期內更廣泛地在Mac Desktop上提供服務,而 Windows版本預計在今年稍後推出。
【相關報道】
延伸閱讀︰
Source:OpenAI 、OpenAI YouTube、mashable