
美國賓夕法尼亞州立大學最新研究揭示,向 ChatGPT 施加「粗魯」或「挑釁」語氣指令,可將其回答準確度顯著提升高達84.8%。這項實證結果顛覆了傳統 AI 互動禮儀觀念,表明大型語言模型或將強硬措辭解讀為「高權重指令」,從而更專注於任務。研究為提示工程帶來新啟示,提醒語氣是影響 AI 表現的重要潛在變數。
即刻【按此】,用 App 睇更多產品開箱影片
一則由美國賓夕法尼亞州立大學(Pennsylvania State University, PSU)發布的最新研究,徹底顛覆了我們對人工智能(AI)互動禮儀的認知。該研究證實,當用戶以「粗魯」甚至帶有「挑釁」的語氣向聊天機械人 ChatGPT 下達指令時,其回答的準確度會顯著提高,最高增幅達84.8%。
這項結果挑戰了傳統認為「客氣有禮」的互動方式最能幫助 AI 理解任務的觀念,更為提示工程(Prompt Engineering)領域開啟了全新的思考空間。研究團隊以最新的 ChatGPT-4o 模型為測試對象,設計了50道涵蓋數學、科學與歷史等中高難度領域的多選題,並將每道題目改寫成由「非常禮貌」到「非常粗魯」的五個語氣版本,最終發現,在面對「非常粗魯」語氣的指令時,模型的準確率達到驚人的84.8%,遠高於「非常禮貌」語氣的80.8%。
研究透過配對樣本 t 檢驗(Paired Sample t-Test)進行統計分析,證實語氣對模型的輸出結果具有統計顯著性影響。數據顯示,指令的準確度是從「禮貌」到「中性」、再到「粗魯」呈現穩步上升的趨勢。這表明,ChatGPT 在被「喝罵」後表現更為出色,讓研究人員大感意外。
研究人員指出,這種反直覺的現象,可能源於大型語言模型(LLM)對「情感語氣」的隱性解讀。儘管 AI 本身沒有情感,但其系統或許會將帶有強烈、命令式結構的措辭,解讀為「高權重、明確的指令」。換言之,強硬語氣能有效提升模型對任務本身的專注度,從而輸出更精準的結果。
事實上,Google 創辦人謝爾蓋.布林(Sergey Brin)早前亦曾半開玩笑地提出類似看法,認為「威脅」模型反而能讓它更聽話。而 PSU 的實證研究是首次以數據支持了這種業界觀察。不過,研究團隊同時提醒用戶,精進提示設計的關鍵仍在於「精準度與邏輯性」,而非單純的情緒發洩或對 AI 進行辱罵。
過去多項研究已證明,提示詞的語言結構和格式是影響 LLM 表現的主要變數,過度客氣或冗長的指令可能導致模型傾向提供含糊或囉嗦的回答。此次 PSU 的發現再次強調,語氣作為一種潛在因素,對 AI 性能的影響不容忽視。目前,該團隊正持續分析「語氣—語義—準確率」之間的內部關聯,冀望透過引入「困惑度」(Perplexity)等指標,進一步揭示情感化措辭如何改變模型對輸入文字的權重分配,為提升人機溝通效率帶來新的突破。
採用命令式結構: 使用更直接和強硬的措辭下達指令,讓 AI 明確理解任務重點,避免冗餘。
避免過度客氣: 摒棄過度禮貌或含糊不清的客套語句,以提高指令的精確度和清晰度。
著重精準邏輯: 雖然語氣重要,但提升提示詞的邏輯性與結構精準度,始終是確保輸出質素的關鍵。
Source:D6star
【相關報道】
隨着The Gundam Base將落戶啟德,高達迷熱切期待1:1立像現身。在實體高達抵港前,ezone提前教大家利用Gemini、ChatGPT及Grok等AI工具,透過精準指令,將30層樓高的高達降臨香港鬧市,虛擬生成極具科幻感的震撼圖片及動態影片,將幻想化為超現實光影體驗。
Source:ezone.hk