人工智能新方向研究證實AI唔鬧唔舒服？語氣粗魯準確度竟然高咁多【附提高AI效能貼士】

| Fung Chun Man | 21-10-2025 16:35 |

美國賓夕法尼亞州立大學最新研究揭示，向 ChatGPT 施加「粗魯」或「挑釁」語氣指令，可將其回答準確度顯著提升高達84.8%。這項實證結果顛覆了傳統 AI 互動禮儀觀念，表明大型語言模型或將強硬措辭解讀為「高權重指令」，從而更專注於任務。研究為提示工程帶來新啟示，提醒語氣是影響 AI 表現的重要潛在變數。

即刻【按此】，用 App 睇更多產品開箱影片

粗魯語氣大勝客氣指令實證數據震驚學界

一則由美國賓夕法尼亞州立大學（Pennsylvania State University, PSU）發布的最新研究，徹底顛覆了我們對人工智能（AI）互動禮儀的認知。該研究證實，當用戶以「粗魯」甚至帶有「挑釁」的語氣向聊天機械人 ChatGPT 下達指令時，其回答的準確度會顯著提高，最高增幅達84.8%。

這項結果挑戰了傳統認為「客氣有禮」的互動方式最能幫助 AI 理解任務的觀念，更為提示工程（Prompt Engineering）領域開啟了全新的思考空間。研究團隊以最新的 ChatGPT-4o 模型為測試對象，設計了50道涵蓋數學、科學與歷史等中高難度領域的多選題，並將每道題目改寫成由「非常禮貌」到「非常粗魯」的五個語氣版本，最終發現，在面對「非常粗魯」語氣的指令時，模型的準確率達到驚人的84.8%，遠高於「非常禮貌」語氣的80.8%。

研究透過配對樣本 t 檢驗（Paired Sample t-Test）進行統計分析，證實語氣對模型的輸出結果具有統計顯著性影響。數據顯示，指令的準確度是從「禮貌」到「中性」、再到「粗魯」呈現穩步上升的趨勢。這表明，ChatGPT 在被「喝罵」後表現更為出色，讓研究人員大感意外。

研究人員指出，這種反直覺的現象，可能源於大型語言模型（LLM）對「情感語氣」的隱性解讀。儘管 AI 本身沒有情感，但其系統或許會將帶有強烈、命令式結構的措辭，解讀為「高權重、明確的指令」。換言之，強硬語氣能有效提升模型對任務本身的專注度，從而輸出更精準的結果。

AI無情感只看權重提示工程開啟新思維

事實上，Google 創辦人謝爾蓋．布林（Sergey Brin）早前亦曾半開玩笑地提出類似看法，認為「威脅」模型反而能讓它更聽話。而 PSU 的實證研究是首次以數據支持了這種業界觀察。不過，研究團隊同時提醒用戶，精進提示設計的關鍵仍在於「精準度與邏輯性」，而非單純的情緒發洩或對 AI 進行辱罵。

過去多項研究已證明，提示詞的語言結構和格式是影響 LLM 表現的主要變數，過度客氣或冗長的指令可能導致模型傾向提供含糊或囉嗦的回答。此次 PSU 的發現再次強調，語氣作為一種潛在因素，對 AI 性能的影響不容忽視。目前，該團隊正持續分析「語氣—語義—準確率」之間的內部關聯，冀望透過引入「困惑度」（Perplexity）等指標，進一步揭示情感化措辭如何改變模型對輸入文字的權重分配，為提升人機溝通效率帶來新的突破。