商湯首創「美顏 Agent」:AI 識聽人話、拒絕塑膠感 講句「想精神啲」即出自然修圖?

| 李兆城 | 27-02-2026 16:41 |
商湯首創「美顏 Agent」:AI 識聽人話、拒絕塑膠感 講句「想精神啲」即出自然修圖?

以往在直播或者拍攝短影音時,用戶最擔心的往往不是沒有美顏效果,而是美顏得太過火。市面上不少修圖軟件會將人臉細節完全抹平,導致畫面出現嚴重的「塑膠感」,甚至失去個人特徵。商湯科技(SenseTime)正式發布突破性的「美顏智能體」,標榜為全球首創結合自然語言指令與 SDK 架構的技術,試圖令 AI 修圖由「手動參數」進化至「語音對話」時代。

這套智能體的最大特色,是賦予了 AI 理解人類模糊需求的能力。用家不再需要在一大堆複雜的滑桿中反覆調校磨皮、瘦臉或亮眼的百分比,只需要簡單講出一句指令,例如「想精神啲」或者「想要氛圍感」,AI 就會自動分析人臉特徵、五官比例及膚質,即時制定出一套度身訂造的美化方案。

無需再用參數滑桿 AI 直接聽懂「精神飽滿」

技術的核心在於一套名為「AI 決策」與「SDK 執行」的協同架構。當系統接收到「膚色透亮」或「上鏡但保持真實」這類主觀要求時,它會根據當下的應用場景,判斷哪些部位需要調整、調整的比例為何,並精準保留皮膚紋理等細節。比起傳統一味抹去瑕疵的範本式濾鏡,這種技術更能避免過度修飾而造成的虛假感。

此外,該美顏智能體融合了生成對抗網絡(GAN)、虛擬試妝及前沿的 AR 演算法。目前技術已可廣泛應用於視頻直播、短影音平台、線上教育以及手機原生相機。無論是進行緊緻提拉還是智能濾鏡處理,其修圖效果都表現得極度穩定且細膩,能有效解決以往濾鏡在動態畫面中容易出現的閃爍或移位問題。

決策架構突破 細節保留拒絕「膠感」

商湯今次推出美顏智能體,背後擁有強大的數據與應用基礎。其 SenseAR SDK 已覆蓋全球超過 20 億台設備,累計調用次數更突破萬億大關。這種大規模的驗證基礎,確保了系統在各種智能硬件與應用場景下,都能保持極高的兼容性與穩定性。

從參數化、模板化進化到深度智能化與個人化互動,美顏技術正進入全新階段。對於創作者而言,這種無需手動微調、效果又自然的方案,無疑大幅提升了製作效率。未來我們在攝影或直播時,可能真的只需要開口說句指令,AI 就會為我們呈現出最合適且真實的美化效果。

Source:SenseTime

相關文章

Page 1 of 9