香港科技大學工商管理學院(科大商學院)的研究團隊近日宣布推出金融界專用的生成式人工智能(Generative AI,GenAI)開源大語言模型「InvestLM」,冀業界能藉此提升金融相關領域的服務質量。
科大研究團隊指出,「InvestLM」的表現獲包括對沖基金經理及財經分析師的金融專家評為可媲美最先進商用大語言模型,如GPT-3.5、GPT-4和Claude-2等,印證「InvestLM」在理解金融文本的強大能力,同時具備提高金融專業人士工作效率的潛力,包括提供投資意見、撮寫財經文章、從文件報告中提取資料和總結等。
據指,科大商學院的研究團隊透過指令微調技術,利用經精選的廣泛類型財經問答文本,對開源基礎通用大語言模型LLaMA-65B進行訓練來開發出「InvestLM」。相較於基礎通用大型語言模型LLaMA-65B,「InvestLM」在控制輸出「人工智能幻覺」內容方面表現更加優秀。
科大商學院院長譚嘉因教授表示,這項研究將對金融業帶來重大影響,不僅為金融界開展創新應用提供了啟發,也展現科大在擁抱生成式AI方面的領先地位。同時,這個大語言模型項目的成果將開放給各界使用,將進一步促進行業的創新和發展。科大商學院資訊、商業統計及營運學系副教授楊毅提到,「InvestLM」是首個開源財經領域大語言模型,其對金融文本的處理能力獲得業界專業人士的肯定。通過分享這一項目的見解,科大希望能夠為金融及其他領域的人士提供有用的參考,以充分利用生成式AI的潛力。
科大商學院資訊、商業統計及營運學系副教授楊毅提到,「InvestLM」是首個開源財經領域大語言模型,其對金融文本的處理能力獲得業界專業人士的肯定。通過分享這一項目的見解,科大希望能夠為金融及其他領域的人士提供有用的參考,以充分利用生成式AI的潛力。
研究團隊的發現還包括,在算力有限的情況下,以領域特定的高質素指令訓練大語言模型對提高模型處理特定任務的能力更有效。此外,對於規模較小的大語言模型進行指令微調的成效高於規模較大的模型,為模型開發者在資源有限情況下提供新思路。
【熱門報道】
Source:hket