調研|金融行業(yè)垂類大模型的應用現狀

0 評論 3509 瀏覽 10 收藏 20 分鐘

作為這一變革的前沿,金融行業(yè)垂直領域的大模型應用已經開始在金融服務的多個方面展現出其巨大的潛力和價值。本文將深入探討金融行業(yè)垂類大模型的應用現狀,分析其市場前景、分類、主要參與主體以及典型案例,并討論在實際落地過程中面臨的挑戰(zhàn)。

當前,國內互聯(lián)網企業(yè)、傳統(tǒng)金融機構及金融科技企業(yè)爭相競逐,“百模大戰(zhàn)”如火如荼,AI與金融的結合也日益深化。從通用大模型向金融產業(yè)大模型的轉變,逐步改變著傳統(tǒng)金融行業(yè)的運作模式和業(yè)務流程。國內外金融大模型如軒轅、貔貅、支付寶的AntFinGML、騰訊云金融大模型等等逐步在推進使用中。

01 發(fā)展背景

1. 通用模型難以提供深度服務

隨著AI技術的不斷升級的,AIGC技術的實踐效用迎來了行業(yè)級大爆發(fā)。在內部模型自身迭代和多技術協(xié)同的作用下,出現了集圖像識別、語義理解、視覺感知于一體的多模態(tài)體系。然而,由于行業(yè)深度信息的缺失,通用大模型在特定領域很難提供高價值、專業(yè)化的服務。

2. 行業(yè)需求與模型能力契合

金融行業(yè)屬于數據、信息密集型產業(yè),對于多渠道信息匯總與數據處理能力有較高要求;同時,行業(yè)要求從業(yè)人員專業(yè)知識儲備與經驗,來完成對金融業(yè)務的判斷、咨詢服務、報告產出等工作。

而相對應的,大模型恰好有很強復雜信息處理能力,以及基于原始數據和經驗給出相應解決方案方面的能力。

02 金融垂類大模型行業(yè)現狀

1. 市場前景

據智研瞻統(tǒng)計顯示,2019年中國金融大模型行業(yè)市場規(guī)模250.49億元,2024年Q1中國金融大模型行業(yè)市場規(guī)模90.82億元,同比增長7.10%。2019-2024Q1年中國金融大模型行業(yè)市場規(guī)模如下:

根據畢馬威中國發(fā)布的《2024中國金融科技企業(yè)首席洞察報告》的揭露,70%的受訪企業(yè)認為新質生產力能提升金融科技企業(yè)自主創(chuàng)新能力,并帶來新機遇。同時,91%的受訪企業(yè)看好大模型金融應用前景。

2.金融大模型分類

從服務細分領域、應用場景、開源狀態(tài),對金融大模型進行分類:

3. 主要參與主體

在金融大模型的應用方面,傳統(tǒng)金融機構、金融科技公司和互聯(lián)網金融公司各有優(yōu)勢,故提供的服務也有所差異。

傳統(tǒng)金融機構

其主要優(yōu)勢是:豐富的行業(yè)經驗與專業(yè)知識,有助于將生成式AI應用于復雜的金融決策和客戶服務中;成熟的合規(guī)框架,能夠確保AI應用符合行業(yè)法規(guī)和標準。豐富的客戶數據,為生成式AI提供了訓練和優(yōu)化的基礎,支持個性化推薦和服務。強大的資金支持,可以投資于AI技術的研發(fā)和基礎設施建設;強大的品牌信譽,使客戶對傳統(tǒng)金融機構的信任度較高,增強了新服務的接受度。

金融科技公司

金融科技(FinTech)公司領域主要服務于企業(yè)客戶(B端),主要提供如在線支付處理、借貸平臺、財務管理軟件、企業(yè)保險解決方案、區(qū)塊鏈技術應用和數據分析服務等,其核心職能是為金融機構提供廣泛的技術支持和解決方案。

其主要優(yōu)勢是:

  • 良好的技術基礎,許多金融科技公司在技術基礎設施上已具備一定優(yōu)勢,能夠快速集成和部署生成式AI模型,提升現有服務;
  • 專業(yè)化解決方案,結合生成式AI,利用各種低代碼模版,來快速提供定制化的支付、融資和風險管理解決方案;
  • 更高效的集成能力,它們通常具備強大的API接口,在結合大模型方面,可快速便捷與企業(yè)現有系統(tǒng)快速集成,實現無縫對接。

互聯(lián)網金融公司

互聯(lián)網金融公司指針對面向零售投資者(C端)市場提供的金融服務,如智能投資顧問、市場情況預測、個性化財務規(guī)劃、個人投資組合風險評估、金融知識教育培訓等。

其主要優(yōu)勢是:

  • 快速響應市場需求,通過生成式AI實時分析數據,快速推出符合用戶需求的新產品和服務。
  • 重視用戶體驗,較重視用戶界面和交互設計上,結合大語言模型,能夠提供更流暢的用戶體驗,簡化用戶注冊、投資和咨詢的過程。
  • 高度的個性化服務,結合用戶行為數據和生成式AI,能夠提供高度個性化的投資建議和財務規(guī)劃。
  • 更廣泛的數據整合,相對于傳統(tǒng)金融機構,能整合來自多種渠道的數據,提供全面的用戶畫像,支持更精準的服務。

03 金融大模型典型案例

1. 基本技術架構

垂直類大模型是基于通用大模型進行二次的開發(fā)。先檢索相關的知識,然后基于召回的知識進行回答,也就是基于檢索增強的生成。一般要經過三個步驟:

(1)ContinuePreTraining:給模型注入領域知識,即用金融領域內的語料進行繼續(xù)的預訓練。一般為了保持模型的通用能力,還需要注入混雜的通用數據。(2)SFT:通過SFT可以激發(fā)大模型理解領域內各種問題并進行回答的能力(3)RLHF:通過RLHF可以讓大模型的回答對齊人們的偏好,比如行文的風格。

2. 國外典型案例

國外金融市場更開放、發(fā)達,業(yè)務量和用戶數較多,且金融服務要求更高。在NLP出現初期,很多公司就前仆后繼地開發(fā)大模型或者開發(fā)AIagent。

BloombergGPT——閉源模型

BloombergGPT是彭博社于2023年推出的金融垂直領域大語言模型,是一個有500億參數、基于BLOOM模型的LLM,該團隊采取通用模型和特定領域模型混合分析的方式,直接從0訓練一個的金融領域大模型。其主要優(yōu)勢有以下幾點:

① 數據來源可靠。由于彭博社在幾十年的金融業(yè)務中積累了大量的金融數據和文件,擁有先天的數據優(yōu)勢,數據來源可靠。

② 金融數據集來源豐富,token數量大。其在金融領域數據集共包含了3630億個token,占總數據集token量的54.2%,具體由以下幾個部分構成:

③ 模型應用表現好。團隊分享了模型的三個定性示例:1)生成Bloomberg查詢語言,BloombergGPT可以被用來通過將自然語言查詢轉換為有效的BQL,使BQL更易于訪問。2)生成新聞標題。由于它在許多新聞文章上進行了訓練,可以幫助生成新聞標題。3)金融問答。由于金融領域訓練數據,智能問答覆蓋面廣

FinGPT——開源模型

FinGPT是AI4Finance基金會發(fā)起的一個專注于金融領域的大型語言模型,它致力于通過構建開放源碼的金融大語言模型來推動金融科技(Fintech)的發(fā)展和創(chuàng)新。

① 基座模型:開源LLaMA或者ChatGLM,

② 數據集:新聞網站、社交媒體、公司公告、趨勢(google或者baidu等搜索引擎)、其他公開數據集

③ 訓練方法:LoRA和RLSP(根據股票價格的強化學習)

④ 模型框架

數據源層:通過整合新聞網站、社交媒體平臺、財務報表、市場趨勢等數據,確保全面的市場覆蓋。

數據工程層:專注于NLP數據的實時處理,以應對金融數據固有的高時間敏感性和低信噪比的挑戰(zhàn)。

LLMs層:整合各種微調方法,優(yōu)先考慮輕量級自適應,以保持模型的更新和相關性。

應用層:提供金融任務的實踐教程和演示應用程序,包括機器人咨詢服務、量化交易和低代碼開發(fā)。

⑤ 優(yōu)勢

國外首個金融行業(yè)垂直類開源大語言模型。主要給金融研究人員和從業(yè)者提供可訪問和透明的資源,來開發(fā)自己的的FinLLM或潛在的應用程序。解決金融數據獲取難、處理難的問題,旨在開源領域實現互聯(lián)網規(guī)模的金融數據民主化。

基于GPT的各種金融模型和AIagent

(1)BondGPT:2023年6月全球金融科技領導者Broadridge的子公司LTX,通過GPT-4打造了BondGPT,該模型主要用于債券市場,幫助客戶回答各種與債券相關的問題。幫助金融機構、對沖基金等簡化債券投資流程并提供投資組合建議。比如輸入問題:我有100萬美元資金,想投資5年,有哪些高收益的債券選擇?BondGPT會回答符合需求的公司名字、利率、價格、發(fā)布日期、到期日期、債券評級等信息。

(2)PortfolioPilot:由SEC注冊投資顧問機構——GlobalPredictions于2022年11月推出,為投資者提供全球投資組合管理、投資顧問、AI助理等服務,是美國的智能投顧平臺。目前PortfolioPilot已積累逾3萬名用戶,為約200億美元資產提供AI大模型+智能投顧服務。

其核心模塊:追蹤模塊能借助大模型技術,為用戶呈現投資組合管理的可視化工具,包括大類資產配置結構、資產相關性矩陣等;提升模塊能基于AI大模型所生成的全球經濟洞察觀點,對用戶投資組合進行評分分析,找出用戶投資組合薄弱之處并提供個性化的改善建議;探索模塊主要包括新聞、研究、預測三大功能,匯總關鍵新聞幫助投資者及時了解行業(yè)信息。

3. 國內典型案例

國內金融市場發(fā)展較晚,且開放性不足,另外NLP發(fā)展速度也稍落后于國外。但由于國內市場需求大,金融機構數量多,2023年間金融垂類大模型蓬勃發(fā)展。

軒轅-開源

軒轅是度小滿的大模型團隊,在2023年基于BLOOM-176B架構,針對中文通用領域和金融領域進行針對性預訓練和微調的千億級對話大模型。目前,已實現開源的全參數模型矩陣達17個。在此基礎上,今年9月份度小滿在始智AIwisemodel社區(qū)重磅開源發(fā)布第三代大模型「軒轅3.0」,包括對話模型和預訓練模型?!杠庌@3.0」在金融場景中的任務評測中表現突出,并且在金融事件解讀、金融業(yè)務分析、投研應用能力和風險管理等測量維度上超越GPT4o。

其數據集采用度小滿實際業(yè)務場景積累的金融數據,對金融相關問題的理解比通用大模型更有優(yōu)勢。因此在模型評估方面,在金融場景中的任務評測中,軒轅全面超越了市場上的主流開源大模型,贏得了150次回答中63.33%的勝率,充分凸顯了其在金融領域的顯著優(yōu)勢。在通用能力評測中,軒轅有10.2%的任務表現超越ChatGPT3.5,61.22%的任務表現與之持平,涉及數學計算、場景寫作、邏輯推理、文本摘要等13個主要維度。2023年在中文任務評測C-Eval和CMMLU榜單中名列開源首位。

HithinkGPTvs妙想金融

作為國內toC金融公司的佼佼者,同花順和東方財富公司在金融大模型方面的競爭也不相上下,在2024年1月,相繼推出HithinkGPT和妙想金融大模型。目前同花順問財已經開始啟用,妙想app還處于內測階段。下面從技術方面和用戶體驗方面進行簡單對比:

1-技術方面:從技術架構、token數、落地方式等角度,比較兩個模型。

2-用戶體驗方面:由于妙想內測審核暫未通過,故只初步體驗了HithinkGPT問財,后續(xù)看機會再更新兩者的對比。

優(yōu)勢:

  • 市場覆蓋廣:涉及多個金融市場,如A股、港股、美股、基金、債券等等
  • 功能豐富:支持查詢、分析、對比、解讀、建議多等等,包含在選股票、診股票、看行情、看新聞等股民常用功能方面表現較好。
  • 回答內容豐富:通過動態(tài)折線圖、動態(tài)雙柱圖、K線圖等圖表增強可視化能力,還有多種投資數據。

不足:

  • 整體界面:HithinkGPT是基于問財上直接套用,對比傳統(tǒng)引擎,用戶體驗還未跟上
  • 分析較淺顯:分析的深度還不太夠,無法取代專業(yè)投顧。
  • 偏向于技術分析:在回答個股的問題時,兩個模型均注重于估值、技術、資金流向,對基本面內容的回答較少。
  • 回答準確率偏低:針對用戶的提問,偶爾出現答非所問的情況,聯(lián)系上下文的能力不強。有些問題的邏輯框架不順暢。

總體來說,目前問財已經進入商業(yè)化收費階段,雖然在投顧方面有了一定的幫助,但是吸引用戶去購買更深層次服務的吸引力不夠,還需更加努力。特別是在競爭對手也逐步進入商業(yè)化階段的背景下,要積極重視提高模型準確率、內容豐富度和用戶體驗等方面。

04 金融模型落地挑戰(zhàn)

  1. AI模型的幻覺問題。由于數據質量問題、訓練方式問題、缺乏外部知識校驗等原因,可能導致大模型易生成與事實不符的內容,在金融這樣對精度要求較高的領域,這種錯誤可能帶來嚴重后果。
  2. 成本問題。金融大模型需要進行大量數據的訓練和長時間的實驗,因此開發(fā)大模型需要長期戰(zhàn)略發(fā)展規(guī)劃,需要投入高性能設備、龐大的算力資源(CPU、GPU)、電力資源、長期的無回報資金以及專業(yè)的技術人員支持等,這使得該技術在開發(fā)階段就存在很高的準入門檻。
  3. 安全合規(guī)要求高,數據泄漏、數據隱私問題。金融行業(yè)有很多數據的安全管理規(guī)范、技術標準,但在大模型時代,他們在模型訓練、推理中到底起到了什么作用,哪些數據要進行脫敏化處理,需要結合大模型的應用場景和用戶需求形成行業(yè)最佳實踐。如何在保證安全的同時利用數據訓練模型,是行業(yè)要面對的挑戰(zhàn),數據泄露的風險比行業(yè)深度信息缺失還要嚴重。

相關資源來源

  1. BloombergGPT:ALargeLanguageModelforFinance——ShijieWu1,?,Ozan˙Irsoy1,?,StevenLu1,?,VadimDabravolski1,MarkDredze1,3,SebastianGehrmann1,PrabhanjanKambadur1,DavidRosenberg2,GideonMann1
  2. FinGPT:Open-SourceFinancialLargeLanguageModels——HongyangYang,Xiao-YangLiu,ChristinaDanWang
  3. XuanYuan2.0:ALargeChineseFinancialChatModelwithHundredsofBillionsParameters——XuanyuZhang,QingYangandDongliangXu
  4. 《2024年中國金融大模型產業(yè)發(fā)展洞察報告》——艾瑞咨詢
  5. 《2024中國金融科技企業(yè)首席洞察報告》——畢馬威
  6. 智研瞻產業(yè)研究院報告

作者:seven777,公眾號:商業(yè)知行俠

本文由 @seven777 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!