人工智能之金融量化分析實(shí)戰(zhàn)
金融是一個相對復(fù)雜的體系,而人工智能金融量化分析,更是一個復(fù)雜的系統(tǒng)工程。怎么解讀這項(xiàng)工程呢?這篇文章里,作者嘗試總結(jié)了金融資產(chǎn)進(jìn)行量化分析的一套方法,以真實(shí)數(shù)據(jù)作為實(shí)戰(zhàn)的基礎(chǔ)數(shù)據(jù)進(jìn)行模型搭建,一起來看。
金融是一個非常復(fù)雜的體系,客觀反映了社會運(yùn)行的狀況,金融市場的數(shù)據(jù)指標(biāo)也是社會經(jīng)濟(jì)的晴雨表。對于金融的量化分析,可以從微觀和宏觀兩個方面進(jìn)行。微觀注重個體,宏觀代表趨勢。
本文主要是通過對金融領(lǐng)域中某種資產(chǎn)數(shù)據(jù)指標(biāo)進(jìn)行匯總,從宏觀上探究其規(guī)律,從而實(shí)現(xiàn)計算機(jī)對資產(chǎn)價格進(jìn)行智能預(yù)測。
既然是實(shí)戰(zhàn),本文采用資本二級市場公開的真實(shí)數(shù)據(jù)作為實(shí)戰(zhàn)的基礎(chǔ)數(shù)據(jù)進(jìn)行模型搭建。對于實(shí)戰(zhàn)結(jié)果,僅作為分析參考,并不構(gòu)成投資建議。
對于AI(ArtificialIntelligence,人工智能)領(lǐng)域而言,是個非常龐大且復(fù)雜的系統(tǒng)工程,涉及非常多的基礎(chǔ)知識,人工智能離不開數(shù)據(jù)標(biāo)注,也離不開特征工程,依賴于機(jī)器學(xué)習(xí),又依賴于深度學(xué)習(xí),同時又涉及非常多的人工智能工具和機(jī)器學(xué)習(xí)的框架。
我們知道,機(jī)器學(xué)習(xí)最常見最基礎(chǔ)的的分類是監(jiān)督學(xué)習(xí)(SupervisedLearning)、無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)和半監(jiān)督學(xué)習(xí)(Semi-SupervisedLearning)。
- 監(jiān)督學(xué)習(xí):在給定的數(shù)據(jù)標(biāo)簽中給新數(shù)據(jù)打標(biāo)。
- 無監(jiān)督學(xué)習(xí):給定數(shù)據(jù)類別未知,通過機(jī)器自動分類,進(jìn)行標(biāo)注。
- 半監(jiān)督學(xué)習(xí):有些數(shù)據(jù)有標(biāo)簽,有些數(shù)據(jù)無標(biāo)簽,機(jī)器進(jìn)行分類。
實(shí)現(xiàn)人工智能的前提,在于能將場景數(shù)字化,從而可以進(jìn)行量化分析,并智能執(zhí)行某些策略。可以簡單理解為給定若干輸出,讓計算機(jī)給出輸出,以數(shù)學(xué)的視角進(jìn)行觀測,其實(shí)是在事物與機(jī)器之間建立一個函數(shù)關(guān)系。
我們看到一個小孩,預(yù)測這個小孩將來能長多高,通過經(jīng)驗(yàn)判斷,往往是看小孩子的父母身是多少。父母的身高,其實(shí)就是一個輸入的指標(biāo),對小孩身高的預(yù)測,就是輸出的結(jié)果。
為了提高預(yù)測的準(zhǔn)確性,我們可以增加多個輸入的指標(biāo),例如:小孩的營養(yǎng)狀況,體育鍛煉情況,小孩家族其他長輩們的身高等指標(biāo)。
人工智能對于金融的量化分析,我們也可以采用這種思路,將金融資產(chǎn)的各項(xiàng)指標(biāo)進(jìn)行定義,通過對現(xiàn)有數(shù)據(jù)多維度的指標(biāo)作為輸入條件,現(xiàn)有數(shù)據(jù)多維度指標(biāo)對應(yīng)的輸出結(jié)果進(jìn)行機(jī)器學(xué)習(xí),建立數(shù)據(jù)模型,然后將新的金融多維數(shù)據(jù)作為參數(shù)輸入,由人工智能引擎結(jié)合數(shù)據(jù)模型給出相應(yīng)的結(jié)果輸出。
金融量化模型構(gòu)建基礎(chǔ)邏輯,就是選取相近的金融資產(chǎn),根據(jù)這些相近的金融資產(chǎn)各項(xiàng)基礎(chǔ)數(shù)據(jù)為機(jī)器學(xué)習(xí)樣本,最后通過輸入一個新的金融資產(chǎn),來通過其各項(xiàng)指標(biāo)預(yù)測輸入金融資產(chǎn)具備的價值。主要過程如下。
1)建立指標(biāo)。我們首先建立對金融資產(chǎn)進(jìn)行量化分析的指標(biāo),本文中,我們可以建立的指標(biāo)主要如下。當(dāng)然實(shí)際分析中,我們也可以選擇其他維度的指標(biāo)進(jìn)行補(bǔ)充。通過對機(jī)器學(xué)習(xí)結(jié)果的評價,以及模型的不斷調(diào)整,從而選取更優(yōu)秀的指標(biāo),從而提升機(jī)器學(xué)習(xí)的質(zhì)量。
2)數(shù)據(jù)準(zhǔn)備。有了以上指標(biāo),我們對相似的資產(chǎn)進(jìn)行數(shù)據(jù)準(zhǔn)備??紤]到篇幅限制,為了在一個頁面中顯示的數(shù)據(jù)清晰些,指標(biāo)我們做一些精減,精減后的數(shù)據(jù)樣例如下。機(jī)器學(xué)習(xí)的基礎(chǔ)數(shù)據(jù)是第2行之后的數(shù)據(jù),之后我們通過輸入第2行的參數(shù),來預(yù)測【上海臨港】的資產(chǎn)價格。
在選取機(jī)器學(xué)習(xí)數(shù)據(jù)時,我們盡可能的選擇量化分析同類型的資產(chǎn)數(shù)據(jù),例如本文的實(shí)戰(zhàn)中想預(yù)測【上海臨港】資產(chǎn)的價格,我們要找同【上海臨港】相近的資產(chǎn)標(biāo)的?!旧虾ER港】屬于房地產(chǎn)業(yè),而且又屬于國資改革、園區(qū)開發(fā)、創(chuàng)投等概念題材。
我們可以根據(jù)策略,獲取彼此相近的全量數(shù)據(jù),之后我們再對全是數(shù)據(jù)進(jìn)行優(yōu)選,這個評價的過程,類似于比賽中的評委評分,去掉一個最高分,去掉一個最低分,例如,我們選取的數(shù)據(jù)中,市盈率和其他數(shù)據(jù)的市盈率偏差非常大的,我們也可以舍去。當(dāng)然實(shí)際過程還有很多影響因子,需要具體情況具體分析。
3)工具準(zhǔn)備。本次機(jī)器學(xué)習(xí)使用的工具是Spyder,通過Python語言實(shí)現(xiàn)。Python相關(guān)環(huán)境的搭建比較基礎(chǔ),在這里不做太多講解,大家直接下載一個ANACONDA開發(fā)工具即可。
當(dāng)然,大家如果習(xí)慣使用其他機(jī)器學(xué)習(xí)的工具,也可以采用其他的,只要方便的就可以,基礎(chǔ)原理其實(shí)都是一樣的。
4)數(shù)據(jù)整理。我們開始以準(zhǔn)備好的數(shù)據(jù)文件為樣例讀入,并進(jìn)行數(shù)據(jù)整理,為后續(xù)機(jī)器學(xué)習(xí)做準(zhǔn)備。
我們可以查看導(dǎo)入的數(shù)據(jù),來檢查導(dǎo)入的數(shù)據(jù)是否有遺漏。
之后,我們將導(dǎo)入的數(shù)據(jù)進(jìn)行整理,去掉【資產(chǎn)名稱】和【資產(chǎn)代碼】,因?yàn)檫@些數(shù)據(jù)在我們的機(jī)器學(xué)習(xí)過程中無使用價值。整理后的數(shù)據(jù),如下所示。
5)機(jī)器學(xué)習(xí)。接下來我們對已有的樣本數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)模型有很多,本文使用比較簡單的線性回歸模型進(jìn)行機(jī)器學(xué)習(xí)。在項(xiàng)目中引入Sklearn,受于篇幅限制Sklearn詳細(xì)用法,大家可以在網(wǎng)上查閱相關(guān)資料。
6)結(jié)果預(yù)測。我們將對【上海臨港】資產(chǎn)價格進(jìn)行預(yù)測,其基本的指標(biāo)如下。
將以上指標(biāo)作為輸入條件錄入機(jī)器學(xué)習(xí)模型中,生成結(jié)果。
預(yù)測結(jié)果:
根據(jù)機(jī)器學(xué)習(xí)相當(dāng)數(shù)據(jù)后,對【上海臨港】資產(chǎn)預(yù)測是【13.19元】,也就意味著結(jié)合與其相似的資產(chǎn)的現(xiàn)狀,給出【上海臨港】在當(dāng)前背景下,資金價格應(yīng)該值【13.19元】。
我們看了一下【2024年1月31日11:30】這個時點(diǎn)的【上海臨港】的價格為【10.11元】,這說明在當(dāng)前背景下,【上海臨港】的價格相對于同類資產(chǎn),其實(shí)是低估的,仍然有一定的增長空間。
雖然我們在本次人工智能金融量化分析實(shí)戰(zhàn)使用的是真實(shí)的金融數(shù)據(jù),但是由于數(shù)據(jù)樣本量太少,機(jī)器學(xué)習(xí)的結(jié)論可能精度不夠。我們使用的機(jī)器學(xué)習(xí)模型也比較單一,我們可以結(jié)合更多的機(jī)器學(xué)習(xí)模型,來提升機(jī)器學(xué)習(xí)的質(zhì)量。
機(jī)器學(xué)習(xí)的過程也需要依賴非常多的基礎(chǔ)條件才能不斷提升機(jī)器學(xué)習(xí)效果,需要海量的數(shù)據(jù),也需要不斷對指標(biāo)和模型進(jìn)行調(diào)優(yōu),以及結(jié)合各種評價方法,使得機(jī)器學(xué)習(xí)的結(jié)論可以邏輯自洽。
對于本文而言,最大的價值在于我們建立了一個對金融資產(chǎn)進(jìn)行量化分析的簡單方法。在此方法基礎(chǔ)上,我們可以結(jié)合更多的數(shù)據(jù)以及指標(biāo),來使得機(jī)器學(xué)習(xí)的結(jié)果更為精準(zhǔn)。
在此基礎(chǔ)上,構(gòu)建一個金融人工智能的平臺,對其他資產(chǎn)進(jìn)行實(shí)時快速預(yù)測從而判斷當(dāng)前的資產(chǎn)價格是高估還是低估,以及是否有投資的空間。從而進(jìn)一步作為計算機(jī)交易的參考因子,結(jié)合其他量化模型,給出決策參考或是智能投資。
另外我們在基礎(chǔ)的金融量化分析模型的基礎(chǔ)上,還可以升級為量化分析引擎,作為金融大模型的基礎(chǔ)服務(wù)之一,使用ChatGPT或是其他嵌入式的工具,快速為用戶或是機(jī)構(gòu)提供便捷準(zhǔn)確的金融服務(wù),進(jìn)而提升整個社會的金融運(yùn)行效率以及質(zhì)量。
人工智能金融量化分析,是一個非常復(fù)雜的系統(tǒng)工程,受限于作者水平,不能面面俱到,如果有不足之處,請大家指正!也非常歡迎朋友們隨時交流。感謝大家閱讀!
專欄作家
王佳亮,微信公眾號:佳佳原創(chuàng)。人人都是產(chǎn)品經(jīng)理專欄作家,年度優(yōu)秀作者。《產(chǎn)品經(jīng)理知識?!纷髡?。中國計算機(jī)學(xué)會高級會員(CCF Senior Member)。專注于互聯(lián)網(wǎng)產(chǎn)品、金融產(chǎn)品、人工智能產(chǎn)品的設(shè)計理念分享。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!