時間:2021-04-05|瀏覽:1021
十五年前,我逐漸探尋虛擬貨幣的全球,并建立了一個只應(yīng)用SMS的點到點的挪動貸幣服務(wù)平臺。
我的一個合作方近期跟我說人工智能技術(shù)能不能預(yù)測分析數(shù)字貨幣的價錢。她對區(qū)塊鏈技術(shù)的宣傳策劃覺得好奇心。
根據(jù)科學(xué)研究,我發(fā)現(xiàn)了,預(yù)測分析數(shù)字貨幣的價錢是個能夠 處理的難題,但它并不是對于全部銷售市場狀況。
一個典型性的數(shù)據(jù)加密財產(chǎn)預(yù)測模型將應(yīng)用時間序列分析預(yù)測分析(如ARIMA,FacebookProphet),深度學(xué)習(xí)(如隨機(jī)森林優(yōu)化算法,線性回歸),或是深度神經(jīng)網(wǎng)絡(luò)方式(如LSTM)。
本文科學(xué)研究了在給出日期預(yù)測分析Litecoin均價時,按段內(nèi)插的實際效果。
在2013年4月至2021年2月期內(nèi),大家會關(guān)心Litecoin的歷史價格查詢。該數(shù)據(jù)信息來自于coinmarketcap,可供免費(fèi)試用。把數(shù)據(jù)信息分為80%的訓(xùn)煉數(shù)據(jù)和20%的數(shù)據(jù)測試集。后一種方式用于評定大家預(yù)測分析的收盤價格。
AI能預(yù)測分析數(shù)字貨幣的價錢嗎?
Litecoin數(shù)字貨幣的價格歷史(Source:Kaggle)
短期內(nèi)探究性數(shù)據(jù)統(tǒng)計分析說明,今年初和年底的均值收盤價格最大。
多項式回歸法
大家或許聽聞過多項式回歸,它是創(chuàng)建根據(jù)d的階次類似的非線性函數(shù)(在大家的事例中,數(shù)字貨幣價錢起伏)的非常簡單的事例。
針對Litecoin,我就用5、25和80的級別對歷史價格查詢開展了簡易的多項式回歸。每一次,R2值都是會在數(shù)據(jù)測試集在出示相關(guān)實體模型合乎或不符實體模型的一些信息內(nèi)容。
由下列綠線對訓(xùn)煉數(shù)據(jù)信息的擬合程度能夠 看得出,曲線圖伴隨著代數(shù)式的提升而變陡。因為高級代數(shù)式嘗試跟蹤訓(xùn)煉集中化的每一個單一數(shù)據(jù)信息點,因而提升了實體模型的多元性。
2013年4月30日為0天,2021年2月28日為2800天。
特別是在在存有出現(xiàn)異常值的地區(qū),高級代數(shù)式趨向于向出現(xiàn)異常值發(fā)展趨勢。結(jié)果顯示,80次代數(shù)式實體模型標(biāo)準(zhǔn)差較大。
與之對比,低級代數(shù)式中的R2值較低,表明較高的誤差,但標(biāo)準(zhǔn)差較小,因而對訓(xùn)煉數(shù)據(jù)信息的危害也較小。低等代數(shù)式對訓(xùn)煉數(shù)據(jù)信息不比較敏感。
內(nèi)置式插值法
我發(fā)現(xiàn)一種更靈便的方式,便是應(yīng)用按段代數(shù)式預(yù)測分析數(shù)字貨幣的價錢。
選用低級多項式擬合片段插值法中很多數(shù)據(jù)信息點。由于大家只應(yīng)用低級代數(shù)式,因此 大家清除了不收斂性和過振。
得出一組數(shù)據(jù)信息點,分塊插值法便是根據(jù)對各一部分?jǐn)?shù)據(jù)信息應(yīng)用不一樣的代數(shù)式來開展。
從總體上,大家應(yīng)用了聯(lián)接分塊代數(shù)式,也叫樣條。
下邊的斷開線性函數(shù)便是一個樣條實例。4左側(cè)的是平的,稱為涵數(shù)的節(jié)點。
為發(fā)覺數(shù)字貨幣價錢中存有的高寬比曲線圖關(guān)聯(lián),大家應(yīng)用了一種斷開三次函數(shù),也稱之為三次樣條。
運(yùn)用三次樣條,大家把數(shù)據(jù)信息分為好多個塊,每一個塊相匹配一個三次樣條。每一個樣條涵數(shù)都聯(lián)接到下一個連接點上。
因為聯(lián)接是光滑的,因此 三次樣條是數(shù)字貨幣價錢轉(zhuǎn)變 的非常好的挑選。三次樣條的切線斜率以及第一和第二導(dǎo)函數(shù)均相符合。三次樣條是一個代數(shù)式的3階涵數(shù),它依然不大,能夠 防止出現(xiàn)差別。
三階樣條是三次樣條的一種較簡易的組合,它能夠 合理地開展測算,由于數(shù)最多五個基函數(shù)參加了奉獻(xiàn)插值法。下面的圖是B-樣條在Litecoin價錢上的三次主要表現(xiàn),在四分位后再加上節(jié)點。
在我們有著一組數(shù)據(jù)信息點時,根據(jù)手工制作挑選節(jié)點,與根據(jù)四分位數(shù)置放節(jié)點時的值對比,我們在數(shù)據(jù)測試集中化得到了更強(qiáng)的R2。
三次樣條挨近界限的時候會看起來很怪異,你能在上面鮮紅色的數(shù)據(jù)圖表中注意到。當(dāng)然三次樣條法根據(jù)將一個三次代數(shù)式在每一個極限點上變成線形,強(qiáng)制性涵數(shù)在極限點之外為線形。
純天然的三次樣條曲線必須隨意選擇。就Litecoin的價錢來講,我根據(jù)交叉驗證找到最佳可玩性:挑選適合的174個連接點的量子科技做為預(yù)測分析日期。試驗說明,與三次B-樣條曲線對比,該曲線圖邊沿差異較小,R2差一些。
最后完成了光滑樣條,在降到最低均方誤差的另外對價錢的轉(zhuǎn)變 開展了處罰。
光潔樣條可能是最合適Litecoin價錢的分塊插值法方式。這一實體模型在數(shù)據(jù)測試集在完成了最佳的R2值。
三次樣條實體模型最振奮人心的地區(qū)取決于,它超過了用于訓(xùn)煉實體模型的數(shù)據(jù)信息開展推理。
RobJhyndman是一位知名的遺傳學(xué)家,他科學(xué)研究了時間序列分析預(yù)測分析方式,他強(qiáng)調(diào),三次光潔樣條實體模型在預(yù)測分析上與ARIMA實體模型是等額的的,可是主要參數(shù)室內(nèi)空間比較有限。羅布覺得樣條實體模型出示了光潔的歷史時間發(fā)展趨勢和線形預(yù)測分析涵數(shù)。