時間:2023-08-25|瀏覽:230
談到機器學習,大家可能會對這個AI方面的概念比較陌生,但如果提到谷歌AlphaGo,大家肯定就很熟悉了。當年谷歌人工智能程序通過機器學習的方式掌握圍棋比賽技巧后,輕松擊敗了多個國家的圍棋冠軍,時隔3年世界冠軍韓國李世石宣布退役時,還高呼AI不可戰(zhàn)勝。通過機器學習訓練后的計算機程序,在某些類似比賽和交易這樣的博弈場景中,是比人類具有更高勝率的。
非小號研究本次就做了一個硬核的試驗:將機器學習技術應用在幣種分析中,看看會有什么好玩的結論,以及是否真的能夠幫助我們交易。
我們的具體課題是,通過現(xiàn)有的市場公開數(shù)據(jù)預測明日收益率為正還是為負(即陽線還是陰線)。
這是一個二分類問題,我們可以使用的模型有很多,這里我們選用了以下模型用于實驗:邏輯回歸LR、線性判別分析LDA、二次判別分析QDA、支持向量機SVC、決策樹DT、隨機森林RF、漸變提升樹GBC等。(看不懂沒關系,對該領域以外的普通人來說是真的太硬核了)
本次用來試驗的數(shù)據(jù)主要有三個方面:1、資產(chǎn)的歷史數(shù)據(jù);2、相關品種,如黃金原油美國三大股指等;3、幣圈相關幣種數(shù)據(jù),主要是主流幣。
完整的機器學習建立流程
1.首先,特征工程
特征工程是機器學習中最關鍵的步驟,沒有之一。這有別于大眾認知的AI能解決一切問題,人工智能是萬能的認知。真實的情況是數(shù)據(jù)科學家們常掛在嘴邊的一句話是“輸入的是垃圾,輸出的也一定是垃圾”,這意味著特征工程做得好不好會直接影響AI的“智商”。特征工程不止是數(shù)據(jù)需要清洗重新組合