期交所雙月刊66期
18 伴隨著成交量放大、且三大法人買超等,大部分投 資人都會認為明天繼續漲的機率比較大。我們可利 用這些今天 「已經發生過的事實(狀態)」,去 預測計算 「明天股票漲跌的機率分佈」。 在 1980 年代,當時沒有人這樣去做交易,除 了賭徒。大部分的撲克牌玩家都是如此,根據目前 公開的牌型、剩餘的牌數、對手的表情變化等作為 觀察,判斷是否要跟進或是減碼。而西蒙斯的確就 是把交易當作賭博,只是用更科學更數學的方法, 分析最有利的下單方式。 上述提到的方法在 IDA 的內部論文發表,應 該是第一篇量化交易相關論文,可惜已不可考。而 為了判斷股價目前處於何種狀態,進而推估機率, 西蒙斯需要這領域最專業的數學家。他邀請到了 當時做隱藏馬可夫模型( Hidden Markov Model ) 相當有名的數學家鮑姆( Leonard E. Baum )加入 IDA ,鮑姆當然也是這篇論文的另一個作者之一, 其發展的 Baum-Welch algorithm ,相信研究機器 學習的朋友都不陌生。這演算法主要是用來尋找隱 藏馬可夫模型的未知參數以及相對應的機率分佈。 簡單的說,我們並不知道到底什麼特徵或參數適合 用來當作明天股市漲跌的依據,事後來看我們只知 道明天股市是漲還是跌,且這是一次性的結果。但 Baum-Welch algorithm 可根據一連串的漲跌分布 結果,推測出過程可能用到的隱藏特徵(狀態)。 簡單的說就是讓你知道何者機率搭配賺賠比的期 望值最大,讓你預測最接近真正的答案。這在後來 凱利法則( Kelly Criterion )的銅板賭局上,也是 根據預估的機率與賠率決定最佳下注比例。某種程 度來說,交易買賣、語音辨識、破解密文皆很符合 隱藏馬可夫鏈的設定。 文藝復興公司締造了人類歷史上不可抹滅的 傳奇。世人仍不知西蒙斯是如何做到。即使是機器 學習、神經網路技術日趨成熟,依然沒有一檔基金 績效可以與大獎章匹敵。不論是在大型金融機構, 或是學術文獻裡,已有大量的機器學習方法廣泛地 應用於量化交易中,研究人員試圖利用其在複雜資 料間尋找潛在模式的能力來建構有利可圖的交易 關鍵看法 Dialogue 策略。例如運用遺傳演算法搜尋最佳參數、運用決 策樹分類器判斷漲跌,決定買進和賣出的時機點, 可能用於單一商品或是投資組合,優化績效、最佳 化穩定度,控制適當的槓桿部位,這些都是研發量 化交易策略相當重要的議題。 運用機器學習方法 傳統的機器學習方法已被廣泛用於量化交易 許多面向,包含交易點位、選股、股價預測等。 直觀來說,我們會想利用迴歸類型演算法嘗試預 測股價趨勢,然而金融市場複雜多變,線性模型 無法反映市場真實情況,因此非線性模型的使用 逐漸增加。其中又以監督式學習的機器學習模型 最為熱門,包括隨機森林( Random Forest )、支 持向量機( Support Vector Machine, SVM )、單 純貝式分類器( Naive Bayes Classifier )等。至於 如何將這些機器學習模型套用至策略研發上,大 部分作法以預測股價漲跌為主。換句話說,透過 歷史資料標記什麼樣的特徵會漲會跌,再以分類 演算法進行分析,這是最直觀的機器學習應用於 量化策略的方式。 除此之外,傳統的交易策略建構,指標與訊號 的選取是關鍵,大部分策略開發者會花很多力氣在 參數的選擇,例如該使用 5MA 、還是 10MA 。停 損與停利該採用的損益百分比。傳統的作法是把所 有參數都回測一遍,找出最佳損益報酬與穩定的參 數。然而,當策略指標越多、可選擇的參數也越多, 參數可能的組合呈現指數成長,這時暴力搜尋方法 可能會變得沒有效率,好在資料探勘演算法有許多 專門適合效率搜尋參數的技巧,包含基因演算法、 粒子群演算法、蟻群演算法等。這類的方法通常用 於參數搜尋最佳化問題上,由於其高效尋找最佳解 的優勢,經常被用來將做量化策略的參數最佳化, 使得我們不必再窮舉所有可能的參數組合,在茫茫 指標中尋找有利可圖的聖盃。 然而,時間序列的分析很著重時間與空間環境 的改變,畢竟十年前的時空背景絕對與現在的時空 環境不同。在大方向上,任何一檔商品的波動特性
Made with FlippingBook
RkJQdWJsaXNoZXIy NDEyMzQ=