熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這篇斯坦福論文揭穿了金融界最喜愛的藉口之一:「數據太雜訊了。」
幾十年來,量化分析師一直主張,原始價格在沒有手工製作的指標層疊上是無用的。這篇論文提出了一個更清晰的問題。如果信號已經存在,而我們只是以錯誤的方式看待它呢?
作者建立了一個模型,僅使用原始價格數據來預測標準普爾500指數股票的看漲與看跌走勢。沒有指標。沒有因子庫。只有每日的OHLCV加上明確反映股息和拆分的調整價格。
關鍵不在於更多數據,而在於表徵。
這篇論文不將時間序列視為序列,而是將滾動價格窗口視為空間物件。每個窗口變成一個結構化的矩陣,更接近於圖像而非圖表。這使得卷積濾波器能夠檢測局部模式,如動量變化、波動性聚集和企業行動帶來的結構性變化。
這借鑒了計算機視覺的直覺,而非傳統計量經濟學。
數據集涵蓋每隻股票長達二十年的機構級定價。十個通道為模型提供數據,滑動窗口創建密集的訓練樣本,沒有合成技巧。正規化保持所有特徵的尺度不變。
在架構上,它是一個深度1D CNN。早期層專注於短期結構。更深的層捕捉長期趨勢。與循環模型相比,CNN在處理波動性尖峰和事件驅動的跳躍時更穩定。
任務簡單但嚴格:預測方向,而不是收益,跨越幾天到一個月的時間範圍。訓練經過仔細調整,收斂看起來乾淨而非可疑。
結果讓人感到不安。
幾隻大型股票的驗證準確率達到高80年代和低90年代。摩根大通在較長的時間範圍內達到約91%的準確率。曲線顯示出真正的學習,而不是快速過擬合。
作者保持謹慎。這並未建模成本、執行或滑點。但它確實顯示出一些重要的東西。深度模型可以直接從原始價格張量中內化市場機制,包括大多數管道平滑掉的扭曲。
更大的含義深遠。
特徵工程可能不如你如何框定數據來得重要。通過選擇正確的歸納偏見,模型學會了人類通常試圖硬編碼的結構。
將金融時間序列視為類似圖像的物件並不是一種噱頭。這是對幾十年來手工假設的嚴肅替代方案,並挑戰了市場在沒有大量人為干預的情況下是不可讀的觀念。
...

熱門
排行
收藏
