這篇斯坦福論文揭穿了金融界最喜愛的藉口之一:「數據太雜訊了。」 幾十年來,量化分析師一直主張,原始價格在沒有手工製作的指標層疊上是無用的。這篇論文提出了一個更清晰的問題。如果信號已經存在,而我們只是以錯誤的方式看待它呢? 作者建立了一個模型,僅使用原始價格數據來預測標準普爾500指數股票的看漲與看跌走勢。沒有指標。沒有因子庫。只有每日的OHLCV加上明確反映股息和拆分的調整價格。 關鍵不在於更多數據,而在於表徵。 這篇論文不將時間序列視為序列,而是將滾動價格窗口視為空間物件。每個窗口變成一個結構化的矩陣,更接近於圖像而非圖表。這使得卷積濾波器能夠檢測局部模式,如動量變化、波動性聚集和企業行動帶來的結構性變化。 這借鑒了計算機視覺的直覺,而非傳統計量經濟學。 數據集涵蓋每隻股票長達二十年的機構級定價。十個通道為模型提供數據,滑動窗口創建密集的訓練樣本,沒有合成技巧。正規化保持所有特徵的尺度不變。 在架構上,它是一個深度1D CNN。早期層專注於短期結構。更深的層捕捉長期趨勢。與循環模型相比,CNN在處理波動性尖峰和事件驅動的跳躍時更穩定。 任務簡單但嚴格:預測方向,而不是收益,跨越幾天到一個月的時間範圍。訓練經過仔細調整,收斂看起來乾淨而非可疑。 結果讓人感到不安。 幾隻大型股票的驗證準確率達到高80年代和低90年代。摩根大通在較長的時間範圍內達到約91%的準確率。曲線顯示出真正的學習,而不是快速過擬合。 作者保持謹慎。這並未建模成本、執行或滑點。但它確實顯示出一些重要的東西。深度模型可以直接從原始價格張量中內化市場機制,包括大多數管道平滑掉的扭曲。 更大的含義深遠。 特徵工程可能不如你如何框定數據來得重要。通過選擇正確的歸納偏見,模型學會了人類通常試圖硬編碼的結構。 將金融時間序列視為類似圖像的物件並不是一種噱頭。這是對幾十年來手工假設的嚴肅替代方案,並挑戰了市場在沒有大量人為干預的情況下是不可讀的觀念。 ...