PyTorchConの午前中の基調講演に参加できることに興奮しました。たくさんの楽しいディスカッション: RLは、デモンストレーションではなく目的を学習し、o1の創発的推論トレースなど、教師あり学習では到達できないトレーニングデータを超えた戦略を発見するため、模倣学習よりも優れたパフォーマンスを発揮するため、最も有望なフロンティアの1つです。 しかし、事前トレーニングは死んでいません。コーディング用の拡散モデルや連想メモリのパフォーマンスを向上させるDeltaNetなどのアーキテクチャのブレークスルーは、有望なフロンティアです。 私の哲学は、エンタープライズ AI 検索が軌道に乗る何年も前に、Voyage AI がベクトル埋め込みを構築するなど、最前線で構築する大胆な創業者を支援することです。