下一个估值超過100億美元的產品初創公司將通過在內部強化學習環境中擴展訓練來構建。 我們生活在能力的豐富中,但我們只有兩個主要的AI產品,chatgpt和編碼代理,這讓我感到非常沮喪。 當前的人工智能供應鏈在結構上是破碎的,只有一個硬體供應商,幾家巨型AI公司擁有所有的智能煉油廠,開發者僅能獲得API訪問權限,幾乎沒有控制權。 就好像互聯網時代是由英特爾向四家巨型雲公司出售CPU來構建的,這些公司擁有整個基礎設施和軟體堆疊,處處都是秘密和保密協議,並向初創公司提供WordPress作為開發工具包。 為什麼Perplexity沒有發明深度研究?他們根本無法做到,因為這是通過強化學習訓練的。 我對未來幾年的預測: 強化學習將成為構建AI產品的最強大工具包。我們將看到數百個成功故事,如Cursor和Lovable。最終用戶將從中受益最多。 大型實驗室將向產品公司演變,OAI將專注於消費市場,Antropic將專注於編碼代理,DeepMind將把AI整合到所有谷歌業務中,Meta和XAI將在社交媒體上競爭。 我們將看到一個AI基礎設施初創公司的生態系統的出現,出售計算能力,訓練基礎模型,策劃數據,構建強化學習環境,提供廉價的推理和訓練,依靠開放科學和開源軟體。 @PrimeIntellect正在開創這個生態系統,開放源碼AGI的願景,強化學習環境中心是其中的第一個關鍵部分。
Prime Intellect
Prime Intellect16 小時前
介紹環境中心 RL環境是下一波AI進步的關鍵瓶頸,但大型實驗室正在封鎖它們 我們建立了一個社區平台,用於眾包開放環境,以便任何人都可以為開源AGI做出貢獻
3.26K