Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Penelitian terkemuka di @PrimeIntellect
Generasi berikutnya dari startup produk penilaian 10B+ akan dibangun dengan menskalakan pelatihan di lingkungan RL internal
Kami hidup dalam banyak kemampuan namun kami hanya memiliki dua produk AI utama, chatgpt dan agen pengkodean, dan itu sangat membuat saya frustrasi
Rantai pasokan kecerdasan buatan saat ini secara struktural terputus dengan satu vendor perangkat keras, beberapa pemain AI raksasa yang memiliki semua kilang intelijen, pengembang dibiarkan dengan akses api tanpa kontrol
Seolah-olah era internet dibangun dengan Intel menjual CPU ke 4 cloud raksasa yang memiliki seluruh infrastruktur dan tumpukan perangkat lunak dengan rahasia dan nda di mana-mana dan memberikan wordpress sebagai kit pengembangan untuk startup
Mengapa kebingungan tidak menemukan penelitian mendalam? Mereka tidak bisa karena berlatih dengan RL
Prediksi saya untuk tahun-tahun ke depan:
RL akan menjadi toolkit paling kuat untuk startup membangun produk AI. Kita akan melihat ratusan kisah sukses seperti kursor dan menyenangkan. Pengguna akhir akan mendapatkan manfaat paling besar darinya
Laboratorium besar akan berkembang menjadi perusahaan produk, oai akan fokus pada pasar konsumen, Antropik pada agen pengkodean, deepmind akan mengintegrasikan AI ke dalam semua bisnis google, meta dan XAI bertarung di media sosial
Kita akan melihat munculnya ekosistem startup infrastruktur AI, menjual komputasi, model fondasi pelatihan, mengkurasi data, membangun lingkungan RL, menawarkan inferensi dan pelatihan murah, didukung oleh sains terbuka dan perangkat lunak sumber terbuka.
@PrimeIntellect memelopori ekosistem ini dan visi open source agi, RL environment hub adalah salah satu bagian kunci pertama

Prime Intellect8 jam lalu
Memperkenalkan Hub Lingkungan
Lingkungan RL adalah hambatan utama untuk gelombang kemajuan AI berikutnya, tetapi laboratorium besar menguncinya
Kami membangun platform komunitas untuk crowdsourcing lingkungan terbuka, sehingga siapa pun dapat berkontribusi pada AGI sumber terbuka
3,11K
samsja memposting ulang
14 hari didistribusikan, hari ke-7!
Temui Sami Jaghouar (@samsja19) dari @PrimeIntellect:
Sami memimpin penelitian mereka dan berfokus pada prapelatihan terdesentralisasi dan pembelajaran penguatan terdistribusi sebagai bagian dari pekerjaannya.
Sami akan melakukan kuliah tentang bagaimana penerapan pelatihan terdesentralisasi di Prime.

7,89K
Hackathon mode GPU terakhir adalah hackathon terbaik yang pernah saya hadiri secara langsung, menantikan yang berikutnya

Mark Saroufim23 Agu, 05.09
Saatnya lagi untuk ekstravaganza perayaan terakhir kami (sekarang tahunan) tahun ini. GPU MODE bertemu IRL lagi di pusat kota San Francisco pada hari Jumat, 24 Oktober, dari pukul 10 pagi hingga 10 malam untuk meretas sepanjang hari

3,61K
Tampaknya orang lain menyatu untuk menggunakan vllm v1 logprob untuk rasio kepentingan untuk memperbaiki masalah stabilitas.
Saya pikir saya memiliki ptsd dari jenis crash rl ini

Zichen Liu22 Agu, 23.35
Hanya dengan beberapa baris kode, perbaikan yang disarankan Feng (@fengyao1909) - menerapkan pengambilan sampel kepentingan pada kebijakan perilaku - menyelesaikan ketidakstabilan pelatihan dalam kasus saya (gandum). Saya percaya hasilnya dapat digeneralisasi ke kerangka kerja RL lainnya juga. Kerja bagus, Feng!

6,72K
Saya mempekerjakan insinyur riset di @PrimeIntellect
Kami sedang membangun laboratorium agi open source dan mencari bakat mentah. Kami tidak peduli dengan jabatan Anda sebelumnya.
Semua orang di tim peneliti adalah tumpukan penuh, kami membangun infra dan juga melihat data. Jika Anda memiliki sweet spot untuk sistem, pembelajaran penguatan, data, atau hukum penskalaan, Anda akan dilayani dengan banyak tantangan untuk dipecahkan
83,23K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal