Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nils Pihl (broodsugar.eth)
Insinyur memetik dan transhumanis cyberdelic. Membangun @AukiNetwork dengan @AukiLabs, mengubah ritel dengan @CactusXR
Persepsi bersama dan rasa ruang adalah apa yang akan memperbaiki ini.

Massimo10 jam lalu
Dua robot Amazon yang sama pintarnya
572
Nils Pihl (broodsugar.eth) memposting ulang
Visi epik untuk pemosisian spasial, jika Anda seorang pengembang Augmented Reality, tonton ini, DUA KALI. Tidak terlalu teknologi, ini tentang visi tentang bagaimana aplikasi kami *harus bekerja. Tidak perlu lagi memulai pengguna dari awal, semua aset 3D tetap di tempat terakhir mereka tinggalkan, menggabungkannya ke dalam ruang daging.
469
Nils Pihl (broodsugar.eth) memposting ulang
Saya sering mendengar ini baru-baru ini: "Kami melatih robot kami pada satu objek dan itu digeneralisasi menjadi objek baru - model VLA baru ini gila!"
Mari kita bicara tentang apa yang sebenarnya terjadi di bagian "A" (Action) dari model VLA Anda.
Komponen Visi dan Bahasa? Mereka luar biasa. Dilatih sebelumnya pada data skala internet, mereka memahami objek, hubungan spasial, dan instruksi tugas lebih baik dari sebelumnya.
Tapi komponen Aksi? Itu masih dipelajari dari awal pada demonstrasi robot spesifik Anda.
Inilah kenyataannya: Model VLA Anda memiliki pemahaman skala internet tentang seperti apa obeng dan apa artinya "kencangkan sekrup". Tapi pola motor sebenarnya untuk "memutar pergelangan tangan sambil menerapkan tekanan ke bawah"? Itu berasal dari 500 demo robot Anda.
Apa artinya ini untuk "generalisasi":
• Generalisasi penglihatan: Mengenali objek baru secara instan (berkat pra-pelatihan)
• Generalisasi bahasa: Memahami instruksi tugas baru (berkat pra-pelatihan)
• Generalisasi tindakan: Masih terbatas pada pola motorik yang terlihat selama pelatihan robot
Mintalah robot yang sama untuk "membuka tutup botol" dan gagal karena:
• Penglihatan: Mengenali botol dan tutup
• Bahasa: Memahami "buka tutup"
• Tindakan: Tidak pernah mempelajari pola motor "putar sambil menarik"
Kebenaran keras tentang model VLA:
"VL" memberi Anda pemahaman zero-shot yang luar biasa. "A" masih membutuhkan demonstrasi khusus tugas.
Kami telah memecahkan masalah persepsi dan penalaran. Kami belum memecahkan masalah generalisasi motor.
30,53K
Nils Pihl (broodsugar.eth) memposting ulang
Kami sedang membangun internet baru untuk robotika dan XR, untuk membuat dunia fisik dapat diakses oleh AI.
Dalam video State of the Auki Network tahun ini, kami menyoroti beberapa hal menakjubkan yang sudah dibangun di jaringan persepsi mesin terdesentralisasi:
5,89K
Nils Pihl (broodsugar.eth) memposting ulang
Pada tahun 2009, Charlie Rose bertanya kepada Jensen Huang tentang Nvidia vs. Intel.
Pembuat chip tidak bersaing secara langsung tetapi Jensen mengatakan GPU vs. CPU adalah "pertempuran untuk jiwa" komputasi dan GPU akan "lebih relevan" pada waktunya.
Intel bernilai $100 miliar dan Nvidia berada di $4 miliar. Saat ini, Intel berada di $107 miliar sementara Nvidia bernilai ~ 1.000x lebih banyak dengan harga $ 4,4 Triliun.
303,27K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal