Dalam beberapa hari terakhir, saya merasa bahwa likuiditas level pertama jauh lebih buruk dari sebelumnya Baik itu 2 tahap atau permainan dalam, rasanya jauh lebih sulit untuk dimainkan... Namun, kinerja harga mata uang codec masih sangat stabil di 30M, dan saya masih memiliki beberapa posisi di tangan saya, yang juga sangat meyakinkan, terutama karena trek robot sangat panas di web2 baru-baru ini, dan berikut ini juga beberapa informasi terbaru, semua yang mengungkapkan bahwa AI berikutnya adalah Robot Meta. Baru-baru ini, Remi Cadene, seorang ilmuwan riset inti di Hugging Face, sedang dalam pembicaraan untuk mengumpulkan sekitar $ 40 juta dalam pendanaan awal untuk startup robotika "Uma" yang berbasis di Paris. • Perusahaan penelitian dan pengembangan robotika semacam itu disukai oleh investor, dan penggalangan dana robotika global telah melampaui $160 miliar pada tahun 2025, mendekati skala $172 miliar untuk keseluruhan tahun lalu. Saya masih optimis tentang Codec, lagipula, pengembang Codec adalah kontributor yang sangat penting untuk open source VLA, dan saat ini web3, jadi saya pasti tahu trek robot dengan sangat baik. Baru-baru ini, saya sibuk berurusan dengan urusan keluarga, tetapi saya masih berusaha untuk mendapatkan sedikit aset setiap hari, dan saya terus ATH sedikit demi sedikit, WLFI terlalu sedikit, tetapi kali ini saya tidak terlalu cemas, dan saya bisa mendapatkan sedikit kepuasan setiap hari dengan mentalitas yang stabil. BTW, saya dengan cepat Vibe situs web untuk statistik aset harian, saya pribadi berpikir itu sangat berguna, letakkan tautan Github di komentar, unduh langsung ke komputer untuk membuka situs web indeks dan menggunakannya.
CodecFlow
CodecFlow22 Agu, 18.03
VLA masih sangat baru dan banyak orang merasa sulit untuk memahami perbedaan antara VLA dan LLM. Berikut adalah penyelaman mendalam tentang bagaimana sistem AI ini berbeda dalam penalaran, penginderaan, dan tindakan. Bagian 1. Mari kita uraikan perbedaan utama dan bagaimana agen AI yang dibungkus di sekitar LLM berbeda dari agen operator yang menggunakan model VLA: 1. Rasa: Bagaimana mereka memandang dunia Agen (LLM): Memproses teks atau data terstruktur misalnya JSON, API, dan terkadang gambar. Ini seperti otak yang bekerja dengan input yang bersih dan abstrak. Pikirkan membaca manual atau mengurai spreadsheet. Bagus untuk lingkungan terstruktur tetapi dibatasi oleh apa yang diumpankan ke dalamnya. Operator (VLA): Melihat piksel mentah dan real-time dari kamera, ditambah data sensor (misalnya, sentuhan, posisi) dan proprioception (kesadaran diri akan gerakan). Ini seperti menavigasi dunia dengan mata dan indera, berkembang dalam pengaturan yang dinamis dan berantakan seperti UI atau ruang fisik. 2. Bertindak: Bagaimana mereka berinteraksi Agen: Bertindak dengan memanggil fungsi, alat, atau API. Bayangkan sebagai manajer yang mengirimkan instruksi yang tepat seperti "pesan penerbangan melalui Expedia API." Ini disengaja tetapi bergantung pada alat yang dibuat sebelumnya dan antarmuka yang jelas. Operator: Menjalankan tindakan tingkat rendah yang berkelanjutan, seperti menggerakkan kursor mouse, mengetik, atau mengontrol sambungan robot. Ini seperti pekerja terampil yang secara langsung memanipulasi lingkungan, ideal untuk tugas-tugas yang membutuhkan presisi waktu nyata. 3. Kontrol: Bagaimana mereka membuat keputusan Agen: Mengikuti perulangan reflektif yang lambat: rencanakan, panggil alat, evaluasi hasilnya, ulangi. Ini terikat token (dibatasi oleh pemrosesan teks) dan terikat jaringan (menunggu respons API). Ini membuatnya metodis tetapi lamban untuk tugas waktu nyata. Operator: Beroperasi, membuat keputusan bertahap dalam lingkaran umpan balik yang ketat. Anggap saja seperti seorang gamer yang bereaksi langsung terhadap apa yang ada di layar. Kecepatan ini memungkinkan interaksi yang lancar tetapi menuntut pemrosesan real-time yang kuat. 4. Data untuk Dipelajari: Apa yang mendorong pelatihan mereka Agen: Dilatih pada corpora teks, instruksi, dokumentasi, atau himpunan data RAG (Retrieval-Augmented Generation) yang luas. Itu belajar dari buku, kode, atau FAQ, unggul dalam penalaran daripada pengetahuan terstruktur. Operator: Belajar dari demonstrasi (misalnya, video manusia melakukan tugas), log teleoperasi, atau sinyal hadiah. Ini seperti belajar dengan menonton dan berlatih, sempurna untuk tugas-tugas di mana instruksi eksplisit langka. 5. Mode Kegagalan: Di mana mereka rusak Agen: Rentan terhadap halusinasi (mengarang jawaban) atau rencana jangka panjang rapuh yang berantakan jika satu langkah gagal. Ini seperti ahli strategi yang terlalu memikirkan atau salah membaca situasi. Operator: Menghadapi pergeseran kovariat (ketika data pelatihan tidak sesuai dengan kondisi dunia nyata) atau kesalahan majemuk dalam kontrol (bola salju kesalahan kecil). Ini seperti pengemudi yang kehilangan kendali di jalan yang tidak dikenal. 6. Infra: Teknologi di balik mereka Agen: Mengandalkan prompt/router untuk memutuskan alat mana yang akan dipanggil, registri alat untuk fungsi yang tersedia, dan memori/RAG untuk konteks. Ini adalah pengaturan modular, seperti pusat komando yang mengatur tugas. Operator: Memerlukan alur penyerapan video, server tindakan untuk kontrol waktu nyata, perisai pengaman untuk mencegah tindakan berbahaya, dan buffer pemutaran ulang untuk menyimpan pengalaman. Ini adalah sistem berkinerja tinggi yang dibangun untuk lingkungan dinamis. 7. Di Mana Masing-masing Bersinar: Sweet spot mereka Agen: Mendominasi alur kerja dengan API yang bersih (misalnya, mengotomatiskan proses bisnis), penalaran atas dokumen (misalnya, meringkas laporan), atau pembuatan kode. Ini adalah pilihan Anda untuk tugas tingkat tinggi yang terstruktur. Operator: Unggul dalam lingkungan yang berantakan dan tanpa API seperti menavigasi UI yang kikuk, mengontrol robot, atau menangani tugas seperti game. Jika melibatkan interaksi real-time dengan sistem yang tidak dapat diprediksi, VLA adalah raja. 8. Model Mental: Perencana + Pelaku Pikirkan Agen LLM sebagai perencana: ia memecah tugas kompleks menjadi tujuan yang jelas dan logis. Operator VLA adalah pelakunya, melaksanakan tujuan tersebut dengan berinteraksi langsung dengan piksel atau sistem fisik. Pemeriksa (sistem atau agen lain) memantau hasil untuk memastikan keberhasilan. $CODEC
39,11K