Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

CodecFlow
Strat de execuție pentru operatori AI și robotică pe @Solana
CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
VLA sunt încă foarte noi și multor oameni le este greu să înțeleagă diferența dintre VLA și LLM-uri.
Iată o analiză profundă a modului în care aceste sisteme AI diferă în raționament, senzație și acțiune. Partea 1.
Să analizăm distincțiile cheie și modul în care agenții AI înfășurați în jurul unui LLM diferă de agenții operatori care folosesc modele VLA:
1. Simț: Cum percep lumea
Agent (LLM): procesează text sau date structurate, de exemplu JSON, API-uri și, uneori, imagini. Este ca un creier care lucrează cu intrări curate și abstracte. Gândiți-vă la citirea unui manual sau la analizarea unei foi de calcul. Excelent pentru medii structurate, dar limitat de ceea ce este alimentat.
Operator (VLA): vede pixelii bruti, în timp real, de la camere, plus datele senzorului (de exemplu, atingerea, poziția) și propriocepția (autoconștientizarea mișcării). Este ca și cum ai naviga prin lume cu ochii și simțurile, prosperând în setări dinamice și dezordonate, cum ar fi interfețele de utilizare sau spațiile fizice.
2. Acționează: Cum interacționează
Agent: acționează prin apelarea funcțiilor, instrumentelor sau API-urilor. Imaginați-vă că este un manager care trimite instrucțiuni precise, cum ar fi "rezervați un zbor prin API-ul Expedia". Este deliberat, dar se bazează pe instrumente pre-construite și interfețe clare.
Operator: Execută acțiuni continue, de nivel scăzut, cum ar fi mișcarea cursorului mouse-ului, tastarea sau controlul articulațiilor robotului. Este ca un muncitor calificat care manipulează direct mediul, ideal pentru sarcini care necesită precizie în timp real.
3. Control: Cum iau decizii
Agent: Urmează o buclă lentă, reflexivă: planifică, apelează un instrument, evaluează rezultatul, repetă. Este legat de token (limitat de procesarea textului) și legat de rețea (așteaptă răspunsurile API). Acest lucru îl face metodic, dar lent pentru sarcinile în timp real.
Operator: Operează, luând decizii treptate într-o buclă strânsă de feedback. Gândiți-vă la asta ca la un jucător care reacționează instantaneu la ceea ce este pe ecran. Această viteză permite interacțiunea fluidă, dar necesită o procesare robustă în timp real.
4. Date de învățat: ce le alimentează pregătirea
Agent: Antrenat pe corpus de text vast, instrucțiuni, documentație sau seturi de date RAG (Retrieval-Augmented Generation). Învață din cărți, cod sau întrebări frecvente, excelând la raționament în detrimentul cunoștințelor structurate.
Operator: Învață din demonstrații (de exemplu, videoclipuri cu oameni care efectuează sarcini), jurnale de teleoperare sau semnale de recompensă. Este ca și cum ai învăța urmărind și exersând, perfect pentru sarcini în care instrucțiunile explicite sunt rare.
5. Moduri de eșec: unde se rup
Agent: Predispus la halucinații sau planuri fragile pe termen lung care se destramă dacă un pas eșuează. Este ca un strateg care se gândește prea mult sau interpretează greșit situația.
Operator: Se confruntă cu schimbarea covariabilelor (atunci când datele de antrenament nu se potrivesc cu condițiile din lumea reală) sau cu erori combinate în control (mici greșeli bulgăre de zăpadă). Este ca un șofer care pierde controlul pe un drum necunoscut.
6. Infra: Tehnologia din spatele lor
Agent: Se bazează pe un prompt/router pentru a decide ce instrumente să apeleze, un registru de instrumente pentru funcțiile disponibile și memorie/RAG pentru context. Este o configurație modulară, ca un centru de comandă care orchestrează sarcini.
Operator: Are nevoie de conducte de ingestie video, un server de acțiune pentru control în timp real, un scut de siguranță pentru a preveni acțiunile dăunătoare și un tampon de reluare pentru a stoca experiențe. Este un sistem de înaltă performanță construit pentru medii dinamice.
7. Unde fiecare strălucește: Punctele lor dulci
Agent: Domină în fluxurile de lucru cu API-uri curate (de exemplu, automatizarea proceselor de afaceri), raționament asupra documentelor (de exemplu, rezumarea rapoartelor) sau generarea de cod. Este alegerea ta pentru sarcini structurate, de nivel înalt.
Operator: Excelează în medii dezordonate, fără API, cum ar fi navigarea în interfețe de utilizare greoaie, controlul roboților sau abordarea sarcinilor asemănătoare jocurilor. Dacă implică interacțiune în timp real cu sisteme imprevizibile, VLA este rege.
8. Model mental: planificator + întreprinzător
Gândiți-vă la agentul LLM ca la planificator: împarte sarcinile complexe în obiective clare și logice.
Operatorul VLA este cel care execută, executând aceste obiective prin interacțiunea directă cu pixelii sau sistemele fizice. Un verificator (un alt sistem sau agent) monitorizează rezultatele pentru a asigura succesul.
$CODEC

21,72K
Codecflow Optr oferă o abordare unificată pentru a construi agenți care văd, raționează și acționează în medii digitale și fizice. Fie că automatizează fluxurile de lucru desktop, controlează brațele robotului sau testează în simulare, folosește același model mental și primitive.

Louround 🥂21 aug., 04:10
Scăderile într-o piață bull sunt menite să fie cumpărate, în special pe proiecte cu catalizatori mari
Știm cu toții că AI este narațiunea acestui ciclu, început de ai16z și Virtuals anul trecut.
Pariul meu este că piața se va concentra pe tehnologii mai complexe și mai sofisticate, cum ar fi VLA-urile, și permiteți-mi să vă spun de ce.
LLM-urile (Large Language Models) citesc și scriu în principal text: sunt grozave la explicarea, planificarea și generarea de instrucțiuni, dar nu controlează singure motoarele sau interacționează cu lumea fizică (așa cum este posibil să fi experimentat cu ChatGPT).
VLA-urile (Vision Language Action models) diferă de LLM-uri prin faptul că sunt sisteme multimodale care privesc lucrurile (viziune), înțeleg instrucțiuni (limbaj) și produc direct acțiuni. Este ca și cum i-ai spune unui robot să ridice o ceașcă roșie și apoi să-și miște brațul pentru a face acest lucru.
VLA-urile sunt antrenate pe exemple care asociază imagini / video + instrucțiuni + urme de acțiuni reale (cum s-a mișcat de fapt un robot) și trebuie să ruleze rapid și în siguranță în timp real. LLM-urile sunt instruite pe colecții uriașe de text și se concentrează pe raționament și sarcini lingvistice.
TL; DR LLM-urile gândesc și vorbesc în timp ce VLA văd, raționează și acționează.
După cum puteți vedea, VLA sunt o completare majoră a LLM-urilor și vor permite în special următoarea inovație de 0 la 1 în economia generală, care va fi robotica. Majoritatea fondurilor de investiții alocă o mare parte din investițiile lor în acest sector, văzut ca următoarea evoluție logică în industria AI.
Am făcut deja o postare cu ceva timp în urmă despre actualul lider pe piața cripto, @codecopenflow, care nu a strâns capital (lansare corectă), dar livrează produse de ultimă oră și se află în prezent la 23 de milioane de dolari FDV.
Pentru informare, alți concurenți cripto au strâns 20 de milioane de dolari (@openmind_agi) la ceea ce este probabil un FDV de 200 până la 300 de milioane de dolari ++, în timp ce niciun produs sau comunitate nu a fost încă construit și livrat.
Ceea ce face ca Codec să fie un proiect de top în sector este că abordează un blocaj crucial în robotică și AI, și anume dificultatea de a avea toate instrumentele AI să interacționeze împreună. Permiteți-mi să vă explic.
Cea mai recentă versiune a lor, OPTR (operator), este un set de instrumente care ajută la construirea operatorilor capabili să interacționeze pe mai multe platforme, cum ar fi roboți, desktop-uri, browsere sau simulări. Obiectivul unui operator este să vadă, să raționeze și să acționeze (VLA) atât în lumea digitală (computere), cât și în cea fizică (roboți).
Acest set de instrumente servește ca infrastructură de bază pentru echipele de roboți care doresc să-și testeze produsul și să îmbunătățească procesul general, oferind o experiență unificată în loc de altele separate pentru browsere web, simulări sau roboți. Acest lucru face ca operatorul să fie adaptabil și autonom, indiferent de mediul său.
Deci, înțelegeți, va economisi mult timp pentru companiile și dezvoltatorii care anterior trebuiau să parcurgă manual fiecare pas și unde puteți economisi timp, puteți economisi bani.
De asemenea, va permite Codec să-și construiască propriile proiecte de operator și să lanseze noi capacități relativ rapid pe piață, în special prin intermediul pieței lor.
TL; DR: Probabil că ați văzut videoclipuri cu roboți care pliază șervețele, sortează cutii sau sar pe diverse elemente. Toți au fost instruiți pentru acest caz de utilizare foarte specific și, din păcate, o abilitate nu poate fi reutilizată într-un alt mediu, așa cum ar putea face un om. OPTR de la Codec rezolvă acest lucru făcând abilitățile transferabile între medii și situații, făcând instruirea și dezvoltarea mult mai rapide și mai ieftine pentru întreprinderi.
Acesta este motivul pentru care Codec este atât de interesant în unificarea lumii digitale cu lumea fizică.
$CODEC, codificat.

2,59K
Firma de cercetare @epochbiz (de @ZoomerOracle) a publicat un articol de cercetare detaliat despre CodecFlow.
Nu-l rata.
$CODEC

epoch_19 aug., 21:07
$CODEC se pregătește să fie cea mai bună opțiune ca joc onchain pentru robotică
Articolul de cercetare despre @codecopenflow este acum disponibil 🤖

3,65K
Vedem o creștere a conturilor false care pretind că reprezintă CodecFlow.
Singurele X/Twitter oficiale sunt @codecopenflow și @RoboMove.
Toate celelalte canale verificate sunt listate pe site-ul nostru.
Există un singur simbol, $CODEC.
Rămâneți vigilenți și raportați orice conturi suspecte.
Vă rugăm să repostați și să distribuiți pentru a ajuta la răspândirea veștii.

3,34K
RoboMove este o vitrină alimentată în întregime de infrastructura CodecFlow.
Nu există un token separat. $CODEC este singurul token din ecosistem.
@RoboMove este doar un exemplu a ceea ce este posibil cu operatorii CodecFlow.
În curând, dezvoltatorii vor putea să-și construiască propriile sisteme avansate pe CodecFlow folosind SDK-ul și instrumentele noastre.
Platforma este deschisă și extensibilă în mod intenționat, permițând cazuri de utilizare nesfârșite, de la control robotic la automatizarea GUI.
⚠️ Nu vă îndrăgostiți de jetoane false sau imitatori. Verificați întotdeauna din surse oficiale.
3,86K
Ne bucurăm să vedem că comunitatea chineză observă CodecFlow și iubește ceea ce construim.
Bun venit. Suntem abia la început. Multe altele urmează.

0xFunky13 iul. 2025
Vânzarea publică PUMP s-a încheiat, inițial am fost și eu o sumă mare în Bybit, doar 1/2 pe lanț și, în cele din urmă, doar lanțul a avut succes, din fericire nu a existat nicio acoperire în avans...
Recent, au existat multe discuții în comunitatea AI despre VLA (Vision-Language-Action)
În special, m-am dus să cercetez dacă există cineva care face proiecte legate de VLA în lanț și am văzut acest proiect CodecFlow@Codecopenflow și am cumpărat puțin.
== Ce face CodecFlow ==
O scurtă introducere în VLA, o arhitectură model care permite AI nu doar să "vorbească", ci și să "facă".
LLM-urile tradiționale (cum ar fi GPT) pot înțelege doar limbajul și pot oferi sugestii, dar nu pot face practică, nu pot face clic pe ecrane sau pot apuca obiecte.
Modelul VLA înseamnă că integrează trei capabilități:
1. Viziune: înțelegeți imaginile, capturile de ecran, intrările camerei sau datele senzorului
2. Limbaj: Înțelegeți instrucțiunile de limbaj natural uman
3. Acțiune: Generați comenzi executabile, cum ar fi clicuri de mouse, intrare de la tastatură și controlul brațului robotic
CodecFlow face VLA pe lanț și toate procesele pot fi, de asemenea, încărcate în lanț, care pot fi auditate, verificate și decontate.
În termeni simpli, este infrastructura unui "bot AI".
== De ce acord o atenție deosebită acestui articol? ==
Am aflat că dezvoltatorii lor sunt contribuitori principali la LeRobot, cel mai tare proiect open source din spațiul VLA!
LeRobot este baza de top pentru construirea de modele VLA în lumea open source, inclusiv VLA-uri ușoare care pot rula pe laptopuri precum SmolVLA.
Înseamnă că această echipă înțelege cu adevărat arhitectura VlA și robotul.
Văd că și ei continuă să crească, iar prețul monedei crește constant, sunt foarte optimist cu privire la traiectoria VLA și, din tendința generală, VLA și roboții sunt într-adevăr viitorul pe piață.
Giganții Web2 (Google, Meta, Tesla) sunt acum pe deplin dedicați antrenamentului VLA și bot;
• Proiectele Web3 sunt rare în ceea ce privește aplicațiile VLA care pot îndeplini sarcini
• VLA are oportunitatea de a juca un rol uriaș în scenarii precum DePIN, automatizare web și execuția agenților AI on-chain.
CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Întotdeauna DYOR。
4,11K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante