DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

De afgelopen dagen heb ik gemerkt dat de liquiditeit op het hoogste niveau veel slechter is dan voorheen. Of het nu om de 2e fase of de interne markt gaat, het lijkt veel moeilijker te zijn geworden... Maar de prijs van de codec blijft stabiel op 30M, ik heb nog een deel van mijn positie en voel me daar ook gerust over, vooral omdat de robotsector in web2 de laatste tijd erg populair is. Hieronder staan enkele recente informatie die allemaal aangeven dat AI de volgende stap is, namelijk Robot Meta. • Onlangs is Remi Cadene, een kernonderzoeker van Hugging Face, in gesprek voor een seedronde van ongeveer 40 miljoen dollar voor zijn robotstartup "Uma" in Parijs. • Dit soort robotontwikkelingsbedrijven zijn zeer gewild bij investeerders; momenteel is de wereldwijde financiering in de robotica in 2025 al meer dan 16 miljard dollar, wat bijna het totale bedrag van vorig jaar van 17,2 miljard dollar benadert. Ik blijf optimistisch over Codec, aangezien de ontwikkelaars van Codec belangrijke bijdragers zijn aan VLAs open source en ook goed begrijpen hoe de robotsector werkt in web3. De laatste tijd ben ik druk bezig met zaken thuis, maar ik probeer elke dag een beetje vermogen te verdienen en blijf elke dag een beetje dichter bij ATH komen. Ik heb te weinig WLFI, maar ik ben deze keer eigenlijk niet erg nerveus; mijn mindset is stabiel en ik ben tevreden als ik elke dag een beetje kan verdienen. Trouwens, ik heb snel een website gemaakt voor dagelijkse vermogensstatistieken, ik vind het erg handig. De Github-link staat in de reacties, je kunt het gewoon downloaden naar je computer en de index openen om de website te gebruiken.

VLAs zijn nog steeds erg nieuw en veel mensen vinden het moeilijk om het verschil tussen VLAs en LLMs te begrijpen. Hier is een diepgaande analyse van hoe deze AI-systemen verschillen in redeneren, waarnemen en handelen. Deel 1. Laten we de belangrijkste onderscheidingen uiteenzetten en hoe AI-agenten die zijn verpakt rond een LLM verschillen van operatoragenten die VLA-modellen gebruiken: 1. Waarnemen: Hoe ze de wereld waarnemen Agent (LLM): Verwerkt tekst of gestructureerde gegevens, bijvoorbeeld JSON, API's en soms afbeeldingen. Het is als een brein dat werkt met schone, geabstraheerde invoer. Denk aan het lezen van een handleiding of het parseren van een spreadsheet. Geweldig voor gestructureerde omgevingen, maar beperkt door wat er aan wordt gevoed. Operator (VLA): Ziet ruwe, realtime pixels van camera's, plus sensorgegevens (bijv. aanraking, positie) en proprioceptie (zelfbewustzijn van beweging). Het is als navigeren door de wereld met ogen en zintuigen, gedijend in dynamische, rommelige omgevingen zoals UI's of fysieke ruimtes. 2. Handelen: Hoe ze interageren Agent: Handelt door functies, tools of API's aan te roepen. Stel je voor dat het een manager is die precieze instructies geeft zoals "boek een vlucht via de Expedia API." Het is doelbewust, maar afhankelijk van vooraf gebouwde tools en duidelijke interfaces. Operator: Voert continue, laagdrempelige acties uit, zoals het bewegen van een muiscursor, typen of het bedienen van robotgewrichten. Het is als een bekwame werknemer die direct de omgeving manipuleert, ideaal voor taken die real-time precisie vereisen. 3. Controle: Hoe ze beslissingen nemen Agent: Volgt een langzame, reflectieve cyclus: plannen, een tool aanroepen, het resultaat evalueren, herhalen. Het is token-gebonden (beperkt door tekstverwerking) en netwerk-gebonden (wachtend op API-responsen). Dit maakt het methodisch maar traag voor real-time taken. Operator: Werkt, neemt stapgewijze beslissingen in een strakke feedbacklus. Denk aan een gamer die onmiddellijk reageert op wat er op het scherm staat. Deze snelheid maakt vloeiende interactie mogelijk, maar vereist robuuste real-time verwerking. 4. Gegevens om te leren: Wat hun training aandrijft Agent: Getraind op enorme tekstcorpora, instructies, documentatie of RAG (Retrieval-Augmented Generation) datasets. Het leert van boeken, code of FAQ's, en excelleert in redeneren over gestructureerde kennis. Operator: Leert van demonstraties (bijv. video's van mensen die taken uitvoeren), teleoperatielogs of beloningssignalen. Het is als leren door te kijken en te oefenen, perfect voor taken waar expliciete instructies schaars zijn. 5. Faalmodi: Waar ze falen Agent: Gevoelig voor hallucinatie (het verzinnen van antwoorden) of broze langetermijnplannen die in elkaar storten als één stap faalt. Het is als een strateeg die te veel nadenkt of de situatie verkeerd inschat. Operator: Heeft te maken met covariate shift (wanneer trainingsgegevens niet overeenkomen met de echte wereldomstandigheden) of cumulatieve fouten in controle (kleine fouten die zich opstapelen). Het is als een bestuurder die de controle verliest op een onbekende weg. 6. Infra: De technologie erachter Agent: Vertrouwt op een prompt/router om te beslissen welke tools aan te roepen, een toolregister voor beschikbare functies, en geheugen/RAG voor context. Het is een modulaire opzet, als een commandocentrum dat taken coördineert. Operator: Heeft video-invoerpijplijnen nodig, een act server voor real-time controle, een veiligheidsbescherming om schadelijke acties te voorkomen, en een replaybuffer om ervaringen op te slaan. Het is een high-performance systeem dat is gebouwd voor dynamische omgevingen. 7. Waar elk uitblinkt: Hun sterke punten Agent: Dominant in workflows met schone API's (bijv. automatisering van bedrijfsprocessen), redeneren over documenten (bijv. samenvatten van rapporten) of codegeneratie. Het is je go-to voor gestructureerde, hoog-niveau taken. Operator: Uitblinkt in rommelige, API-loze omgevingen zoals het navigeren door onhandige UI's, het bedienen van robots of het aanpakken van game-achtige taken. Als het gaat om real-time interactie met onvoorspelbare systemen, is VLA koning. 8. Mentale Model: Planner + Doener Denk aan de LLM Agent als de planner: het breekt complexe taken op in duidelijke, logische doelen. De VLA Operator is de doener, die die doelen uitvoert door direct te interageren met pixels of fysieke systemen. Een controleur (een ander systeem of agent) monitort de uitkomsten om succes te waarborgen. $CODEC

39,16K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste