Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Under de senaste dagarna har jag känt att likviditeten på den första nivån är mycket sämre än tidigare
Oavsett om det är 2 banor eller det inre spelet känns det mycket svårare att spela...
Prestandan för codec-valutapriset är dock fortfarande mycket stabilt på 30M, och jag har fortfarande några positioner i min hand, vilket också är mycket betryggande, främst för att robotbanan har varit riktigt het i web2 nyligen, och följande är också lite ny information, allt som uttrycker att AI är nästa är Robot Meta.
• Nyligen har Remi Cadene, en kärnforskare på Hugging Face, fört samtal om att samla in cirka 40 miljoner dollar i startfinansiering för sin Paris-baserade robotikstartup "Uma".
• Sådana forsknings- och utvecklingsföretag inom robotik gynnas av investerare, och den globala insamlingen av robotik har överstigit 160 miljarder dollar 2025, vilket närmar sig 172 miljarder dollar för hela förra året.
Jag är fortfarande optimistisk om Codec, trots allt är Codecs dev en mycket viktig bidragsgivare till VLAs öppen källkod, och det är för närvarande web3, så jag känner definitivt till robotspåret mycket väl.
På senare tid har jag varit upptagen med att ta itu med familjeangelägenheter, men jag försöker fortfarande tjäna lite tillgångar varje dag, och jag fortsätter att ATH lite efter lite, WLFI är för lite, men den här gången är jag inte särskilt orolig, och jag kan tjäna lite tillfredsställelse varje dag med en stabil mentalitet.
BTW, jag vibbar snabbt en webbplats för daglig tillgångsstatistik, jag tycker personligen att det är mycket användbart, lägg Github-länken i kommentaren, ladda ner den direkt till datorn för att öppna indexets webbplats och använda den.



22 aug. 18:03
VLA:er är fortfarande väldigt nya och många människor har svårt att förstå skillnaden mellan VLA:er och LLM:er.
Här är en djupdykning i hur dessa AI-system skiljer sig åt när det gäller resonemang, avkänning och handling. Del 1.
Låt oss dela upp de viktigaste skillnaderna och hur AI-agenter lindade runt en LLM skiljer sig från operatörsagenter som använder VLA-modeller:
1. Känsla: Hur de uppfattar världen
Agent (LLM): Bearbetar text eller strukturerade data, t.ex. JSON, API:er och ibland bilder. Det är som en hjärna som arbetar med rena, abstraherade indata. Tänk dig att läsa en manual eller analysera ett kalkylblad. Perfekt för strukturerade miljöer men begränsad av vad som matas till den.
Operatör (VLA): Ser råa pixlar i realtid från kameror, plus sensordata (t.ex. beröring, position) och proprioception (självmedvetenhet om rörelse). Det är som att navigera i världen med ögon och sinnen och trivas i dynamiska, röriga miljöer som användargränssnitt eller fysiska utrymmen.
2. Agera: Hur de interagerar
Agent: Fungerar genom att anropa funktioner, verktyg eller API:er. Föreställ dig att en chef skickar exakta instruktioner som "boka ett flyg via Expedia API". Det är medvetet men förlitar sig på förbyggda verktyg och tydliga gränssnitt.
Operator: Utför kontinuerliga åtgärder på låg nivå, som att flytta en muspekare, skriva eller styra robotleder. Det är som en skicklig arbetare som direkt manipulerar miljön, perfekt för uppgifter som kräver precision i realtid.
3. Kontroll: Hur de fattar beslut
Agent: Följer en långsam, reflekterande loop: planera, anropa ett verktyg, utvärdera resultatet, upprepa. Den är tokenbunden (begränsas av textbearbetning) och nätverksbunden (väntar på API-svar). Detta gör det metodiskt men trögt för uppgifter i realtid.
Operatör: Arbetar och fattar stegvisa beslut i en tät återkopplingsslinga. Tänk på det som en spelare som reagerar direkt på det som visas på skärmen. Denna hastighet möjliggör smidig interaktion men kräver robust bearbetning i realtid.
4. Data att lära sig: Vad som driver deras utbildning
Agent: Utbildad på omfattande textkorpusar, instruktioner, dokumentation eller RAG-datauppsättningar (Retrieval-Augmented Generation). Den lär sig från böcker, kod eller vanliga frågor och svar och utmärker sig på att resonera framför strukturerad kunskap.
Operatör: Lär sig från demonstrationer (t.ex. videor av människor som utför uppgifter), fjärrstyrningsloggar eller belöningssignaler. Det är som att lära sig genom att titta och öva, perfekt för uppgifter där explicita instruktioner är knapphändiga.
5. Fellägen: Var de går sönder
Agent: Benägen att hallucinera (hitta på svar) eller bräckliga planer med lång horisont som går i stöpet om ett steg misslyckas. Det är som en strateg som övertänker eller misstolkar situationen.
Operatör: Står inför kovariatförskjutning (när träningsdata inte matchar verkliga förhållanden) eller sammansatta fel i kontrollen (små misstag snöbollseffekt). Det är som en förare som tappar kontrollen på en okänd väg.
6. Infra: Tekniken bakom dem
Agent: Förlitar sig på en prompt/router för att bestämma vilka verktyg som ska anropas, ett verktygsregister för tillgängliga funktioner och minne/RAG för kontext. Det är en modulär installation, som en kommandocentral som orkestrerar uppgifter.
Operatör: Behöver pipelines för videoinmatning, en åtgärdsserver för realtidskontroll, en säkerhetssköld för att förhindra skadliga åtgärder och en uppspelningsbuffert för att lagra upplevelser. Det är ett högpresterande system byggt för dynamiska miljöer.
7. Var var och en lyser: Deras söta fläckar
Agent: Dominerar i arbetsflöden med rena API:er (t.ex. automatisering av affärsprocesser), resonemang över dokument (t.ex. sammanfattning av rapporter) eller kodgenerering. Det är din favorit för strukturerade uppgifter på hög nivå.
Operatör: Utmärker sig i röriga, API-fria miljöer som att navigera i klumpiga användargränssnitt, styra robotar eller ta itu med spelliknande uppgifter. Om det handlar om interaktion i realtid med oförutsägbara system är VLA kung.
8. Mental modell: Planerare + Görare
Tänk på LLM-agenten som planeraren: den delar upp komplexa uppgifter i tydliga, logiska mål.
VLA-operatören är den som utför dessa mål genom att direkt interagera med pixlar eller fysiska system. En kontrollant (ett annat system eller en agent) övervakar resultaten för att säkerställa framgång.
$CODEC

39,18K
Topp
Rankning
Favoriter