Veřejný prodej PUMP je u konce, původně jsem měl velkou částku i na Bybitu, na řetěz byla umístěna pouze 1/2 a nakonec byl úspěšný pouze řetěz, ale naštěstí nebylo žádné zajištění předem... Když už o tom mluvíme, mnoho lidí v komunitě umělé inteligence v poslední době diskutuje o VLA (Vision-Language-Action). Konkrétně jsem zkoumal, zda někdo pracuje na projektech souvisejících s VLA v řetězci, a viděl jsem tento projekt CodecFlow @Codecopenflow a trochu jsem si koupil. == Co dělá CodecFlow == Stručný úvod do VLA, VLA je modelová architektura, která umožňuje umělé inteligenci nejen "mluvit", ale "dělat". Tradiční LLM (jako GPT) rozumí pouze jazyku a poskytuje návrhy, ale neprovádí praktické operace, nekliká na obrazovky ani nechytá objekty. Model VLA znamená, že integruje tři hlavní funkce: 1. Vidění: Pochopte obrazovky, snímky obrazovky, vstupy kamery nebo data ze senzorů 2. Jazyk: Pochopte pokyny lidského přirozeného jazyka 3. Akce: Generujte spustitelné příkazy, jako je kliknutí myší, vstupy z klávesnice a ovládání robotických ramen CodecFlow provádí VLA v řetězci a všechny provozní procesy lze také nahrát do řetězce, který lze auditovat, ověřovat a vypořádat. Jednoduše řečeno, je to infrastruktura "AI botů". == Proč jsem tomuto projektu věnoval zvláštní pozornost? == Zjistil jsem, že jejich vývojáři jsou hlavními přispěvateli do LeRobot, nejžhavějšího open source projektu v oblasti VLA! LeRobot je špičkovou základnou pro vytváření VLA modelů ve světě open source, včetně lehkých VLA, jako je SmolVLA, které lze spustit na noteboocích. To znamená, že tento tým opravdu rozumí architektuře VlA a rozumí robotovi. Vidím, že také pokračují v budování a cena měny také neustále roste, jsem velmi optimistický ohledně VLA stopy a z celkového trendu jsou VLA a roboti skutečně budoucností na trhu. Giganti Web2 (Google, Meta, Tesla) se v současné době plně věnují školení VLA a botů. • Projekty Web3 mají jen zřídka aplikace VLA, které mohou provádět úkoly, a stále je jich velmi málo • VLA mají příležitost hrát obrovskou hodnotu ve scénářích, jako je DePIN, webová automatizace, provádění agenta AI v řetězci atd. CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Vždy DYOR。
CodecFlow
CodecFlow26. 6. 2025
Co je to $CODEC operátor? Je to místo, kde modely Vision-Language-Action konečně umožňují umělou inteligenci pro skutečnou práci. Operátor je autonomní softwarový agent poháněný modely VLA, který plní úkoly prostřednictvím nepřetržitého cyklu vnímání-zdůvodnění-jednání. LLM mohou myslet a mluvit brilantně, ale nemohou na nic ukazovat, klikat nebo chytit. Jsou to čistě logické motory s nulovým zakotvením ve fyzickém světě. VLA kombinují vizuální vnímání, porozumění jazyku a strukturovaný výstup akcí v jediném průchodu vpřed. Zatímco LLM popisuje, co by se mělo stát, model VLA to ve skutečnosti uskutečňuje vysíláním souřadnic, řídicích signálů a spustitelných příkazů. Pracovní postup operátora je: - Vnímání: zachycuje snímky obrazovky, záběry z kamery nebo data ze senzorů. - Uvažování: zpracovává pozorování spolu s instrukcemi v přirozeném jazyce pomocí modelu VLA. - Akce: provádí rozhodnutí prostřednictvím interakcí s uživatelským rozhraním nebo hardwarového ovládání – to vše v jedné nepřetržité smyčce. Příklady: LLM vs. operátor využívající model VLA Plánování schůzky LLM: Poskytuje podrobné vysvětlení správy kalendáře a popisuje kroky k naplánování schůzky. Operátor s VLA modelem: - Zachytí plochu uživatele. - Identifikuje kalendářovou aplikaci (např. Outlook, Kalendář Google). - Přejde na čtvrtek, vytvoří schůzku ve 14:00 a přidá účastníky. - Automaticky se přizpůsobuje změnám uživatelského rozhraní. Robotika: Třídění objektů LLM: Generuje přesné psané pokyny pro třídění objektů, jako je identifikace a organizace červených komponent. Operátor s VLA modelem: - Sleduje pracovní prostor v reálném čase. - Identifikuje červené komponenty mezi smíšenými objekty. - Plánuje bezkolizní trajektorie pro robotickou paži. - Provádí operace pick-and-place a dynamicky se přizpůsobuje novým pozicím a orientacím. Modely VLA konečně překlenují propast mezi umělou inteligencí, která dokáže uvažovat o světě, a umělou inteligencí, která jej může skutečně změnit. Jsou tím, co transformuje automatizaci z křehkého dodržování pravidel na adaptivní řešení problémů – inteligentní pracovníky. "Tradiční skripty se při změně prostředí rozbijí, ale operátoři se pomocí vizuálního porozumění přizpůsobí v reálném čase a zpracují výjimky místo toho, aby na nich spadli."
11,19K