PUMPin julkinen myynti on ohi, alun perin minulla oli myös iso summa Bybitissä, vain 1/2 laitettiin ketjuun, ja lopulta vain ketju onnistui, mutta onneksi suojausta ei ollut etukäteen... Siitä puheen ollen, monet tekoälyyhteisön ihmiset ovat keskustelleet VLA:sta (Vision-Language-Action) viime aikoina. Tutkin erityisesti, työskenteleekö kukaan ketjun VLA:han liittyvien projektien parissa, ja näin tämän CodecFlow @Codecopenflow -projektin ja ostin vähän. == Mitä CodecFlow tekee == Lyhyt johdatus VLA:han, VLA on malliarkkitehtuuri, jonka avulla tekoäly voi paitsi "puhua" myös "tehdä". Perinteiset LLM:t (kuten GPT) voivat vain ymmärtää kieltä ja antaa ehdotuksia, mutta se ei tee käytännön toimintoja, napsauta näyttöjä tai tartu esineisiin. VLA-malli tarkoittaa, että se integroi kolme pääominaisuutta: 1. Näkö: Ymmärrä näytöt, kuvakaappaukset, kameratulot tai anturitiedot 2. Kieli: Ymmärrä ihmisen luonnollisen kielen ohjeet 3. Toiminto: Luo suoritettavia komentoja, kuten hiiren napsautuksia, näppäimistösyötteitä ja ohjaa robottikäsivarsia CodecFlow tekee VLA:ta ketjussa, ja kaikki toimintaprosessit voidaan myös ladata ketjuun, joka voidaan tarkastaa, todentaa ja selvittää. Yksinkertaisesti sanottuna se on "AI-bottien" infrastruktuuri. == Miksi kiinnitin erityistä huomiota tähän projektiin? == Huomasin, että heidän kehittäjänsä ovat keskeisiä avustajia LeRobotissa, VLA-avaruuden kuumimmassa avoimen lähdekoodin projektissa! LeRobot on paras tukikohta VLA-mallien rakentamiseen avoimen lähdekoodin maailmassa, mukaan lukien kevyet VLA:t, kuten SmolVLA, jotka voivat toimia kannettavissa tietokoneissa. Se tarkoittaa, että tämä tiimi todella ymmärtää Vla-arkkitehtuurin ja ymmärtää robotin. Näen, että he myös jatkavat rakentamista, ja myös valuutan hinta nousee tasaisesti, olen erittäin optimistinen VLA-radan suhteen, ja yleisen trendin perusteella VLA ja robotit ovat todellakin tulevaisuus markkinoilla. • Web2-jättiläiset (Google, Meta, Tesla) ovat tällä hetkellä täysin sitoutuneita VLA- ja bottikoulutukseen; • Web3-projekteissa on harvoin VLA-sovelluksia, jotka pystyvät suorittamaan tehtäviä, ja niitä on edelleen hyvin vähän • VLA:illa on mahdollisuus olla valtavasti arvokkaita skenaarioissa, kuten DePIN, Web Automation, ketjun sisäinen AI-agentin suoritus jne. CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Aina DYOR。
CodecFlow
CodecFlow26.6.2025
Mikä on $CODEC-operaattori? Siellä Vision-Language-Action -mallit tekevät tekoälystä vihdoin hyödyllisen todellisessa työssä. Operaattori on VLA-malleihin perustuva autonominen ohjelmistoagentti, joka suorittaa tehtäviä jatkuvan havaitsemis-syy-toimintasyklin kautta. LLM:t osaavat ajatella ja puhua loistavasti, mutta he eivät osaa osoittaa, napsauttaa tai tarttua mihinkään. Ne ovat puhtaita päättelymoottoreita, joilla ei ole maadoitusta fyysisessä maailmassa. VLA:t yhdistävät visuaalisen havainnon, kielen ymmärtämisen ja jäsennellyn toiminnan tuotoksen yhdellä eteenpäin suuntautuvalla syötöllä. Vaikka LLM kuvaa, mitä pitäisi tapahtua, VLA-malli itse asiassa saa sen tapahtumaan lähettämällä koordinaatteja, ohjaussignaaleja ja suoritettavia komentoja. Operaattorin työnkulku on: - Havainto: tallentaa kuvakaappauksia, kamerasyötteitä tai anturitietoja. - Päättely: käsittelee havaintoja luonnollisen kielen ohjeiden rinnalla VLA-mallin avulla. - Toiminto: suorittaa päätökset käyttöliittymän vuorovaikutuksen tai laitteiston ohjauksen avulla – kaikki yhdessä jatkuvassa silmukassa. Esimerkkejä: LLM vs. VLA-mallilla toimiva operaattori Kokouksen ajoittaminen LLM: Tarjoaa yksityiskohtaisen selityksen kalenterin hallinnasta ja hahmottelee kokouksen ajoittamisen vaiheet. Operaattori VLA-mallilla: - Kaappaa käyttäjän työpöydän. - Tunnistaa kalenterisovelluksen (esim. Outlook, Google-kalenteri). - Siirtyy torstaihin, luo kokouksen klo 14 ja lisää osallistujia. - Mukautuu automaattisesti käyttöliittymän muutoksiin. Robotiikka: Objektien lajittelu LLM: Luo tarkat kirjalliset ohjeet objektien lajitteluun, kuten punaisten komponenttien tunnistamiseen ja järjestämiseen. Operaattori VLA-mallilla: - Tarkkailee työtilaa reaaliajassa. - Tunnistaa punaiset komponentit sekaobjektien joukosta. - Suunnittelee törmäyksettömät lentoradat robottikäsivarrelle. - Suorittaa poiminta- ja sijoitustoimintoja mukautuen dynaamisesti uusiin paikkoihin ja suuntiin. VLA-mallit kurovat vihdoin umpeen kuilun tekoälyn, joka osaa järkeillä maailmasta, ja tekoälyn välillä, joka voi todella muuttaa sitä. Ne muuttavat automaation hauraasta sääntöjen noudattamisesta mukautuvaksi ongelmanratkaisuksi – älykkäiksi työntekijöiksi. "Perinteiset komentosarjat rikkoutuvat, kun ympäristö muuttuu, mutta operaattorit käyttävät visuaalista ymmärrystä sopeutuakseen reaaliajassa ja käsittelevät poikkeuksia sen sijaan, että kaatuisivat niihin."
11,22K