Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Dobrý příspěvek od @balajis o "ověřovací mezeře".
Mohli byste to vidět tak, že ve stvoření jsou dva režimy. Přejímání terminologie GAN:
1) generování a
2) Diskriminace.
např. malba - uděláte tah štětcem (1) a pak se chvíli díváte, zda jste malbu nevylepšili (2). Tyto dvě fáze se prolínají téměř ve všech tvůrčích pracích.
Druhý bod. Diskriminace může být výpočetně velmi náročná.
- Obrázky jsou zdaleka nejjednodušší. Týmy generátoru obrázků mohou například vytvářet obrovské mřížky výsledků, aby rozhodly, zda je jeden obrázek lepší než druhý. děkuji obřímu GPU ve vašem mozku stvořeném pro velmi rychlé zpracování obrázků.
- Text je mnohem těžší. Dá se to skimmovat, ale dá se to číst, je to sémantické, diskrétní a přesné, takže musíte i uvažovat (zejména v kódu).
- Zvuk je možná ještě těžší IMO, protože vynucuje časovou osu, takže to ani není přejížděcí. Jste nuceni utrácet sériové výpočty a vůbec je nemůžete paralelizovat.
Dalo by se říci, že při kódování se LLM zhroutily (1) do ~instant, ale udělaly jen velmi málo pro řešení (2). Člověk stále musí zírat na výsledky a rozlišovat, zda jsou dobré. To je moje hlavní kritika LLM kódování v tom, že nenuceně vyplivují *příliš mnoho* příliš mnoho kódu na dotaz s libovolnou složitostí a předstírají, že neexistuje žádná fáze 2. Získat tolik kódu je špatné a děsivé. Místo toho s vámi LLM musí aktivně spolupracovat, aby rozdělil problémy do malých postupných kroků, z nichž každý je snadněji ověřitelný. Musí předvídat výpočetní práci (2) a co nejvíce ji omezit. Musí se o to opravdu starat.
To mě přivádí k pravděpodobně největšímu nedorozumění, které nekodéři ohledně kódování mají. Myslí si, že kódování je o psaní kódu (1). Není. Je to o zírání na kód (2). To vše načítám do vaší pracovní paměti. Přecházel sem a tam. Promýšlení všech okrajových případů. Pokud mě přistihnete v náhodném bodě, když "programuji", pravděpodobně jen zírám na obrazovku a, pokud mě někdo vyruší, jsem opravdu naštvaný, protože je to tak výpočetně náročné. Pokud se dostaneme pouze mnohem rychleji na 1, ale také nesnížíme 2 (což je většina!), pak je jasné, že celková rychlost kódování se nezlepší (viz Amdahlův zákon).

4. 6. 2025
VÝZVA AI → OVĚŘENÍ AI
Výzvy AI se škálují, protože výzvy jsou jen psaní.
Ověřování pomocí umělé inteligence se však neškáluje, protože ověřování výstupu pomocí umělé inteligence zahrnuje mnohem víc než jen psaní.
Někdy můžete ověřit okem, a proto je AI skvělá pro frontend, obrázky a video. Ale pro cokoli jemného musíte číst kód nebo text do hloubky – a to znamená znát téma dostatečně dobře, abyste mohli umělou inteligenci opravit.
Vědci jsou si toho dobře vědomi, což je důvod, proč je tolik práce o evalech a halucinacích.
Koncept ověřování jako překážky pro uživatele umělé inteligence je však nedostatečně diskutován. Ano, můžete vyzkoušet formální verifikaci, nebo kritické modely, kde jedna umělá inteligence kontroluje druhou, nebo jiné techniky. Ale vůbec si být vědom tohoto problému jako prvotřídního problému je polovina úspěchu.
Pro uživatele: Ověření pomocí umělé inteligence je stejně důležité jako nápověda pomocí umělé inteligence.
449,32K
Top
Hodnocení
Oblíbené