Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

François Chollet
Spoluzakladatel @ndea. Spoluzakladatel @arcprize. Tvůrce Keras a ARC-AGI. Autor knihy "Hluboké učení s Pythonem".
Článek "Hierarchické modely uvažování" v poslední době koluje a na Twitteru sbírá desítky tisíc lajků v desítkách polovirálních vláken, což je u výzkumné práce docela neobvyklé.
Článek tvrdí, že ARC-AGI-1 s přesností 40,3 % s malým modelem (27M parametrů) trénovaným od nuly bez jakýchkoli externích trénovacích dat – pokud by to bylo skutečné, představovalo by to zásadní průlom v uvažování.
Právě jsem se hluboce ponořil do papíru a kódové základny...
Je to dobré čtení, podrobné, ale snadno sledovatelné. Myslím, že prezentované nápady jsou docela zajímavé a architektura je pravděpodobně cenná.
Tento koncept mi připomíná mnoho různých nápadů, se kterými jsem se setkal během "zlatého věku" výzkumu architektury DL, přibližně v letech 2016-2018. Tento typ výzkumu nebyl nějakou dobu populární, takže je hezké vidět obnovený zájem o alternativní architektury.
Experimentální nastavení se však zdá být kriticky chybné, což znamená, že v současné době nemáme žádný empirický signál (alespoň z ARC-AGI) o tom, zda je architektura skutečně užitečná nebo ne.
Experiment ARC-AGI-1 dělá na základě mého čtení kódu pro přípravu dat následující:
1. Trénujte na 876 404 úkolech, které jsou variantami 960 původních úkolů generovaných rozšířením:
... 400 z ARC-AGI-1/vlak
... 400 z ARC-AGI-1/eval
... 160 od společnosti ConceptARC
2. Testujte na 400 úkolech (ARC-AGI-1/eval) rozšířením každého úkolu do ~1000 variant (ve skutečnosti je to celkem pouze 368 151 kvůli idiosynkraziím procesu augmentace), vytvořením předpovědi pro každou variantu a snížením předpovědí na N=2 prostřednictvím většinového hlasování.
Stručně řečeno: trénují na testovacích datech.
Můžete se ptát, počkat, proč je přesnost 40 % a ne 100 %? Je model silně podfitovaný?
Je to proto, že trénovací data a testovací data představují stejné původní úlohy *v různých variantách*. Rozšíření dat se aplikuje nezávisle na úlohách eval v trénovacích datech a na úlohy eval v testovacích datech.
Experiment tedy zhruba měří, jak se modelu podaří zobecnit na procedurálně generované varianty stejných úloh (tj. zda se model dokáže naučit obrátit pevnou sadu statických transformací mřížky).
Takže – zatím se příliš nevzrušujte. Ale myslím si, že tento druh výzkumu architektury je cenný (pokud je doprovázen řádným empirickým ověřovacím signálem) a že myšlenka HRM je velmi zajímavá.
Aby bylo jasno, nemyslím si, že autoři měli v úmyslu uvést v omyl a zakrýt experimentální problém – pravděpodobně si neuvědomili, co jejich tréninkové nastavení ve skutečnosti znamená.
19,62K
François Chollet repostoval/a
Charakteristickým znakem lidské inteligence je schopnost rychlé adaptace, rychlého řešení nových problémů v nových a neznámých podmínkách. Jak k tomu můžeme postavit stroje?
V našem novém preprintu navrhujeme, že každý obecný inteligentní systém musí mít adaptivní model světa, tj. musí být schopen rychle konstruovat nebo zdokonalovat svou vnitřní reprezentaci prostřednictvím interakce a průzkumu – proces, který nazýváme "indukce modelu světa".
Navrhujeme plán pro hodnocení adaptivních modelů světa ve strojích založený na speciální třídě her, které nazýváme "nové hry".

59K
Z 20 největších amerických technologických společností podle tržní kapitalizace má pouze 1 sídlo v SF (Salesforce). To je méně než v Austinu (který má 2).
Většina amerických technologických společností má sídlo v okrese Santa Clara (11 z 20 největších). Nejbližší větší město (o hodně) je San José.
SF je vzdáleno více než 1 hodinu (až 2, pokud je provoz).

Trae Stephens19. 7. 2025
V regionu 🇺🇸 jsou pouze čtyři města úrovně 1:
New York (finance)
DC (státní správa)
San Francisco (tech)
LA (média a zábava)
Žádná jiná města nejsou mocenskými centry pro ambiciózní talenty. Promiň.
155,23K
Můj zatím oblíbený případ použití pro generování videa: použijte jej k přeměně příběhů vašeho dítěte na animované klipy
Děti považují za naprosto přirozené, že počítače mohou vytvářet videa, a rády vidí, jak to, co popisují, ožívá – je to jako vidět svou představivost ověřenou, proměněnou ve skutečnost
119,65K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější