Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Tenhle článek z MIT mě 🤯 úplně ohromil
Článek je o "ARC" a úplně změnil můj pohled na benchmark.
Výzkumníci ARC vůbec nebrali jako logickou hádanku. Každý úkol brali jako vizuální proměnu.
Mřížka dovnitř → mřížka ven. Nic složitějšího než to.
Postavili malý Vision Transformer, natrénovali ho od nuly na malém datasetu ARC a použili jednoduchý trik s plátnem, aby každý příklad umístili jako obrázek.
Pak přidali změny škály, translace a základní vizuální předpoklady, které byste viděli v klasické práci s počítačovým viděním.
To je vše.
Žádné myšlenkové řetězce, žádné podněty, žádné chytré symbolické triky.
Jen model, který se dívá na pixely a učí se, jak se tvary pohybují, převracejí, rostou, kolabují nebo se přenášejí dál.
Ta divoká část?
Tento malý model dosahuje 54,5 % samotného a 60,4 % v kombinaci s U-Net.
To je přibližně průměrný lidský výkon s modelem, který se vejde do velikosti malé mobilní aplikace.
Když vidím ARC vyřešené tímto způsobem, celý benchmark působí jinak.
Úkoly najednou vypadají jako mapování obrázků místo skrytých pravidel. Úkoly reflexe skutečně vypadají jako reflexe.
Úlohy symetrie vypadají jako symetrie. Gravitační úkoly vypadají jako dílky "padající" přímo po plátně.
Upřímně to ještě zpracovávám.
Tohle je možná nejrealistickější výsledek ARC, jaký jsem za roky četl, a pochází z toho, že jsem benchmark bral nejdoslovněji než kdokoli.

2,05K
Nejsilnější AI tvůrci 👇 agentů
1. n8n
2. LangChain
3. CrewAI
4. Agent Builder od OpenAI
Kterou právě používáš?
Všechny jsem je zkoušel v reálných projektech a n8n se stále ukazuje jako nejsilnější nástroj na stole. Zvládá skutečnou práci. Ta nepořádná práce. Práce, která se dotýká skutečných systémů místo toho, aby žila v chatovací bublině.
Tady je to, co mě přimělo u toho vydržet:
N8N mi umožňuje vytvářet agenty, kteří otevírají e-maily, čtou je, extrahují užitečná data a posílají je tam, kam potřebují. Umožnilo mi to zapojit tyto agenty do CRM, tabulek, databází, Slacku, Notionu, API a všeho, na čem závisely mé pracovní postupy.
Mohl jsem skládat kroky, stavět smyčky, opakovat úkoly a sledovat, jak vše běží s plnou viditelností.
LangChain mi dal flexibilitu, ale pracovní postupy se rychle zamotávaly.
CrewAI usnadnila první experimenty, ale složité procesy překračovaly jeho limity.
OpenAI Agent Builder má potenciál, ale zdi se objeví rychle, když potřebujete hlubší kontrolu.
N8N zvládl celý proces od uvažování až po akci, aniž by mě nutil stavět backend nebo ručně slepovat nástroje. Agent se díky tomu cítil jako skutečný operátor, ne jako chatbot s dalšími kroky.
Skutečná změna nastala, když jsem viděl, jak čistě dokážu proměnit jeden pracovní postup v něco opakovatelného. Nejde o demo. Funkční systém. Něco, na co se může firma spolehnout každý den.
Pokud letos stavíte agenty, platforma, kterou si vyberete, ovlivňuje všechno.
Takže mě zajímá, s kterou z nich stavíte a co vás k tomu vedlo.

4,2K
Top
Hodnocení
Oblíbené


