Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Princeton CS prof. Ředitel @PrincetonCITP. Používám X ke sdílení svého výzkumu a komentářů ke společenskému dopadu umělé inteligence.
KNIHA: AI Snake Oil. Pohledy můj.
Řekl jsem to stokrát, ale budu to říkat dál: Přijetí umělé inteligence a změna chování jsou pomalé – a zůstanou pomalé – bez ohledu na to, jak rychle se schopnosti zlepší. Statistika na snímku obrazovky stojí za zamyšlení: téměř rok po vydání "myslících" modelů je používal jen nepatrný zlomek uživatelů (dokud automatický přepínač GPT-5 čísla tiše nezvýšil).
To je přesně to, co bychom měli očekávat. Převládajícím narativem je, že umělá inteligence je přijímána bezprecedentní rychlostí, ale to je založeno na tom, kolik lidí ji vyzkoušelo, ignorovalo, jak dlouho ji používají, jak dlouho ji každý den používají a kolik z ní mají. Dokonce i život zachraňujícím inovacím trvá dlouho, než proniknou populací. Jedná se o vlastnost lidského chování, nikoli o danou technologii, takže bychom neměli očekávat, že umělá inteligence bude jiná. (Více informací naleznete v části Umělá inteligence jako normální technologie.)
Někteří budou tvrdit, že automatický přepínač GPT-5 dokazuje, že vývojáři mohou lidem v podstatě rychle vnutit umělou inteligenci. Rozhodně ne. Přepínač modelů byl problém, který si OpenAI vyrobila sama, takže jej OpenAI dokázala vyřešit. Přechod na model myšlení pod kapotou nevyžaduje, aby se uživatel učil nové dovednosti nebo chování nebo měnil své pracovní postupy. Je výmluvné, že OpenAI nedokázala podobně integrovat režim Deep Research nebo Agent Mode, které vyžadují přizpůsobení uživatele – zejména ten druhý, kdy se uživatelé musí naučit dohlížet na model, přesně sdělovat požadavky úkolů, činit složitá a potenciálně riskantní rozhodnutí o bezpečnosti a to vše považovat za dostatečně užitečné, aby chtěli otevřít své peněženky.

26,44K
Arvind Narayanan repostoval/a
Mnohé z těchto výsledků nás překvapily a plánujeme je prozkoumat podrobněji. Trendy napříč těmito benchmarky však potvrzují, že GPT-5 není skokovou změnou a nezlepšuje se oproti ostatním modelům OpenAI. Září však v kompromisech mezi cenou a přesností – často je mnohem levnější než srovnatelné modely.
6,59K
Arvind Narayanan repostoval/a
Jak si GPT-5 stojí ve srovnání s Claude Opus 4.1 v agentických úlohách?
Od jejich vydání tyto modely vyhodnocujeme na náročných vědeckých, webových, servisních a kódových úlohách.
Hlavní výsledek: I když je GPT-5 nákladově efektivní, zatím se nikdy nedostal na první místo v žebříčcích agentů. Další hodnocení 🧵

61,63K
Arvind Narayanan repostoval/a
Je GPT-5 dobrým milníkem k tomu, abychom konečně přestali všechno nazývat "modely" a začali rozlišovat mezi chatboty, API, váhami modelů a podle toho porovnávat/porovnávat?
Nemá smysl porovnávat výstupy chatbotů (které mohou být výsledkem desítek různých hmotností modelů) s výstupy jedné hmotnosti modelu, je to jako porovnávat auto s motorem (kniha z @random_walker @sayashk)


9,26K
Arvind Narayanan repostoval/a
📢 Nový článek, publikovaný @knightcolumbia.
Často mluvíme o tom, že AI agenti rozšiřují vs. automatizují práci, ale jak přesně mohou vypadat různé konfigurace interakce mezi člověkem a agentem? Zavádíme 5úrovňový rámec pro autonomii agentů AI, abychom to rozbalili.
🧵👇

4,77K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější