Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Podrobná diskuse o agentech, GPT-5 a hodnocení modelů
👇

Před 20 h
Výchova agenta - Epizoda 8
V této epizodě si @beyang s @camden_cheek sejde a probereme, jak tým Amp hodnotí nové modely: proč je volání nástrojů klíčovým rozlišovacím prvkem, jak si stojí otevřené modely jako K2 a Qwen, jaké změny GPT-5 a jak kvalitativní "kontroly vibrací" jsou často důležitější než benchmarky. Ponoří se také do subagentů, modelových slitin a do toho, jak vypadá budoucnost agentního kódování uvnitř Amp.
Časová razítka:
0:00 Úvod — Proč na modelu záleží
1:06 Filozofie více modelů společnosti Amp
3:16 Proč Gemini Pro nedrželo
4:55 Selhání volání nástrojů a narušení uživatelů
6:09 Iterace rozpad vs autokorekce
10:08 Hype otevřených modelů (K2, Qwen)
11:22 "Éra agentů 56k"
18:01 První dojmy z GPT-5
20:35 Legující modely a Oracle jako záložní řešení
24:26 Jak se GPT-5 cítí jinak (osobnost a ovladatelnost)
29:10 Překročení prahu použitelnosti
38:13 Proč vibrace > benchmarky
44:18 Regresní testování a filozofie
46:21 Multi-model budoucnost > jediný vítěz
52:38 Závěrečné myšlenky
2,33K
Top
Hodnocení
Oblíbené