Podrobná diskuse o agentech, GPT-5 a hodnocení modelů 👇
Amp — Research Preview
Amp — Research PreviewPřed 20 h
Výchova agenta - Epizoda 8 V této epizodě si @beyang s @camden_cheek sejde a probereme, jak tým Amp hodnotí nové modely: proč je volání nástrojů klíčovým rozlišovacím prvkem, jak si stojí otevřené modely jako K2 a Qwen, jaké změny GPT-5 a jak kvalitativní "kontroly vibrací" jsou často důležitější než benchmarky. Ponoří se také do subagentů, modelových slitin a do toho, jak vypadá budoucnost agentního kódování uvnitř Amp. Časová razítka: 0:00 Úvod — Proč na modelu záleží 1:06 Filozofie více modelů společnosti Amp 3:16 Proč Gemini Pro nedrželo 4:55 Selhání volání nástrojů a narušení uživatelů 6:09 Iterace rozpad vs autokorekce 10:08 Hype otevřených modelů (K2, Qwen) 11:22 "Éra agentů 56k" 18:01 První dojmy z GPT-5 20:35 Legující modely a Oracle jako záložní řešení 24:26 Jak se GPT-5 cítí jinak (osobnost a ovladatelnost) 29:10 Překročení prahu použitelnosti 38:13 Proč vibrace > benchmarky 44:18 Regresní testování a filozofie 46:21 Multi-model budoucnost > jediný vítěz 52:38 Závěrečné myšlenky
2,33K