Agentin kasvattaminen - Jakso 8 Tässä jaksossa @beyang istuu alas @camden_cheek kanssa keskustelemaan siitä, miten Amp-tiimi arvioi uusia malleja: miksi työkalujen kutsuminen on keskeinen erottava tekijä, miten avoimet mallit, kuten K2 ja Qwen, pinoutuvat, mitä GPT-5 muuttaa ja kuinka laadulliset "tunnelmatarkistukset" ovat usein tärkeämpiä kuin vertailuarvot. He sukeltavat myös aliagentteihin, malliseoksiin ja siihen, miltä agenttikoodauksen tulevaisuus näyttää Ampin sisällä. Aikaleimat: 0:00 Johdanto — Miksi mallilla on merkitystä 1:06 Ampin monimallifilosofia 3:16 Miksi Gemini Pro ei tarttunut 4:55 Työkalujen kutsumisvirheet ja käyttäjähäiriöt 6:09 Iteraatioiden heikkeneminen vs. itsekorjaus 10:08 Avointen mallien hype (K2, Qwen) 11:22 "Agenttien 56k-aikakausi" 18:01 Ensivaikutelma GPT-5:stä 20:35 Mallien seos ja Oracle varamallina 24:26 Miten GPT-5 tuntuu erilaiselta (persoonallisuus ja ohjattavuus) 29:10 Käytettävyysrajan ylittäminen 38:13 Miksi tunnelmat > vertailuarvot 44:18 Regressiotestaus ja eval-filosofia 46:21 Monen mallin tulevaisuus > yksittäinen voittaja 52:38 Lopulliset ajatukset
10,65K