Een Agent Opleiden - Aflevering 8 In deze aflevering gaat @beyang in gesprek met @camden_cheek over hoe het Amp-team nieuwe modellen evalueert: waarom het aanroepen van tools de belangrijkste onderscheidende factor is, hoe open modellen zoals K2 en Qwen zich verhouden, welke veranderingen GPT-5 met zich meebrengt, en hoe kwalitatieve "vibe checks" vaak belangrijker zijn dan benchmarks. Ze duiken ook in subagenten, modellegeringen en hoe de toekomst van agentisch coderen eruitziet binnen Amp. Tijdstempels: 0:00 Intro — Waarom modelevaluatie belangrijk is 1:06 Amp’s multi-model filosofie 3:16 Waarom Gemini Pro niet bleef hangen 4:55 Falen van toolaanroepen & gebruikersverstoring 6:09 Iteratieverval vs zelfcorrectie 10:08 Hype rond open modellen (K2, Qwen) 11:22 Het “56k-tijdperk van agents” 18:01 Eerste indrukken van GPT-5 20:35 Het legeren van modellen & Oracle als fallback 24:26 Hoe GPT-5 anders aanvoelt (persoonlijkheid & stuurbaarheid) 29:10 Het oversteken van de gebruikbaarheiddrempel 38:13 Waarom vibes > benchmarks 44:18 Regressietests & evaluatiefilosofie 46:21 Multi-model toekomst > enkele winnaar 52:38 Laatste gedachten
10,65K