Hier is een recente lezing die ik heb gegeven waarin ik de laatste 6-12 maanden van AI-vooruitgang samenvat, waarom het moeilijk is om perfecte modellen te krijgen, hoe laboratoria waarschijnlijk de volgende fase van training (voor agenten) benaderen, en andere interessante weetjes over het redeneerl landschap. Onderwerpen: 00:00 Introductie & de staat van redeneren 05:50 Hillclimbing onvolmaakte evaluaties 09:18 Technische knelpunten 13:02 Sycophancy 18:08 De Gouden Middenweg 19:28 Wat komt er daarna? (tip, planning) 26:40 V&A YouTube enz. in de reacties. Bedankt @corbtt en @OpenPipeAI voor het hosten van mij.
Bericht (transcript + links): YouTube: Dia's:
67,95K