We bevinden ons nog steeds in een tijdperk waarin geen enkel model alles domineert. Voor mensen die veel met AI doen, ga je afwisselen tussen Gemini, Claude en ChatGPT.
En dat is niet alleen omdat modellen specifieke vaardigheden hebben, elk heeft een persoonlijkheid die bijdraagt aan de bruikbaarheid bij taken.
De belangrijkste les van de afgelopen weken is dat de Big Four Amerikaanse laboratoria allemaal lijken te hebben ontdekt hoe ze de exponentiële snelheid van verbetering van LLM's kunnen voortzetten, althans in de nabije toekomst.
Als gevolg hiervan blijven agents vooruitgang boeken in coderen en in kantoortaken zoals PowerPoint.
Ik had vroegtijdige toegang tot Opus 4.5 en het is een zeer indrukwekkend model dat lijkt te zijn aan de voorhoede.
Grote vooruitgangen in het vermogen om praktisch werk te doen (zoals het maken van een PowerPoint vanuit een Excel) en de beste resultaten ooit (& in één keer) in mijn Lem-poëzietest, plus goede resultaten in Claude Code.