Als je 2 minuten hebt om deze lange post te lezen, krijg je mijn EERLIJKE feedback over Chat-GPT5. Ik was enthousiast om Chat-GPT5 uit te proberen, en ik heb het vandaag live getest gedurende meer dan 4 uur, samen met Google Gemini 2.5 Pro en Claude 4. En het eindoordeel is... Ik ben erg teleurgesteld over de resultaten. Google Gemini presteerde het beste voor de meeste prompts, en Claude 4 kwam meestal op de tweede plaats (zie de sheet hieronder: 3 is goed, 1 is slecht). Een taak waarin ChatGPT echt uitblonk, was het creëren van een browsergebaseerde muziekgenerator die reageert op invoer zoals het bewegen van de muis en klikken (zelfs met een superleuke opnamefunctie), maar voor de rest leverde het niet de verwachte resultaten en faalde het vaak om een werkend voorbeeld te produceren, zelfs na 2-3 prompts. Om volledige context te geven, heb ik Chat-GPT getest op de officiële website en daarna met Cursor. Met Cursor werkte het VEEL beter, maar het bleef nog steeds ver achter bij de andere modellen. Hetgene dat ik het meest vervelend vond, was dat het gewoon vastzat sinds de eerste prompt en niets werkends produceerde, terwijl de andere 2 modellen bijna altijd een output hadden van een soort die je tenminste kon controleren en testen. Vandaag ontdekte ik ook dat Google Gemini je in staat stelt om een multiplayer-applicatie te maken. Ja, je hoort het goed: het synchroniseert status en transformatie, bijvoorbeeld voor een multiplayer spel (met Firebase, maar nog steeds indrukwekkend om een werkend prototype te krijgen!). Gratis. Natuurlijk is het niet perfect, maar dit opent zoveel mogelijkheden voor het prototypen van dingen, vooral kleine multiplayer spellen. Dat gezegd hebbende, denk ik dat GPT-5 een sterk model is, en het is behoorlijk snel, maar ik verwachtte dat het de andere twee minder recente modellen absoluut zou overtreffen, wat niet het geval was, althans op basis van de benchmark waarmee ik het heb getest (ik heb ze niet geprobeerd voordat ik live ging; dit was een real-time test). Ik zou graag met iemand willen discussiëren die denkt dat dit "het nieuwe model is dat je MOET gebruiken of anders achterblijft," omdat dat niet mijn ervaring was in deze specifieke set tests (die meer dan 4 uur duurden). Morele: vertrouw niet alles wat je op sociale media ziet, of nog beter, vertrouw niemand.
@patloeber sorry voor de typfouten, ik was te enthousiast
4,52K