D'accord, voici mes impressions générales sur GPT-5 : - La plus grande amélioration semble être de 4o à 5. J'utilise rarement ces modèles, mais pour l'utilisateur moyen, c'est une énorme mise à niveau. - 5-T est parfois meilleur que o3, parfois pire. Je constate que je fais souvent des requêtes côte à côte ici, ce qui est ennuyeux. o3 semble parfois chercher plus profondément et plus minutieusement. o3 est aussi _plus étrange_ / plus autiste, ce que j'apprécie personnellement. - 5-pro est vraiment très intelligent, clairement "le modèle le plus intelligent sur le marché" pour des questions complexes. Je dois passer plus de temps à tester ici, mais jusqu'à présent, il a produit de meilleurs résultats que o3 pro. - J'ai passé quelques heures dans Cursor/GPT5 hier soir et j'ai été super impressionné. Le modèle est vraiment rapide, le suivi des instructions + l'appel d'outils est nettement meilleur, et il est plus fiable dans l'ensemble. Vous devez toujours utiliser toutes les protections habituelles de codage AI pour obtenir un bon résultat, mais cela semble à peu près aussi bon que Claude Code / Sonnet maintenant en termes de capacités, et il est en fait meilleur pour faire des UIs plus complexes / front-end d'après ce que je peux dire jusqu'à présent. - CC semble toujours être un meilleur produit global que Codex pour moi en ce moment, mais je suis sûr qu'ils vont rattraper leur retard. - Ils semblent avoir amélioré les capacités d'écriture de fiction de GPT5-T. J'ai obtenu des choses intéressantes/novatrices pour la première fois, ce qui est nouveau. (Je posterai un exemple dans les tweets de réponse). - Je trouve l'UX pour accéder à GPT5-T / Pro ennuyeuse (un sous-menu ? vraiment ?) et j'aimerais que ce soit juste un interrupteur. J'espère que c'est une solution facile. Dans l'ensemble : - Très heureux en tant qu'utilisateur Pro, mais je peux comprendre pourquoi les utilisateurs Plus pourraient se plaindre du routeur de modèle. ChatGPT continue d'être mon principal recours pour la plupart des utilisations de l'IA. - Je ne vois pas du tout le point de "plateau" et je pense que les gens réagissent trop rapidement. Il y a encore beaucoup de temps pour s'étendre le long de la frontière de l'appel d'outils/agents, pour une chose. (C'est le plus facile à voir quand vous codez, peut-être, car c'est là que la plus grande amélioration semble être venue.) - Je m'attends à ce qu'OpenAI tire très bien parti de cette sortie et que leurs chiffres continuent d'augmenter. Comme ils le devraient.
L'exemple de recherche o3/5-T que j'ai mentionné :
Nabeel S. Qureshi
Nabeel S. Qureshiil y a 15 heures
Je suis encore en train de l'évaluer, mais le nouveau GPT5-T semble moins performant en recherche que o3. Voici un exemple côte à côte où je lui demande de trouver un livre publié en novembre 2024. o3 le trouve et donne un résumé détaillé ; GPT5-T ne le trouve pas du tout.
Concernant l'écriture créative, je lui ai demandé de faire un paragraphe sur le fait de prendre un café froid dans le style de Finnegans Wake de Joyce et j'ai été impressionné par le pastiche ci-dessous. Pour un modèle post-entraînement, il y a beaucoup plus de nouveauté/créativité que d'habitude (par exemple, "taxicoal black" pour le café était drôle).
(De plus, tout cela provient d'une utilisation du modèle pendant moins d'une demi-journée, donc attendez-vous à ce que certaines de ces opinions changent à mesure que je me familiarise mieux avec les modèles...)
@ChrisSpoke Le mieux, comme pour la plupart des choses, est probablement d'essayer pendant un mois et de voir comment ça se passe.
4,01K