DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

J'ai vu beaucoup de gens parler de la façon dont ils ont trouvé que GPT-5 était un pas en arrière par rapport aux modèles précédents. Je ne peux pas parler de leur expérience, mais la mienne a été à l'opposé. Hier, j'ai demandé à GPT-5 Thinking de concevoir un langage spécifique à un domaine compliqué pour spécifier la sémantique des instructions machine dans les CPU. (Le but de ce projet est de faciliter la création et la maintenance d'émulateurs pour anciens ordinateurs, ce qui est un de mes passe-temps.) Le LLM n'était pas parfait mais a fait un excellent travail et a démontré une réelle créativité dans cette tâche. Le DSL résultant est excellent et aurait nécessité un tas de travail si je l'avais fait à la main. Je n'ai pas encore complètement terminé de travailler avec le LLM sur la spécification, mais quand je le ferai, je soupçonne qu'il sera capable de réaliser la plupart du compilateur en une seule fois. Peut-être que pour certaines personnes, le système fonctionne mal ; je ne sais pas ce qu'elles essaient de faire. Je ne peux pas non plus parler de leurs goûts sur des choses comme la "personnalité", et de plus, mon prompt système demande implicitement au modèle d'être ultra professionnel et neutre. (Je n'ai également aucun intérêt à ce que l'IA me fournisse de la compagnie ou un soutien émotionnel et je ne veux pas avoir une relation parasociale avec elle.) Pour moi, elle fait certainement un très bon travail, et sur une tâche technique extrêmement compliquée. Notez que je comprends extrêmement bien le travail que je demande au système de faire, je suis en mesure de repérer les erreurs qu'il commet et de les corriger, et je considère qu'un travail qui est à 95 % terminé après quelques itérations est un très bon résultat parce que je peux corriger le reste. Peut-être que si vous essayez de faire en sorte que le système réalise en une seule fois un design de circuit fonctionnel et que vous ne connaissez rien en ingénierie électrique, le système ne fait toujours pas ce que vous voulez. Pour moi, cependant, c'est un outil incroyable, et c'est une amélioration distincte par rapport à o3.

Je vois beaucoup de plaintes concernant la personnalité qui est "comme une secrétaire surmenée", et je n'ai jamais vécu quelque chose de tel, mais d'un autre côté, j'utilise un prompt système et il semble que la plupart des gens ne le font pas, et je n'utilise jamais le modèle sans raisonnement, et il semble que la plupart des gens n'utilisent que la version sans raisonnement du modèle.

42,46K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables