Jag har sett ett gäng människor prata om hur de har tyckt att GPT-5 är ett steg ner från tidigare modeller. Jag kan inte uttala mig om deras erfarenhet, men min egen har varit den motsatta. Igår lät jag GPT-5 Thinking designa ett komplicerat domänspecifikt språk för mig för att specificera semantiken för maskininstruktioner i CPU:er. (Syftet med saken är att göra det lättare att skapa och underhålla emulatorer för gamla datorer, vilket är en hobby för mig.) LLM var inte perfekt men gjorde ett utmärkt jobb och visade verklig kreativitet vid uppgiften. Den resulterande DSL-filen är utmärkt och skulle ha krävt massor av arbete om jag hade gjort det för hand. Jag har inte helt avslutat arbetet med LLM på specifikationen, men när jag gör det misstänker jag att det kommer att kunna ett skott det mesta av kompilatorn. Kanske fungerar det dåligt för vissa människor; Jag vet inte vad de försöker göra. Jag kan inte heller tala till deras smak om saker som "personlighet", och dessutom ber mitt system implicit modellen att vara extremt professionell och intetsägande. (Jag har inte heller något intresse av att AI:n ger mig sällskap eller känslomässigt stöd och vill inte ha en parasocial relation med den.) För mig är det verkligen att göra ett riktigt bra jobb, och på en extremt komplicerad teknisk uppgift. Observera att jag förstår det arbete som jag ber systemet att göra extremt bra, jag är i en position att fånga upp misstag som det gör och korrigera dem, och jag anser att ett jobb som är 95 % gjort efter några iterationer är ett riktigt bra resultat eftersom jag kan korrigera resten. Kanske om du försöker ha saken en enda bild en fungerande kretsdesign och du inte kan någon elektroteknik, gör saken fortfarande inte vad du vill. För mig är det dock ett fantastiskt verktyg och är en klar förbättring jämfört med o3.
Jag ser massor av klagomål om att personligheten är "som en överarbetad sekreterare", och jag har aldrig upplevt något liknande, men å andra sidan, jag använder en systemprompt och det verkar som om de flesta människor inte gör det, och jag använder aldrig den icke-resonerande modellen, och det verkar som om de flesta människor bara använder den icke-resonerande versionen av modellen.
43,58K