Olen nähnyt joukon ihmisiä puhuvan siitä, kuinka he ovat havainneet GPT-5:n olevan askel alaspäin aiemmista malleista. En voi puhua heidän kokemuksistaan, mutta omani on ollut päinvastainen. Eilen sain GPT-5 Thinkingin suunnittelemaan minulle monimutkaisen verkkotunnuskohtaisen kielen prosessorien konekäskyjen semantiikan määrittämiseen. (Asian tarkoitus on helpottaa emulaattorien luomista ja ylläpitoa vanhoille tietokoneille, mikä on harrastukseni.) LLM ei ollut täydellinen, mutta teki erinomaista työtä ja osoitti todellista luovuutta tehtävässä. Tuloksena oleva DSL on erinomainen ja olisi vaatinut paljon työtä, jos olisin tehnyt sen käsin. En ole vielä täysin lopettanut työskentelyä LLM:n kanssa spesifikaation parissa, mutta kun teen sen, epäilen, että se pystyy yhdellä laukauksella suurimman osan kääntäjästä. Ehkä joillekin ihmisille asia toimii huonosti; En tiedä, mitä he yrittävät tehdä. En myöskään voi puhua heidän maustaan sellaisista asioista kuin "persoonallisuudesta", ja sitä paitsi järjestelmäni kehotus epäsuorasti pyytää mallia olemaan erittäin ammattimainen ja tylsä. (En myöskään ole kiinnostunut siitä, että tekoäly tarjoaa minulle kumppanuutta tai emotionaalista tukea, enkä halua olla parasosiaalisessa suhteessa siihen.) Minulle se tekee todella hyvää työtä ja erittäin monimutkaisessa teknisessä tehtävässä. Huomaa, että ymmärrän työn, jonka pyydän järjestelmää tekemään erittäin hyvin, pystyn havaitsemaan sen tekemät virheet ja korjaamaan ne, ja pidän työtä, joka on 95-prosenttisesti tehty muutaman iteroinnin jälkeen, todella hyvänä lopputuloksena, koska voin korjata loput. Ehkä jos yrität saada yhden kuvan toimivasta piirisuunnittelusta etkä tiedä sähkötekniikkaa, asia ei silti tee sitä, mitä haluat. Minulle se on kuitenkin hämmästyttävä työkalu, ja se on selvä parannus o3:een verrattuna.
Näen paljon valituksia siitä, että persoonallisuus on "kuin ylityöllistetty sihteeri", enkä ole koskaan kokenut mitään sellaista, mutta toisaalta käytän järjestelmäkehotetta ja näyttää siltä, että useimmat ihmiset eivät käytä sitä, enkä koskaan käytä ei-järkeilevää mallia, ja näyttää siltä, että useimmat ihmiset käyttävät vain mallin ei-järkeilevää versiota.
43,56K