Viděl jsem spoustu lidí, kteří mluvili o tom, jak zjistili, že GPT-5 je o krok dolů oproti předchozím modelům. Nemohu mluvit o jejich zkušenostech, ale moje vlastní byla opačná. Včera jsem si od GPT-5 Thinking nechal navrhnout komplikovaný doménově specifický jazyk pro specifikaci sémantiky strojových instrukcí v procesorech. (Účelem této věci je usnadnit vytváření a údržbu emulátorů pro staré počítače, což je můj koníček.) LLM nebyl dokonalý, ale odvedl vynikající práci a prokázal skutečnou kreativitu v tomto úkolu. Výsledný DSL je vynikající a vyžadoval by spoustu práce, kdybych to dělal ručně. Ještě jsem úplně nedokončil práci s LLM na specifikaci, ale až to udělám, mám podezření, že bude schopen jednou střelou zvládnout většinu kompilátoru. U některých lidí to možná funguje špatně; Nevím, o co se snaží. Také nemohu mluvit do jejich vkusu ve věcech jako je "osobnost" a kromě toho, můj systémový prompt implicitně žádá modelku, aby byla ultra profesionální a nevýrazná. (Také nemám zájem o to, aby mi umělá inteligence poskytovala společnost nebo emocionální podporu, a nechci s ní mít parasociální vztah.) Za mě určitě odvádí opravdu dobrou práci, a to na extrémně složitém technickém úkolu. Všimněte si, že velmi dobře rozumím práci, kterou od systému žádám, jsem schopen zachytit chyby, které dělá, a opravit je, a práci, která je po několika iteracích z 95 % hotová, považuji za opravdu dobrý výsledek, protože mohu opravit zbytek. Možná, že pokud se snažíte, aby věc byla jedním pokusem o návrh funkčního obvodu a neznáte žádnou elektrotechniku, ta věc stále nedělá to, co chcete. Pro mě je to však úžasný nástroj a je to výrazné zlepšení oproti o3.
Vidím spoustu stížností na to, že osobnost je "jako přepracovaná sekretářka", a nikdy jsem nic takového nezažil, ale na druhou stranu, používám systémový prompt a zdá se, že většina lidí ne, a já nikdy nepoužívám model bez uvažování a zdá se, že většina lidí používá pouze nerozumnou verzi modelu.
39,49K