GPT-5 není připraven na produkční agentskou práci. Kimi by mohl být. Více účtenek (jako u každého dobrého účetnictví) Běžel jsem GPT-5 s Opusem 4.1, ale trvalo to tak dlouho, že jsem nakonec běžel na 3 modelech a čekal na dokončení GPT-5. Běhy jsou zde trochu hyperverbální, takže moje rychlá anotace: 1. Následování pokynů Mimo jiné jsem byl požádán o "použití poskytnutého pracovního prostoru TypeScriptu" -GPT-5: Ignorováno po dobu 15 minut, nejprve napsáno 31 příkazů shellu -Kimi: Okamžitě jsem vyzkoušel TypeScript (selhalo 3x na cestách, ale stále jsem to zkoušel) -Opus: TypeScript v minutě 2 -Sonet: TypeScript v minutě 7 2. Zpracování chyb -GPT-5: Příkaz 500 znaků selže → rozšíří se na 2000+ znaků → stále selže → stále se rozšiřuje -Kimi: Chyba cesty 3x → konečně zjednodušuje → funguje -Opus: 95% práce napoprvé -Sonet: Chybějící nástroj → přepíná přiblížení → pokračuje 3. Unikátní zjištění (naše hlavní práce - stojí za samostatný příspěvek) -GPT-5: Změny schématu (RIDRETH2→RIDRETH3), vzory pojmenování (_J přípona) -Kimi: Základní validace - SEQN existuje, 9966 účastníků -Sonet: Duševní zdraví skryté v Jiné/, 1,4 milionu řádkových souborů -Opus: 86 % navrženo řídkost, rozsah 2-323 sloupců 4. Vytvořeno v kódu -GPT-5: inventory.ts s 2000+ znaky zabudovanými uvnitř -Kimi: simple_validate.ts - minimální, ale funguje -sonet: comprehensive_analysis.ts - čisté oddělení -Opus: 3 modulární soubory - rozšiřitelný framework 5. Zdroje -Kimi: 14 minut, 1,59 $ -Sonet: 6 minut, 1,87 $ -GPT-5: 27 minut, 5,04 $ -Opus: 10 min, 10,46 $ To znamená, že vidím, že GPT-5 zná spoustu technických triků a je docela schopným hercem na základní úrovni - ale přichází s vysokou chybovou rezervou a rizikem odchýlení se od bodu (což u tohoto úkolu udělal několikrát). Mohl bych ho použít pro rychlé ladění, ale masivní kódová základna nebo analytická úloha, preferoval bych kimi s mnoha mantinely, jak to stojí.
37,37K