Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 není připraven na produkční agentskou práci. Kimi by mohl být. Více účtenek (jako u každého dobrého účetnictví)
Běžel jsem GPT-5 s Opusem 4.1, ale trvalo to tak dlouho, že jsem nakonec běžel na 3 modelech a čekal na dokončení GPT-5.
Běhy jsou zde trochu hyperverbální, takže moje rychlá anotace:
1. Následování pokynů
Mimo jiné jsem byl požádán o "použití poskytnutého pracovního prostoru TypeScriptu"
-GPT-5: Ignorováno po dobu 15 minut, nejprve napsáno 31 příkazů shellu
-Kimi: Okamžitě jsem vyzkoušel TypeScript (selhalo 3x na cestách, ale stále jsem to zkoušel)
-Opus: TypeScript v minutě 2
-Sonet: TypeScript v minutě 7
2. Zpracování chyb
-GPT-5: Příkaz 500 znaků selže → rozšíří se na 2000+ znaků → stále selže → stále se rozšiřuje
-Kimi: Chyba cesty 3x → konečně zjednodušuje → funguje
-Opus: 95% práce napoprvé
-Sonet: Chybějící nástroj → přepíná přiblížení → pokračuje
3. Unikátní zjištění (naše hlavní práce - stojí za samostatný příspěvek)
-GPT-5: Změny schématu (RIDRETH2→RIDRETH3), vzory pojmenování (_J přípona)
-Kimi: Základní validace - SEQN existuje, 9966 účastníků
-Sonet: Duševní zdraví skryté v Jiné/, 1,4 milionu řádkových souborů
-Opus: 86 % navrženo řídkost, rozsah 2-323 sloupců
4. Vytvořeno v kódu
-GPT-5: inventory.ts s 2000+ znaky zabudovanými uvnitř
-Kimi: simple_validate.ts - minimální, ale funguje
-sonet: comprehensive_analysis.ts - čisté oddělení
-Opus: 3 modulární soubory - rozšiřitelný framework
5. Zdroje
-Kimi: 14 minut, 1,59 $
-Sonet: 6 minut, 1,87 $
-GPT-5: 27 minut, 5,04 $
-Opus: 10 min, 10,46 $
To znamená, že vidím, že GPT-5 zná spoustu technických triků a je docela schopným hercem na základní úrovni - ale přichází s vysokou chybovou rezervou a rizikem odchýlení se od bodu (což u tohoto úkolu udělal několikrát).
Mohl bych ho použít pro rychlé ladění, ale masivní kódová základna nebo analytická úloha, preferoval bych kimi s mnoha mantinely, jak to stojí.
37,37K
Top
Hodnocení
Oblíbené