Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Taelin
Druh / ohyb / HVM / INets / λCalculus
Ano, žádný model na světě se tomu ani zdaleka nepřibližuje
jdu spát na 100% jistý, že mám pravdu ve svém úsudku
jako vždy, brzy to bude zdravý rozum, ale řekl jsem to jako první (:
Zatím

TaelinPřed 2 h
Aha, právě jsem si všiml, že řešení GPT-5 je identické s mým
To je neuvěřitelné
6,65K
ne, všichni se mýlíte, GPT-5 je skok
Na 100 % se zde zdvojnásobuji
Nechtěl jsem to psát příliš rychle a znovu toho litovat, ale prostě to vyřešilo spoustu velmi, velmi těžkých ladicích výzev, které byly dříve nevyřešené (umělou inteligencí), a pak navrhlo nádhernou pixelovou hru pro Gameboy s úrovní detailů a kvality, která je zjevně za vším ostatním, co jsem kdy viděl.
V žádném případě není tento model špatný.
Myslím, že jste všichni traumatizováni z benchmaxxerů a přehnané kompenzace proti modelu, který je ve skutečnosti dobrý. Také si myslím, že podceňujete silné stránky gpt-oss (ale ano, můj poslední příspěvek byl uspěchaný)
Pořád ale nevím, jestli je to použitelné pro seriózní programování (o3 nebylo), ale zdá se, že ano? Stejně spolehlivý kódovací model jako Opus, ale chytřejší než o3, by zcela změnil můj pracovní postup. Opus však nepotřebuje myšlení, aby byl skvělý, takže by to mohlo hrát v jeho prospěch.
Za to, co to stojí, jsem opravdu použil pouze 3 modely:
- Opus 4.1 pro kódování
- Gemini 2.5 velmi zřídka pro kódování, když Opus selže
- O3 pro vše kromě kódování
31,97K
ne, všichni se mýlíte, GPT-5 je skok
Na 100 % se zde zdvojnásobuji
Nechtěl jsem to psát příliš rychle a znovu toho litovat, ale prostě to vyřešilo spoustu velmi, velmi těžkých ladicích výzev, které byly dříve nevyřešené (umělou inteligencí), a pak navrhlo nádhernou pixelovou hru pro Gameboy s úrovní detailů a kvality, která je zjevně za vším ostatním, co jsem kdy viděl.
V žádném případě není tento model špatný.
Myslím, že jste všichni traumatizováni z benchmaxxerů a přehnané kompenzace proti modelu, který je ve skutečnosti opravdu dobrý. Také si myslím, že podceňujete silné stránky gpt-oss (ale ano, můj poslední příspěvek byl uspěchaný)
Pořád ale nevím, jestli je to použitelné pro seriózní programování (4o, o3 určitě ne), ale zdá se mi, že ano? Stejně spolehlivý kódovací model jako Opus, ale chytřejší než o3, by zcela změnil můj pracovní postup. Opus však nepotřebuje myšlení, aby byl skvělý, takže by to mohlo hrát v jeho prospěch.
Za to, co to stojí, jsem opravdu použil pouze 3 modely:
- Opus 4.1 pro kódování
- Gemini 2.5 velmi zřídka pro kódování, když Opus selže
- O3 pro vše kromě kódování
480
"Prevence smrti je vysoce neetická"

João Pedro de Magalhães6. 8. 06:41
"Je vysoce neetické zastavit stárnutí" - komentuje recenzent jednu z mých grantových žádostí.
Grant se zaměřil na buněčné omlazení, žádná zmínka o léčbě stárnutí, ale ukazuje, že máme před sebou ještě dlouhou cestu, abychom přesvědčili i kolegy vědce, že léčba stárnutí je žádoucí.
16,08K
Prevence smrti je vysoce neetická

João Pedro de Magalhães6. 8. 06:41
"Je vysoce neetické zastavit stárnutí" - komentuje recenzent jednu z mých grantových žádostí.
Grant se zaměřil na buněčné omlazení, žádná zmínka o léčbě stárnutí, ale ukazuje, že máme před sebou ještě dlouhou cestu, abychom přesvědčili i kolegy vědce, že léčba stárnutí je žádoucí.
250
Takže gpt-oss 120B neumí vyrobit správnou němčinu, ale opravuje složité chyby v Haskellu, které nedokázal identifikovat ani Opus?
Jak se to stane?
Jsem z toho všeho opravdu zmatený

Björn Plüster6. 8. 04:45
gpt-oss 120B je velmi očividně neschopný vytvořit lingvisticky správný německý text. 🧵
252
Můj počáteční dojem z modelu OSS společnosti OpenAI je v souladu s tím, co inzerovali. Zdá se mi to bližší o3 než jiným otevřeným modelům, až na to, že je mnohem rychlejší a levnější. Někteří poskytovatelé to nabízejí za 3000 tokenů/s, což je šílené. Je rozhodně chytřejší než Kimi K2, R1 a Qwen 3. Trochu jsem testoval všechny modely a získal jsem velmi přesvědčivé výsledky ve prospěch OpenAI-OSS-120b.
Bohužel je tu jedna věc, kterou tyhle modelky zatím neumějí - moje zatracená práce. Takže, doufám, že se budete bavit. Vrátím se k ladění superponovaného vyhodnocení 😭 λ-kalkulu, uvidíme se
410,39K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější