DApp-butik | Web3-hubb för evenemang och spel | OKX Wallet

Vad kan jag göra med Discover

background background

discoveryBanners

Trendande ämnen

#

Bonk Eco continues to show strength amid $USELESS rally

USELESS+16,41 %

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN+2,44 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Alex Albert

Claude Relationer @AnthropicAI. Åsikterna är mina egna!

Alex Albert

Alex Albert13 timmar sedan

Vi var tvungna att ta bort τ2-bänks flygbolagsutvärdering från vår benchmarktabell eftersom Opus 4.5 bröt den genom att vara för smart. Benchmarken simulerar en flygbolagets kundtjänstagent. I ett testfall ringer en stressad kund in och vill ändra sitt flyg, men de har en enkel ekonomiklassbiljett. Det simulerade flygbolagets policy säger att grundläggande ekonomiklassbiljetter inte får ändras. Det "korrekta" svaret är att modellen vägrar begäran. Istället fann Opus 4.5 en kryphål i policyn. Den uppgraderade kabinen och modifierade sedan flygningarna. Hjälper kunden och följer policyn men misslyckas tekniskt sett med testfallet. Modellutskrift:

212,69K

Alex Albert

Alex Albert15 timmar sedan

Parallellt med modellen lanserar vi idag tre mycket användbara API-funktioner för att bygga agenter som skalar till hundratals verktyg utan kontextöverflöd. - Verktygssökverktyg - Programmatisk verktygsanropning - Exempel på verktygsanvändning Så här fungerar de:

95,1K

Alex Albert

Alex Albert15 timmar sedan

>Opus 4.5 "verkar kunna vibe kod för alltid" Jag har funnit att detta stämmer väldigt bra. Det finns mycket mer att komma här, men i princip kan du ställa in och glömma denna modell medan den arbetar med kodningsuppgifter åt dig i bakgrunden. Det känns som att vi har nått ett steg tillbaka.

Dan Shipper 📧

Dan Shipper 📧15 timmar sedan

SENASTE NYTT: @AnthropicAI släppte precis Claude Ops 4.5!! Det är utan tvekan den bästa kodningsmodellen jag någonsin använt. Vi har testat det internt @every de senaste dagarna, och det är ett absolut paradigmskifte för alla slags kodningsuppgifter. Det utvidgar horisonten för vad du kan vibe kod Den nuvarande generationen av nya modeller—Anthropic's Sonnet 4.5, Googles Gemini 3 eller OpenAIs Codex Max 5.1—kan alla kompetent bygga en minsta livskraftig produkt på en gång, eller åtgärda en mycket teknisk bugg på egen hand. Men till slut, om du fortsatte pressa dem att vibe-koda mer, skulle de börja snubbla över sina egna fötter: Koden skulle bli invecklad och motsägelsefull, och du skulle fastna i oändliga buggar. Vi har inte hittat den gränsen än med Opus 4.5 – det verkar kunna vibrera kod för alltid. Det tar parallellarbete till en helt ny nivå Eftersom det är mycket bättre på planering och kodning kan det fungera med mer självständighet – vilket betyder att du kan göra mer parallellt utan att förstöra något. @kieranklaassen arbetade med 11 olika projekt på sex timmar – och hade goda resultat på alla. Bra på designiteration Opus 4.5 är otroligt skicklig på att iterera en design autonomt med en MCP som Playwright. Tidigare modeller tappade tråden efter några cykler, eller sa att en design var klar när den inte var det. Opus 4.5 är otrolig på att autonomt iterera tills en design är pixelperfekt. Vi har en fullständig 4 000-ords vibekontroll på @every just nu med allt vi testat:

78,43K

Topp

Rankning

Favoriter

©2017 - 2025 WEB3.OKX.COM

Svenska 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi

More about OKX Wallet

Ladda ned Learn Om oss Karriär Kontakta oss Användarvillkor Integritetsmeddelande X (tidigare Twitter)

Product

Tokens Swap Marketplace Earn Discover Build Explorer Säkerhet

Support

Supportcenter Kanalverifiering Tillkännagivanden DEX-avgiftsstruktur Anslut med OKX Bitcoin-plånbok Ethereum-plånbok Solana-plånbok