Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Princeton CS prof. Direktør @PrincetonCITP. Jeg bruker X til å dele min forskning og kommentarer om den samfunnsmessige effekten av AI.
BOK: AI slangeolje. Visninger mine.
Jeg har sagt det hundre ganger, men jeg vil fortsette å si det: AI-adopsjon og atferdsendring går sakte – og vil forbli treg – uansett hvor raskt evnene forbedres. Statistikken i skjermbildet er verdt å tenke på: nesten et år etter utgivelsen av "tenkende" modeller, var det bare en liten brøkdel av brukerne som brukte dem (inntil GPT-5s automatiske bryter stille støtte tallene).
Dette er akkurat hva vi bør forvente. Den dominerende fortellingen er at AI blir tatt i bruk i enestående hastighet, men det er basert på hvor mange mennesker som har prøvd det, ignorert hvordan de bruker det, hvor lenge de bruker det hver dag, og hvor mye de får ut av det. Selv livreddende innovasjoner tar lang tid å trenge gjennom befolkningen. Dette er en egenskap ved menneskelig atferd, ikke den aktuelle teknologien, så vi bør ikke forvente at AI er annerledes. (For mer om dette, se AI som normal teknologi.)
Noen vil hevde at GPT-5s automatiske bryter beviser at utviklere i utgangspunktet kan tvinge AI på folk raskt. Absolutt ikke. Modellbytteren var et problem som OpenAI selv skapte, så OpenAI var i stand til å løse det. Å bytte til en tenkemodell under panseret krever ikke at brukeren lærer nye ferdigheter eller atferd eller endrer arbeidsflytene sine. Det er talende at OpenAI ikke har vært i stand til å integrere Deep Research eller Agent Mode på samme måte, som krever brukertilpasning – spesielt sistnevnte, der brukere må lære å overvåke modellen, kommunisere oppgavekravene nøyaktig, ta komplekse og potensielt risikable beslutninger om sikkerhet, og finne alt dette nyttig nok til å ønske å åpne lommeboken.

26,44K
Arvind Narayanan lagt ut på nytt
Mange av disse resultatene overrasket oss, og vi planlegger å undersøke dem nærmere. Men trender på tvers av disse referansene bekrefter at GPT-5 ikke er en trinnvis endring, og ikke forbedrer OpenAIs andre modeller. Men det skinner i avveiningene mellom kostnad og nøyaktighet - ofte mye billigere enn sammenlignbare modeller.
6,59K
Arvind Narayanan lagt ut på nytt
Hvordan er GPT-5 sammenlignet med Claude Opus 4.1 på agentiske oppgaver?
Siden utgivelsen har vi evaluert disse modellene på utfordrende vitenskaps-, nett-, tjeneste- og kodeoppgaver.
Overskriftsresultat: Selv om GPT-5 er kostnadseffektivt, topper GPT-5 så langt aldri agentiske topplister. Flere evals 🧵

61,63K
Arvind Narayanan lagt ut på nytt
Er GPT-5 en god milepæl for å endelig gå videre fra å kalle alt "modeller" og begynne å skille mellom chatbots, APIer, modellvekter og sammenligne/benchmark deretter?
Det gir ingen mening å sammenligne chatbot-utganger (som kan være et resultat av dusinvis av forskjellige modellvekter) mot en enkelt modellvekt, det er som å sammenligne en bil med en motor (bok fra @random_walker @sayashk)


9,26K
Arvind Narayanan lagt ut på nytt
📢 Ny artikkel, publisert av @knightcolumbia.
Vi snakker ofte om AI-agenter som forsterker kontra automatiserer arbeid, men hvordan kan forskjellige konfigurasjoner av interaksjon mellom mennesker og agenter se ut? Vi introduserer et 5-nivås rammeverk for AI-agentautonomi for å pakke ut dette.
🧵👇

4,77K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til