Vi kjører en ny runde av Anthropic Fellows-programmet. Hvis du er en ingeniør eller forsker med sterk koding eller teknisk bakgrunn, kan du søke om å motta finansiering, databehandling og mentorskap fra Anthropic, fra og med oktober. Det vil være rundt 32 steder.
Programmet vil pågå i ~to måneder, med muligheter for å forlenge med ytterligere fire basert på fremgang og ytelse. Søk innen 17. -OSS: -STORBRITANNIA: -Canada:
Stipendiater vil ha tilgang til: - Et ukentlig stipend på $2,100; - ~$15k per måned for data- og forskningskostnader; - 1:1 mentorskap fra en antropisk forsker; - Delte arbeidsområder i Bay Area eller London.
Stipendiater vil samarbeide med antropiske forskere innen områder som: - Kontradiktorisk robusthet og AI-kontroll; - Skalerbart tilsyn; - Modellorganismer med feiljustering; - Mekanistisk tolkning.
2) Arbeid som demonstrerer «subliminal læring» – at språkmodeller kan overføre sine trekk til andre modeller, selv i det som ser ut til å være meningsløse data:
Anthropic
Anthropic23. juli 2025
I en felles artikkel med @OwainEvans_UK som en del av Anthropic Fellows Program, studerer vi et overraskende fenomen: subliminal læring. Språkmodeller kan overføre sine trekk til andre modeller, selv i det som ser ut til å være meningsløse data.
3) Finne tilfeller av omvendt skalering i testtidsberegning – der mer og mer resonnement fører til dårligere og dårligere resultater:
Aryo Pradipta Gema
Aryo Pradipta Gema22. juli 2025
Ny antropisk forskning: "Invers skalering i testtidsberegning" Vi fant tilfeller der lengre resonnement fører til lavere nøyaktighet. Våre funn tyder på at naiv skalering av testtidsberegning utilsiktet kan forsterke problematiske resonneringsmønstre. 🧵
Vi tar gjerne imot søknader fra stipendiater tilknyttet andre organisasjoner (f.eks. kan du delta mens du er i et ph.d.-program). Og til slutt, et stipend vil være til nytte for deg for roller hos Anthropic: vi planlegger å gi noen heltidstilbud til fullførte stipendiater.
276,65K