Bardzo się cieszę, że ten pilot się odbył i mam nadzieję zobaczyć więcej takich rzeczy.
Sam Bowman
Sam Bowman28 sie 2025
Na początku tego lata OpenAI i Anthropic zgodziły się przetestować niektóre z naszych najlepszych istniejących testów na niedopasowanie na modelach drugiej strony. Po omówieniu naszych wyników prywatnie, teraz dzielimy się nimi ze światem. 🧵
1,33K