Anthropic запускає команду «психіатрії штучного інтелекту» для вивчення особистостей, мотивацій, самосвідомості та моторошної поведінки своїх 🔨простих інструментів🔨 1) ДЯКУЮ @AnthropicAI! Це важлива робота! Потрібно в 100 разів більше 2) Подумайте, наскільки все це науково-фантастичне
Jack Lindsey
Jack Lindsey24 лип. 2025 р.
Ми запускаємо команду «Психіатрія зі штучним інтелектом» у рамках зусиль з інтерпретації в Anthropic!  Ми будемо досліджувати такі феномени, як модельні персони, мотивації та ситуаційна обізнаність, а також те, як вони призводять до моторошної/непристойної поведінки. Ми приймаємо на роботу - приєднуйтесь до нас!
13,2K