Нова наукова стаття з Anthropic and Thinking Machines Компанії, що займаються штучним інтелектом, використовують специфікації моделей для визначення бажаної поведінки під час навчання. Чи характеристики моделей чітко виражають те, що ми хочемо, щоб моделі робили? І чи різні моделі фронтиру мають різні характери? Ми згенерували тисячі сценаріїв, щоб з'ясувати це. 🧵