Nowe badania z Anthropic i Thinking Machines Firmy zajmujące się AI używają specyfikacji modeli do definiowania pożądanych zachowań podczas treningu. Czy specyfikacje modeli jasno wyrażają, co chcemy, aby modele robiły? A czy różne modele na granicy mają różne osobowości? Wygenerowaliśmy tysiące scenariuszy, aby się dowiedzieć. 🧵