La începutul acestei veri, OpenAI și Anthropic au convenit să încerce unele dintre cele mai bune teste existente pentru nealinierea modelelor celuilalt. După ce am discutat rezultatele noastre în privat, acum le împărtășim lumii. 🧵
79,44K