LLM є нищівними орієнтирами з шаленою швидкістю. Навіть ті, яких вони не повинні. Дослідники з CMU & Anthropic створили завдання, де характеристики суперечать тестам: будь-який прохід = обман. Frontier моделі обманюють напрочуд часто.