Я очень уверен, что за последние несколько недель мы накопили крупнейший набор оценок на основе реальных задач для кодирующих агентов, таких как codex, claude code, cursor, amp, devin и т. д. с @askModuAI Нужно найти способ публичного бенчмаркинга.
400