Итак, после того как я поиграл с этим большую часть дня, ни один из них не смог это сделать (ожидаемо), но GPT-5 через Codex много сдался и просто вылетал (пример ниже). Тем не менее, что в итоге сработало, так это то, что GPT-5 создал детальную спецификацию на основе статьи arxiv, а затем проверил код opus.
xjdr
xjdr10 авг., 00:50
"Как вы оцениваете новые модели?"
вам нужно знать, что вы делаете, чтобы направлять трафик, и мне пришлось создать тестовые стенды и критерии прохождения самостоятельно, но их объединенные возможности создали нечто, что соперничает с моей существующей версией. довольно впечатляющий начальный тест, если быть честным ...
23,87K