самое хитроумное устройство скептика ИИ — это бенчмарк потолка оценок производительность всегда кажется логарифмической на тестах с оценкой от 0 до 100% но когда мы смотрим на бенчмарки без потолка, мы видим совершенно другую кривую…
говоря об этом, мне следует запустить aidanbench
2,03K