Если я правильно понимаю, OpenAI осознала, что можно обойтись гораздо меньшим количеством слоев, если компенсировать это генерацией большего количества токенов ("мышление"). Это огромно, так как это снимает большую часть затрат с потребителя: каждый шаг генерации теперь дешевле в производстве, и они продают их больше.
36,26K