Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Хотя Kimi k2 от Moonshot AI является ведущей моделью с открытыми весами без рассуждений в Индексе Искусственного Анализа, она выдает ~3 раза больше токенов, чем другие модели без рассуждений, размывая границы между рассуждением и нерсуждением.
Kimi k2 — это крупнейшая модель с открытыми весами на сегодняшний день — 1 триллион параметров с 32 миллиардами активных (это требует огромных 1 ТБ памяти в нативном FP8 для хранения весов). Мы имеем k2 на 57 месте в Индексе Искусственного Анализа, что является впечатляющим результатом, который ставит его выше моделей, таких как GPT-4.1 и DeepSeek V3, но ниже ведущих моделей рассуждений.
До сих пор существовало четкое различие между моделями рассуждений и моделями без рассуждений в наших оценках — определяемое не только тем, использует ли модель теги <reasoning>, но прежде всего использованием токенов. Медианное количество токенов, использованных для ответов на все оценки в Индексе Искусственного Анализа, примерно в 10 раз выше для моделей рассуждений, чем для моделей без рассуждений.
@Kimi_Moonshot's Kimi k2 использует ~3 раза больше токенов, чем медианная модель без рассуждений. Его использование токенов всего на 30% ниже, чем у Claude 4 Sonnet и Opus, когда они работают в режиме максимального бюджета расширенного мышления, и почти в три раза превышает использование токенов как у Claude 4 Sonnet, так и у Opus с отключенными рассуждениями.
Поэтому мы рекомендуем сравнивать Kimi k2 с Claude 4 Sonnet и Opus в их режимах максимального бюджета расширенного мышления, а не с оценками без рассуждений для моделей Claude 4.
Kimi k2 доступен на первом API @Kimi_Moonshot, а также на @FireworksAI_HQ, @togethercompute, @novita_labs и @parasail_io.
Смотрите ниже и на Искусственном Анализе для дальнейшего анализа 👇



60,49K
Топ
Рейтинг
Избранное