Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek щойно здійснила той тип оновлення, на який намагається мати кожна модель мислення.
Замість того, щоб виливати довгий ланцюжок думок і сподіватися, що це має сенс, DeepSeek Math V2 проводить повний аналіз власної логіки. Він створює доказ, атакує його, перевіряє атаку, перевіряє перевірку, латає недоліки і зациклюється, поки не може зламатися.
Ця єдина ідея повністю змінила його продуктивність.
Ось що призвело до такого рівня самоаналізу:
• Результати на рівні золота на IMO 2025
• Результати золотого рівня на CMO 2024
• 118/120 на Putnam 2024 — найвищий зафіксований бал
• Кращі результати, ніж GPT-5 Thinking та Gemini 2.5 Pro у найскладніших категоріях
Секрет не в масштабі.
Це архітектура навколо моделі:
— верифікатора, який шукає логічні прогалини
— мета-верифікатора, який ставить під сумнів верифікатора
— генератор доказів, обумовлений для уникнення слабкого міркування
— петля, яка змушує кожну частину системи ставати гострішою
Процес працює як млинка:
- Створити доведення
- Протестуйте
- Тестувати тестувальник
- Виправити логіку
-Повторити
Вони зосередилися на справжній проблемі математичного мислення: модель може знайти правильну відповідь з неправильних причин. Отже, DeepSeek навчила перевірювача, який оцінює міркування, а не результати....

Найкращі
Рейтинг
Вибране

