Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

DeepSeek щойно здійснила той тип оновлення, на який намагається мати кожна модель мислення. Замість того, щоб виливати довгий ланцюжок думок і сподіватися, що це має сенс, DeepSeek Math V2 проводить повний аналіз власної логіки. Він створює доказ, атакує його, перевіряє атаку, перевіряє перевірку, латає недоліки і зациклюється, поки не може зламатися. Ця єдина ідея повністю змінила його продуктивність. Ось що призвело до такого рівня самоаналізу: • Результати на рівні золота на IMO 2025 • Результати золотого рівня на CMO 2024 • 118/120 на Putnam 2024 — найвищий зафіксований бал • Кращі результати, ніж GPT-5 Thinking та Gemini 2.5 Pro у найскладніших категоріях Секрет не в масштабі. Це архітектура навколо моделі: — верифікатора, який шукає логічні прогалини — мета-верифікатора, який ставить під сумнів верифікатора — генератор доказів, обумовлений для уникнення слабкого міркування — петля, яка змушує кожну частину системи ставати гострішою Процес працює як млинка: - Створити доведення - Протестуйте - Тестувати тестувальник - Виправити логіку -Повторити Вони зосередилися на справжній проблемі математичного мислення: модель може знайти правильну відповідь з неправильних причин. Отже, DeepSeek навчила перевірювача, який оцінює міркування, а не результати....

Найкращі

Рейтинг

Вибране