Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
Дослідницькі @allen_ai, міркування, відкриті моделі, RL(VR/HF)...
Звертайтеся через електронну пошту.
Пише @interconnectsai,
Написав «Книгу РЛХФ»,
Гірський бігун.
Я глибоко переконаний, що, хоча я розумію виклики, які вони відчувають, щоб керувати цим, це неправильне рішення. Те, чим є Arxiv на практиці, і те, чим він є насправді, сильно відрізняється.
На практиці вже існують правила модерації, але вони настільки мінімально дотримуються (через заболоченість), що їх фактично немає. Подивіться на такі речі, як Шеффер, Райлан. "Попереднє тренування на тестовому наборі – це все, що вам потрібно." Препринт arXiv arXiv:2309.08632 (2023). Ще багато випадків. Модерація Arxiv – це вже непередбачуваний чорний ящик, який заважає поширенню досліджень та передбачуваності наукової екосистеми.
Важливо зазначити, що Arxiv має політику, яка робить це, студентські проекти, можливо, книгу RLHF та інші часто розміщені речі «забороненими».
По суті, Arxiv повинен рухатися в іншому напрямку. Будьте платформою, де всі приймають БУДЬ-ЯКІ дослідження CS, і з'ясуйте, чи добре це пізніше.
Це схоже на ранні стадії повільної смерті Arxiv. Де через 2-3 роки скажуть те ж саме про «технічні» дослідження, а потім там вимагатимуть рецензування. Все це лише затримає публікацію досліджень, тому що рецензування потребує часу. У той же час експертна оцінка повністю перебудовується в епоху штучного інтелекту, і на її виправлення піде ще більше часу.
Експертна оцінка буде перероблена як штучний інтелект спочатку під наглядом людини. В даний час вважається, що це все Людина. Через 20 років це буде зовсім інший процес.
Після того, як Arxiv введе вимогу рецензування технічної роботи, це буде повільна смерть платформи. Вийде конкурент. Почався слизький шлях, і я радий проконсультуватися з командою щодо нього, оскільки це здається компромісом «програш-програш».
Наприклад, з цим я ніколи не зможу опублікувати свою книгу RLHF у форматі PDF на Arxiv, хоча вона була надзвичайно затребувана і, швидше за все, є дуже добре читаною PDF (більше, ніж більша частина моєї дослідницької роботи).
Збережіть arxiv за замовчуванням. Ми не хочемо, щоб цим керувала комерційна компанія. Розміщення та відкритий доступ до досліджень – це фундаментальна перемога людства. З'ясування того, як курувати це, є новою проблемою для епохи штучного інтелекту, будь ласка, не залишайте це нашим дещо зламаним рецензійним установам. Зробіть це чимось новим, що є рідним для штучного інтелекту. Орієнтуйтеся в майбутнє.
Оновіть політику Arxiv, щоб вона відображала реальність, а не вислизаючу мету, яку, швидше за все, буде неможливо досягти.

Thomas G. Dietterich31 жовт. 2025 р.
Розділ «Інформатика» @arxiv тепер вимагає попереднього рецензування для оглядів літератури та позиційних документів. Подробиці в новій публікації блогу
171
Я переконаний, що спробуємо це якнайшвидше, ми всі повинні спробувати fp16, подивіться на цього сюжетного чоловіка. FP16 схожий на ідеальний у зменшенні помилок.
«Саме тому перехід на FP16 є фундаментальним рішенням. Завдяки 10 бітам мантісси FP16 забезпечує у 8 разів більшу точність (2^10 значень проти 2^7 значень), ніж BF16. Ця вища точність означає, що виходи механізмів навчання та виведення набагато частіше будуть чисельно ідентичними. Підвищена точність створює буфер, який поглинає незначні відмінності в реалізації між двома двигунами, запобігаючи накопиченню помилок округлення та викликаючи розбіжності в політиках.
Для тонкої настройки RL динамічний діапазон ваг і активацій моделі вже встановлений під час передтренувальної підготовки. Тому екстремальна дальність BF16 менш критична, тоді як точність, якою вона жертвує, стає домінуючим недоліком. Повертаючись до FP16, ми обмінюємо непотрібний діапазон BF16 на критичну точність, ефективно скорочуючи розрив між навчанням і висновками без будь-якого складного алгоритмічного або інженерного обхідного шляху».

51
Найкращі
Рейтинг
Вибране


