Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

jack morris
исследования @cornell @meta // языковые модели, теория информации, наука об искусственном интеллекте
ок, нужна помощь! пытался дообучить GPT-OSS на выходных. он работает примерно 100 шагов, а затем выдает ошибку CUDA out-of-memory
мое предположение, что время от времени все токены направляются к одному эксперту. тогда обучение срывается.
есть ли простое решение? никогда не дообучал MoE раньше.
11,71K
какую модель нам следует сделать следующей?

jack morris9 авг., 03:21
интересно, какие данные использовались для обучения новых моделей gpt-oss от OpenAI? Я тоже был в этом заинтересован.
Поэтому я сгенерировал 10 миллионов примеров из gpt-oss-20b, провел некоторый анализ, и результаты были... довольно странными.
Время для глубокого погружения 🧵

21,29K
кратчайшее объяснение GPT-5: это именно то, что предсказывали законы масштабирования!
модель лучше, отдача уменьшается, и, к сожалению, абсолютные улучшения общего интеллекта будут только уменьшаться.
хорошая новость в том, что еще так много нужно сделать. личность, рассуждение, память и креативность все еще остаются открытыми проблемами.
26,51K
мир венчурного капитала предоставляет много ценности, но иногда кажется, что они просто сжигают деньги.
несколько стартапов, которые я знаю, собрали около 100 миллионов долларов три года назад для разработки ИИ, создали программное обеспечение, которым никто никогда не пользовался, и теперь все они работают в других местах над несвязанными вещами.
Куда делись все эти деньги?
18,42K
Я провел последние пару часов, общаясь с gpt-oss, и могу с уверенностью сказать, что это не похоже ни на одну модель, которую я тестировал.
Секунду оно кодирует для меня на профессиональном уровне, а следующую — выдумывает базовые факты и цепляется за них, несмотря на то, что я говорю.
Что-то очень странное происходит.
32,3K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные