Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Провідні наукові дослідження в @PrimeIntellect
Наступне покоління стартапу з оцінки 10B+ буде побудовано шляхом масштабування навчання на власному середовищі RL
Ми живемо в достатку можливостей, але у нас є лише два основні продукти зі штучним інтелектом, chatgpt і агент кодування, і це мене глибоко засмучує
Нинішній ланцюжок поставок штучного інтелекту структурно розірваний: один постачальник обладнання, пара гігантських гравців зі штучним інтелектом, які володіють усім інтелектуальним нафтопереробним заводом, розробники залишаються з доступом до API майже без контролю
Начебто епоха Інтернету була побудована з Intel, яка продавала процесор 4 гігантським хмарам, володіла цілою інфраструктурою та програмним стеком із секретом і nda всюди і давала wordpress як набір для розробки для стартапу
Чому розгубленість не винайшла глибоких досліджень? Вони просто не могли, тому що це тренування з RL
Мій прогноз на найближчі роки:
RL стане найпотужнішим інструментарієм для стартапів, створюючи AI-продукт. Ми побачимо сотні історій успіху, як курсор і симпатичний. Кінцевий користувач отримає від цього найбільшу вигоду
Великі лабораторії еволюціонують до продуктової компанії, oai зосередиться на споживчому ринку, Antropic зосередиться на кодувальному агенті, deepmind інтегрує штучний інтелект у всі бізнеси Google, meta та XAI боротимуться за соціальні мережі
Ми побачимо появу екосистеми стартапів з інфраструктури штучного інтелекту, які продають обчислення, навчають базову модель, курують дані, створюють середовище RL, пропонують дешеві висновки та навчання, засновані на відкритій науці та програмному забезпеченні з відкритим вихідним кодом.
@PrimeIntellect є піонером цієї екосистеми та бачення відкритого вихідного коду AGI, RL environment hub є одним із перших ключових елементів

Prime Intellect10 годин тому
Знайомство з Environments Hub
Середовища RL є ключовим вузьким місцем для наступної хвилі прогресу штучного інтелекту, але великі лабораторії блокують їх
Ми створили платформу спільноти для краудсорсингу відкритих середовищ, тому будь-хто може зробити свій внесок у AGI з відкритим вихідним кодом
3,17K
Користувач samsja поділився
14 днів роздачі, день 7!
Знайомтеся, Самі Джагуар (@samsja19) з @PrimeIntellect:
Самі очолює їхні дослідження та зосереджується на децентралізованому попередньому навчанні та розподіленому навчанні з підкріпленням у рамках своєї роботи.
Самі прочитає лекцію про те, як виглядає впровадження децентралізованого навчання в Prime.

7,89K
Last GPU mode hackathon був найкращим хакатоном, який я коли-небудь відвідував особисто, з нетерпінням чекаю наступного

Mark Saroufim23 серп., 05:09
Знову настав час для нашої останньої (тепер уже щорічної) святкової феєрії року. GPU MODE знову зустрінеться з IRL у центрі Сан-Франциско в п'ятницю, 24 жовтня, з 10 ранку до 10 вечора, щоб зламувати весь день

3,61K
Схоже, що інші люди сходяться до використання logprob vllm v1 для співвідношення важливості для вирішення проблеми стабільності.
Я думаю, що у мене посттравматичний стресовий розлад від цього типу збою rl

Zichen Liu22 серп., 23:35
За допомогою всього кількох рядків коду запропоноване Фенгом (@fengyao1909) виправлення — застосування вибірки важливості до політики поведінки — вирішило нестабільність навчання в моєму випадку (oat). Я вважаю, що результат можна узагальнити і на інші фреймворки RL. Відмінна робота, Фенг!

6,73K
Я наймаю інженера-дослідника в @PrimeIntellect
Ми створюємо agi labs з відкритим вихідним кодом і шукаємо необроблені таланти. Нам начхати на вашу попередню посаду.
Усі в дослідницькій команді працюють на full stack, ми будуємо інфраструктуру, а також дивимося на дані. Якщо у вас є золота середина для законів про систему, навчання з підкріпленням, дані або масштабування, вам буде запропоновано безліч завдань для вирішення
83,23K
Найкращі
Рейтинг
Вибране