Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Condurre la ricerca presso @PrimeIntellect
La prossima generazione di startup con valutazione oltre i 10 miliardi sarà costruita scalando l'addestramento in un ambiente RL interno.
Viviamo in un'abbondanza di capacità eppure abbiamo solo due principali prodotti AI, chatgpt e coding agent, e questo mi frustra profondamente.
L'attuale catena di approvvigionamento dell'intelligenza artificiale è strutturalmente rotta, con un solo fornitore di hardware, un paio di grandi attori AI che possiedono tutto il raffinamento dell'intelligenza, gli sviluppatori sono lasciati con accesso API con a malapena alcun controllo.
Come se l'era di Internet fosse stata costruita con Intel che vende CPU a 4 grandi cloud che possiedono l'intera infrastruttura e stack software con segreti e NDA ovunque, dando a WordPress come kit di sviluppo per le startup.
Perché Perplexity non ha inventato la ricerca profonda? Non potevano semplicemente perché è addestrato con RL.
La mia previsione per i prossimi anni:
RL diventerà il toolkit più potente per costruire prodotti AI nelle startup. Vedremo centinaia di storie di successo come Cursor e Lovable. Gli utenti finali ne trarranno il massimo beneficio.
I grandi laboratori evolveranno verso aziende di prodotto, OAI si concentrerà sul mercato dei consumatori, Anthropic sul coding agent, DeepMind integrerà l'AI in tutte le attività di Google, Meta e XAI si contenderanno i social media.
Vedremo l'emergere di un ecosistema di startup di infrastruttura AI, che venderanno calcolo, addestramento di modelli fondamentali, cureranno dati, costruiranno ambienti RL, offriranno inferenze e addestramenti economici, alimentati dalla scienza aperta e dal software open source.
@PrimeIntellect sta pionierando questo ecosistema e la visione dell'AGI open source, l'hub dell'ambiente RL è uno dei primi pezzi chiave.

Prime Intellect9 ore fa
Introduzione all'Environments Hub
Gli ambienti RL sono il principale collo di bottiglia per la prossima ondata di progressi nell'IA, ma i grandi laboratori li stanno bloccando
Abbiamo costruito una piattaforma comunitaria per il crowdsourcing di ambienti aperti, affinché chiunque possa contribuire all'AGI open-source
3,17K
samsja ha ripubblicato
14 Giorni di Distribuzione, Giorno 7!
Incontra Sami Jaghouar (@samsja19) di @PrimeIntellect:
Sami guida la loro ricerca e si concentra sul pre-addestramento decentralizzato e sull'apprendimento per rinforzo distribuito come parte del suo lavoro.
Sami terrà una lezione su come appare l'implementazione dell'addestramento decentralizzato presso Prime.

7,89K
L'ultimo hackathon in modalità GPU è stato il miglior hackathon a cui abbia mai partecipato di persona, non vedo l'ora di partecipare al prossimo.

Mark Saroufim23 ago, 05:09
È di nuovo tempo per la nostra ultima (ora annuale) straordinaria celebrazione dell'anno. GPU MODE si incontra di persona di nuovo nel centro di San Francisco venerdì 24 ottobre dalle 10:00 alle 22:00 per hackare tutto il giorno.

3,61K
Sembra che altre persone convergano nell'utilizzare vllm v1 logprob per il rapporto di importanza per risolvere il problema di stabilità.
Penso di avere il PTSD da questo tipo di crash di RL.

Zichen Liu22 ago, 23:35
Con poche righe di codice, la soluzione suggerita da Feng (@fengyao1909)—applicare il campionamento di importanza sulla politica di comportamento—ha risolto l'instabilità dell'addestramento nel mio caso (oat). Credo che il risultato possa generalizzarsi anche ad altri framework di RL. Ottimo lavoro, Feng!

6,73K
Sto assumendo un ingegnere di ricerca presso @PrimeIntellect
Stiamo costruendo laboratori AGI open source e stiamo cercando talenti grezzi. Non ci interessa il tuo precedente titolo di lavoro.
Tutti nel team di ricerca sono full stack, costruiamo infrastrutture e ci occupiamo anche di dati. Se hai una passione per i sistemi, l'apprendimento per rinforzo, i dati o le leggi di scaling, ti verrà presentata una tonnellata di sfide da risolvere.
83,23K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari