Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Führende Forschung an der @PrimeIntellect
Die nächste Generation von Startups mit einer Bewertung von über 10 Milliarden wird durch die Skalierung des Trainings in einer internen RL-Umgebung aufgebaut.
Wir leben in einem Überfluss an Fähigkeiten und dennoch haben wir nur zwei große KI-Produkte, ChatGPT und Coding-Agent, und das frustriert mich zutiefst.
Die aktuelle Lieferkette der künstlichen Intelligenz ist strukturell kaputt, mit einem Hardware-Anbieter und ein paar riesigen KI-Spielern, die alle Intelligenzraffinerien besitzen, während Entwickler mit API-Zugriff ohne nennenswerte Kontrolle zurückgelassen werden.
Als ob die Internet-Ära mit Intel, das CPUs an vier große Cloud-Anbieter verkauft, aufgebaut wurde, die die gesamte Infrastruktur und den Software-Stack mit Geheimnissen und NDAs überflutet haben und WordPress als Entwicklungskit an Startups geben.
Warum hat Perplexity nicht tiefgehende Forschung erfunden? Sie konnten einfach nicht, weil es mit RL trainiert wird.
Meine Vorhersage für die nächsten Jahre:
RL wird das leistungsstärkste Toolkit für den Aufbau von KI-Produkten in Startups werden. Wir werden Hunderte von Erfolgsgeschichten wie Cursor und Lovable sehen. Die Endbenutzer werden am meisten davon profitieren.
Große Labore werden sich in Produktunternehmen entwickeln, OAI wird sich auf den Verbrauchermarkt konzentrieren, Anthropic auf Coding-Agenten, DeepMind wird KI in alle Google-Geschäfte integrieren, Meta und XAI werden um soziale Medien kämpfen.
Wir werden das Entstehen eines Ökosystems von KI-Infrastruktur-Startups sehen, die Rechenleistung verkaufen, Grundmodelle trainieren, Daten kuratieren, RL-Umgebungen aufbauen und günstige Inferenz und Training anbieten, unterstützt von offener Wissenschaft und Open-Source-Software.
@PrimeIntellect ist Pionier in diesem Ökosystem, und die Vision eines Open-Source-AGI-RL-Umgebungs-Hubs ist eines der ersten Schlüsselstücke.

Prime IntellectVor 13 Stunden
Einführung des Environments Hub
RL-Umgebungen sind der entscheidende Engpass für die nächste Welle des AI-Fortschritts, aber große Labore schließen sie ein
Wir haben eine Community-Plattform zum Crowdsourcing offener Umgebungen geschaffen, damit jeder zu Open-Source-AGI beitragen kann.
3,23K
samsja erneut gepostet
14 Tage der Verteilung, Tag 7!
Lernen Sie Sami Jaghouar (@samsja19) von @PrimeIntellect kennen:
Sami leitet deren Forschung und konzentriert sich auf dezentrales Pretraining und verteiltes Reinforcement Learning im Rahmen seiner Arbeit.
Sami wird einen Vortrag darüber halten, wie die Implementierung von dezentralem Training bei Prime aussieht.

7,92K
Der letzte GPU-Modus-Hackathon war der beste Hackathon, an dem ich je persönlich teilgenommen habe. Ich freue mich auf den nächsten.

Mark Saroufim23. Aug., 05:09
Es ist wieder Zeit für unser letztes (jetzt jährliches) Feier-Extravaganza des Jahres. Der GPU MODE trifft sich wieder persönlich in der Innenstadt von San Francisco am Freitag, den 24. Oktober, von 10 Uhr bis 22 Uhr, um den ganzen Tag zu hacken.

3,66K
Es scheint, dass andere Leute dazu neigen, vllm v1 logprob für das Wichtigkeitsverhältnis zu verwenden, um das Stabilitätsproblem zu beheben.
Ich glaube, ich habe PTSD von dieser Art von RL-Absturz.

Zichen Liu22. Aug., 23:35
Mit nur wenigen Codezeilen hat Fengs (@fengyao1909) vorgeschlagene Lösung – die Anwendung von Importance Sampling auf die Verhaltenspolitik – die Trainingsinstabilität in meinem Fall (oat) behoben. Ich glaube, dass das Ergebnis auch auf andere RL-Frameworks übertragbar ist. Großartige Arbeit, Feng!

6,79K
Ich stelle einen Forschungsingenieur bei @PrimeIntellect ein.
Wir bauen ein Open-Source-AGI-Labor und suchen nach rohem Talent. Uns interessiert nicht, welchen Jobtitel du vorher hattest.
Jeder im Forschungsteam ist Full-Stack, wir bauen Infrastruktur und schauen uns auch Daten an. Wenn du eine Vorliebe für Systeme, Reinforcement Learning, Daten oder Skalierungsgesetze hast, wirst du mit einer Menge Herausforderungen konfrontiert.
83,28K
Top
Ranking
Favoriten