Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Aufbau von LMArena.
Black-Box-Statistiken, Modellbewertung.
@Berkeley_EECS Ph.D., ehemaliger studentischer Forscher @GoogleDeepMind und @stanford_ee Alumnus.
Dieses Update ist verdammt riesig. Es ist eines der größten Updates für LMArena in diesem Jahr!
Code Arena ist unsere nächste Generation von Programmierbewertungen, beginnend mit Aufgaben zur Webentwicklung.
Hier kannst du Modelle verwenden, um interaktive Websites zu erstellen und sie mit deinen Freunden zu teilen. Die Links sind persistent, sodass du z.B. ein Spiel erstellen und es spielen kannst, wann immer du willst.
Hier sieh dir zwei Modelle an -- @claudeai Haiku und @grok-Code-Fast -- die gegeneinander antreten, um eine Galaxie zu bauen. In diesem Fall mochte ich den "Star-Wars"-Effekt von Grok!

lmarena.ai13. Nov., 01:48
🚀 Einführung von Code Arena: die nächste Generation von Live-Coding-Evaluierungen für fortschrittliche KI-Modelle. Entwickelt, um zu testen, wie Modelle planen, strukturieren, debuggen und Schritt für Schritt echte Webanwendungen erstellen.
Teste Claude, GPT-5, GLM-4.6 und Gemini heute in Code Arena!
37,05K
🏆NEUE LMARENA LEITERLISTEN🏆
🤓Experten
💻 Software- & IT-Dienstleistungen
✍️ Schreiben, Literatur & Sprache
🔬 Lebens-, Physik- & Sozialwissenschaften
🎭 Unterhaltung, Sport & Medien
📈 Wirtschaft, Management & Finanzoperationen
🧮 Mathematik
⚖️ Recht & Regierung
🩺 Medizin & Gesundheitswesen
Bewertungen des wirtschaftlichen Nutzens von KI (wie GDPval) sind immer relevanter, aber teuer zu sammeln. Wir haben mit der LMArena-Community von Millionen monatlicher Mitwirkender zusammengearbeitet, um berufliche und Expertendaten organisch zu beschaffen und das Skalierbarkeitsproblem zu lösen.
>5 % der LMArena-Nutzer sind Experten, und ein großer Teil der LMArena-Anfragen stammt aus wirtschaftlich wertvollen Branchen: SWE, Studenten/Forscher, Vermarkter/Designer, Ärzte, Anwälte und mehr. Dies ermöglicht es uns, Online-Leiterlisten in diesen Kategorien zu erstellen, die täglich auf frischem Feedback basieren. Es spricht für die Kraft des realen Feedbacksystems, das wir bei @arena geschaffen haben!


lmarena.ai6. Nov., 03:26
🚀 Einführung von Arena Expert: ein neues LMArena-Bewertungsframework zur Identifizierung der schwierigsten, anspruchsvollsten Eingaben von echten Nutzern, das eine neue Experten-Rangliste antreibt.
Wir führen auch Berufskategorien ein, die acht neue Ranglisten zugrunde liegen:
💻 Software- & IT-Dienstleistungen
✍️ Schreiben, Literatur & Sprache
🔬 Lebens-, Physik- & Sozialwissenschaften
🎭 Unterhaltung, Sport & Medien
📈 Geschäft, Management & Finanzoperationen
🧮 Mathematik
⚖️ Recht & Regierung
🩺 Medizin & Gesundheitswesen
Erforschen Sie, wie Modelle in verschiedenen Bereichen abschneiden in diesem Thread 🧵 👇

12,56K
Das LMArena-Büro ist heute voller Leben. Die Atmosphäre ist superlinear. Wir beeinflussen uns konstruktiv, indem wir uns ständig gegenseitig anspornen, zu lernen und unsere vermeintlichen Grenzen zu überschreiten.
Die wichtigste Eigenschaft, die wir bei der Einstellung suchen, ist "Exzellenz." Jeden Tag Arbeit zu leisten, die den höchsten technischen Standards in Bezug auf Handwerkskunst, Leistung und Zuverlässigkeit entspricht. Es gibt auch andere Faktoren, aber bei Exzellenz darf man niemals Kompromisse eingehen. Infolgedessen ist jeder in unserem Team ein tiefgehender Experte. Dies ist erforderlich, um qualitativ hochwertige Bewertungen mit Vertrauen zu erstellen.
Exzellenz zieht Exzellenz nach sich. Niemand möchte in einer Umgebung arbeiten, die von Nörglern geprägt ist – das killt den Schwung. Wir setzen ständig die Messlatte höher, und das führt zu einem Gefühl von Energie. Das ist selten.
Wenn du daran interessiert bist, in einer solchen Umgebung zu arbeiten, schick mir eine DM. Wir suchen immer nach Menschen, die die Messlatte noch ein Stück höher legen können.
6,58K
Top
Ranking
Favoriten

