Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Budynek LMArena.
Statystyka czarnej skrzynki, ocena modelu.
@Berkeley_EECS doktorat, były student @GoogleDeepMind i absolwent @stanford_ee.
To wydanie jest piekielnie ogromne. To jedna z największych aktualizacji LMArena w tym roku!
Code Arena to nasza nowa generacja oceniania kodu, zaczynająca od zadań związanych z rozwojem stron internetowych.
Tutaj możesz używać modeli do budowania interaktywnych stron internetowych i dzielenia się nimi z przyjaciółmi. Linki są trwałe, więc możesz np. stworzyć grę i grać w nią, kiedy tylko chcesz.
Tutaj zobacz dwa modele -- @claudeai Haiku i @grok-Code-Fast -- rywalizujące w budowaniu galaktyki. W tym przypadku podobał mi się efekt "star-wars" Groka!

lmarena.ai13 lis, 01:48
🚀Przedstawiamy Code Arena: nową generację ocen kodowania na żywo dla modeli AI na czołowej linii. Stworzona, aby testować, jak modele planują, tworzą struktury, debugują i budują prawdziwe aplikacje internetowe krok po kroku.
Wypróbuj Claude, GPT-5, GLM-4.6 i Gemini w Code Arena już dziś!
37,04K
🏆NOWE RANKINGI LMARENA🏆
🤓Eksperci
💻 Usługi oprogramowania i IT
✍️ Pisanie, literatura i język
🔬 Nauki przyrodnicze, fizyczne i społeczne
🎭 Rozrywka, sport i media
📈 Biznes, zarządzanie i operacje finansowe
🧮 Matematyka
⚖️ Prawo i administracja
🩺 Medycyna i opieka zdrowotna
Oceny ekonomicznej użyteczności AI (takie jak GDPval) są coraz bardziej istotne, ale kosztowne do zebrania. Współpracowaliśmy z społecznością LMArena, liczącą miliony miesięcznych współpracowników, aby organicznie pozyskiwać dane dotyczące zawodów i ekspertów, rozwiązując problem skalowalności.
>5% użytkowników LMArena to eksperci, a ogromna część zapytań LMArena dotyczy branż o wartości ekonomicznej: SWE, studenci/badacze, marketerzy/projektanci, lekarze, prawnicy i inni. Pozwala nam to budować internetowe rankingi w tych kategoriach, oparte na świeżych opiniach każdego dnia. To świadczy o sile systemu opinii z rzeczywistego świata, który stworzyliśmy w @arena!


lmarena.ai6 lis, 03:26
🚀 Introducing Arena Expert: a new LMArena evaluation framework to identify the toughest, most expert-level prompts from real users, powering a new Expert leaderboard.
We also introduce Occupational Categories that underlie eight new leaderboards:
💻 Software & IT Services
✍️ Writing, Literature, & Language
🔬 Life, Physical, & Social Science
🎭 Entertainment, Sports, & Media
📈 Business, Management, & Financial Ops
🧮 Mathematical
⚖️ Legal & Government
🩺 Medicine & Healthcare
Explore how models perform across fields in thread 🧵 👇

12,56K
Biuro LMArena dzisiaj tętni życiem. Środowisko jest superlinowe. Konstruktywnie się wspieramy, zawsze popychając się nawzajem do nauki i przekraczania tego, co uważaliśmy za nasze ograniczenia.
Najważniejszą cechą, której szukamy podczas rekrutacji, jest "Doskonałość." Codzienne produkowanie pracy, która spełnia najwyższe standardy techniczne pod względem rzemiosła, wydajności i niezawodności. Są też inne czynniki, ale nigdy nie można iść na kompromis w kwestii doskonałości. W konsekwencji każdy w naszym zespole jest głębokim ekspertem. To jest wymagane, aby budować jakościowe oceny z pewnością.
Doskonałość rodzi doskonałość. Nikt nie chce pracować w środowisku z grupą "mokrych koców" -- to zabija impet. Nieustannie podnosimy poprzeczkę, a to prowadzi do poczucia energii. To rzadkość.
Jeśli jesteś zainteresowany pracą w takim środowisku, wyślij mi DM. Zawsze szukamy ludzi, którzy mogą podnieść poprzeczkę o jeden poziom wyżej.
6,58K
Najlepsze
Ranking
Ulubione

