Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Anastasios Nikolas Angelopoulos
Membangun LMArena.
Statistik kotak hitam, evaluasi model.
@Berkeley_EECS Ph.D., mantan peneliti mahasiswa @GoogleDeepMind dan alumni @stanford_ee.
Rilis ini sangat besar. Ini adalah salah satu pembaruan terbesar untuk LMArena tahun ini!
Code Arena adalah evaluasi pengkodean generasi berikutnya, dimulai dengan tugas pengembangan web.
Di sini Anda dapat menggunakan model untuk membangun situs web interaktif dan membagikannya dengan teman-teman Anda. Tautannya persisten, jadi Anda dapat misalnya membuat game dan memainkannya kapan pun Anda mau.
Di sini saksikan dua model - @claudeai Haiku dan @grok-Code-Fast - bersaing untuk membangun galaksi. Dalam hal ini, saya menyukai efek "perang bintang" dari Grok!

lmarena.ai13 Nov, 01.48
🚀Memperkenalkan Code Arena: eval pengkodean langsung generasi berikutnya untuk model AI perbatasan. Dibuat untuk menguji cara model merencanakan, merancah, men-debug, dan membangun aplikasi web nyata langkah demi langkah.
Coba Claude, GPT-5, GLM-4.6 dan Gemini di Code Arena hari ini!
37,04K
🏆PAPAN🏆 PERINGKAT LMARENA BARU
🤓Ahli
💻 Perangkat lunak & Layanan TI
✍️ Penulisan, Sastra, & Bahasa
🔬 Ilmu Kehidupan, Fisika, & Sosial
🎭 Hiburan, Olahraga, & Media
📈 Bisnis, Manajemen, & Operasi Keuangan
🧮 Matematika
⚖️ Hukum & Pemerintah
🩺 Kedokteran & Perawatan Kesehatan
Evaluasi utilitas ekonomi AI (seperti PDB) semakin relevan, tetapi mahal untuk dikumpulkan. Kami bekerja dengan komunitas LMArena yang terdiri dari jutaan kontributor bulanan untuk mendapatkan data pekerjaan dan ahli secara organik, memecahkan masalah skalabilitas.
>5% pengguna LMArena adalah ahli, dan sebagian besar perintah LMArena berada di industri yang bernilai ekonomi: SWE, siswa/peneliti, pemasar/desainer, dokter, pengacara, dan banyak lagi. Hal ini memungkinkan kami untuk membangun papan peringkat online dalam kategori ini yang dibangun berdasarkan umpan balik baru setiap hari. Ini berbicara tentang kekuatan sistem umpan balik dunia nyata yang telah kami buat di @arena!


lmarena.ai6 Nov, 03.26
🚀 Memperkenalkan Arena Expert: kerangka kerja evaluasi LMArena baru untuk mengidentifikasi perintah tingkat paling berat dan paling ahli dari pengguna sungguhan, mendukung papan peringkat Expert baru.
Kami juga memperkenalkan Kategori Pekerjaan yang mendasari delapan papan peringkat baru:
💻 Perangkat lunak & Layanan TI
✍️ Penulisan, Sastra, & Bahasa
🔬 Ilmu Kehidupan, Fisika, & Sosial
🎭 Hiburan, Olahraga, & Media
📈 Bisnis, Manajemen, & Operasi Keuangan
🧮 Matematika
⚖️ Hukum & Pemerintah
🩺 Kedokteran & Perawatan Kesehatan
Jelajahi performa model di seluruh bidang di thread 🧵 👇

12,55K
Kantor LMArena ramai hari ini. Lingkungannya superlinear. Kami secara konstruktif ikut campur, selalu mendorong satu sama lain untuk belajar dan melampaui apa yang kami pikir adalah batas kami.
Sifat #1 yang kami cari saat merekrut adalah "Keunggulan". Menghasilkan karya setiap hari yang memenuhi standar teknis tertinggi dalam hal pengerjaan, kinerja, dan keandalan. Ada faktor lain juga, tetapi jangan pernah berkompromi pada keunggulan. Akibatnya, semua orang di tim kami adalah ahli yang mendalam. Hal ini diperlukan untuk membangun evaluasi kualitas dengan percaya diri.
Keunggulan melahirkan keunggulan. Tidak ada yang ingin bekerja di lingkungan dengan sekelompok selimut basah – itu membunuh momentum. Kami terus-menerus meningkatkan standar, dan inilah yang mengarah pada perasaan energi. Itu jarang.
Jika Anda tertarik untuk bekerja di lingkungan seperti ini, kirimkan DM kepada saya. Kami selalu mencari orang yang dapat meningkatkan standar satu tingkat lebih tinggi.
6,58K
Teratas
Peringkat
Favorit

