Die Arena-Hard-Bewertungsumgebung ist jetzt mit Atropos zusammengeführt - genießen Sie skalierbare, flexible und moderne Bewertungen mit dem Arena-Hard-Benchmark von @lmsysorg, der hervorragend darin ist, eine Vielzahl von Fähigkeiten in Modellen zu bestimmen. Bereit, eine RL-Umgebung zu sein, wenn Sie Ihr eigenes Trainingsset mitbringen :) Erfahren Sie mehr unter
6,8K