Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
3 mejores prácticas para escribir evaluaciones de IA:
1. Equilibrar velocidad y rigor
Comienza con una docena de casos de prueba y itera a partir de ahí. No construyas cientos cuando aún estás haciendo cambios importantes en los prompts. Identifica y corrige los mayores modos de fallo, luego expande la cobertura.
2. Obsérvate sobre los criterios de evaluación y las etiquetas manuales
Tus criterios de evaluación y el conjunto de datos dorado son la base de todo lo demás. No hay forma de evitar hacer este trabajo manual en hojas de cálculo: obsérvate en hacer que tus etiquetas humanas sean buenas.
3. No escales el juez LLM prematuramente
Apunta a un ~80% de alineación entre tu juez LLM y los etiquetadores humanos antes de escalar. Audita los resultados regularmente: no asumas que siempre está correcto.
Mañana, compartiré una guía para principiantes sobre evaluaciones de IA que explica un ejemplo paso a paso que cualquiera puede seguir.
📌 Regístrate para recibirlo en tu bandeja de entrada:
(P.D. Así es como imagino que se ve un juez LLM)

4,74K
Parte superior
Clasificación
Favoritos