Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nueva publicación de blog sobre la asimetría de la verificación y la "ley del verificador":
La asimetría de verificación, la idea de que algunas tareas son mucho más fáciles de verificar que de resolver, se está convirtiendo en una idea importante a medida que tenemos RL que finalmente funciona en general.
Grandes ejemplos de asimetría de verificación son cosas como los rompecabezas de sudoku, escribir el código para un sitio web como Instagram y los problemas de BrowseComp (se necesitan ~ 100 sitios web para encontrar la respuesta, pero es fácil de verificar una vez que tiene la respuesta).
Otras tareas tienen una verificación casi simétrica, como sumar dos números de 900 dígitos o algunos scripts de procesamiento de datos. Sin embargo, otras tareas son mucho más fáciles de proponer soluciones factibles que verificarlas (por ejemplo, verificar un ensayo largo o establecer una nueva dieta como "solo comer bisonte").
Una cosa importante que debe comprender sobre la asimetría de verificación es que puede mejorar la asimetría haciendo un poco de trabajo de antemano. Por ejemplo, si tiene la clave de respuestas a un problema matemático o si tiene casos de prueba para un problema de Leetcode. Esto aumenta en gran medida el conjunto de problemas con la asimetría de verificación deseable.
La "ley del verificador" establece que la facilidad de entrenar a la IA para resolver una tarea es proporcional a la verificabilidad de la tarea. Todas las tareas que son posibles de resolver y fáciles de verificar serán resueltas por IA. La capacidad de entrenar a la IA para resolver una tarea es proporcional a si la tarea tiene las siguientes propiedades:
1. Verdad objetiva: todos están de acuerdo en lo que son las buenas soluciones
2. Rápido de verificar: cualquier solución dada se puede verificar en unos segundos
3. Escalable para verificar: muchas soluciones se pueden verificar simultáneamente
4. Bajo nivel de ruido: la verificación está lo más estrechamente relacionada posible con la calidad de la solución
5. Recompensa continua: es fácil clasificar la bondad de muchas soluciones para un solo problema
Un ejemplo obvio de la ley del verificador es el hecho de que la mayoría de los puntos de referencia propuestos en IA son fáciles de verificar y hasta ahora se han resuelto. Tenga en cuenta que prácticamente todos los puntos de referencia populares en los últimos diez años se ajustan a los criterios # 1-4; Los puntos de referencia que no cumplan con los criterios # 1-4 tendrían dificultades para volverse populares.
¿Por qué es tan importante la verificabilidad? La cantidad de aprendizaje en IA que ocurre se maximiza cuando se cumplen los criterios anteriores; Puede tomar muchos pasos de gradiente donde cada paso tiene mucha señal. La velocidad de iteración es fundamental: es la razón por la que el progreso en el mundo digital ha sido mucho más rápido que el progreso en el mundo físico.
AlphaEvolve de Google es uno de los mejores ejemplos de aprovechar la asimetría de verificación. Se centra en configuraciones que se ajustan a todos los criterios anteriores y ha llevado a una serie de avances en matemáticas y otros campos. A diferencia de lo que hemos estado haciendo en IA durante las últimas dos décadas, es un nuevo paradigma en el que todos los problemas se optimizan en un entorno donde el conjunto de trenes es equivalente al conjunto de prueba.
La asimetría de verificación está en todas partes y es emocionante considerar un mundo de inteligencia irregular donde cualquier cosa que podamos medir se resolverá.

299,21K
Parte superior
Clasificación
Favoritos