.@christinahkim dice que la frontera ya no son los benchmarks. Es el uso. Las puntuaciones de evaluación están saturadas, pero la vida diaria no lo está. La verdadera señal de progreso es cuántas personas utilizan la IA para hacer cosas reales. Así es como sabremos que nos estamos acercando a la AGI.
23.72K