Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
He estado viendo a un montón de personas hablando sobre cómo han encontrado que GPT-5 es un paso atrás en comparación con los modelos anteriores. No puedo hablar de su experiencia, pero la mía ha sido todo lo contrario.
Ayer hice que GPT-5 Thinking diseñara un lenguaje específico de dominio complicado para especificar la semántica de las instrucciones de máquina en las CPU. (El propósito de esto es facilitar la creación y el mantenimiento de emuladores para computadoras antiguas, que es un pasatiempo mío.)
El LLM no fue perfecto, pero hizo un excelente trabajo y demostró una verdadera creatividad en la tarea. El DSL resultante es excelente y habría requerido un montón de trabajo si lo hubiera hecho a mano. No he terminado completamente de trabajar con el LLM en la especificación, pero cuando lo haga, sospecho que va a poder hacer la mayor parte del compilador de un solo intento.
Quizás para algunas personas esto está funcionando mal; no sé qué están tratando de hacer. También no puedo hablar de sus gustos en cosas como "personalidad", y además, mi aviso del sistema pide implícitamente al modelo que sea ultra profesional y soso. (Tampoco tengo interés en que la IA me brinde compañía o apoyo emocional y no quiero tener una relación parasocial con ella.)
Para mí, ciertamente está haciendo un muy buen trabajo, y en una tarea técnica extremadamente complicada.
Ten en cuenta que entiendo el trabajo que le estoy pidiendo al sistema que haga extremadamente bien, estoy en una posición para detectar errores que está cometiendo y corregirlos, y considero que un trabajo que está 95% terminado después de algunas iteraciones es un resultado realmente bueno porque puedo corregir el resto.
Quizás si estás tratando de que haga un diseño de circuito funcional de un solo intento y no sabes nada de ingeniería eléctrica, aún no está haciendo lo que quieres. Para mí, sin embargo, es una herramienta increíble y es una mejora distinta sobre o3.
Veo muchas quejas sobre la personalidad siendo "como una secretaria sobrecargada de trabajo", y nunca he experimentado nada parecido, pero, por otro lado, yo uso un aviso del sistema y parece que la mayoría de las personas no lo hacen, y nunca uso el modelo sin razonamiento, y parece que la mayoría de las personas solo usan la versión sin razonamiento del modelo.
43.37K
Populares
Ranking
Favoritas