热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我这个周末用GPT-5更改了一个实现,并将其用于更高层次的设计,效果非常好。然后我决定让它尝试实现,结果Elixir代码奇怪、带有Ruby的影响且糟糕,所以我又回到了Claude进行实现。

8月11日 22:57
我看到很多人谈论他们发现GPT-5比之前的模型差。我无法评论他们的体验,但我自己的体验恰恰相反。
昨天我让GPT-5 Thinking为我设计了一种复杂的领域特定语言,用于指定CPU中机器指令的语义。(这个东西的目的是为了更容易创建和维护旧计算机的模拟器,这是我的一个爱好。)
这个大型语言模型虽然不是完美的,但在这个任务上表现得非常出色,展现了一些真正的创造力。最终得到的DSL非常优秀,如果我自己手动完成的话,肯定需要大量的工作。我还没有完全完成与这个大型语言模型的规范工作,但当我完成时,我怀疑它能够一次性完成大部分编译器的工作。
也许对某些人来说,这个东西的表现不佳;我不知道他们在尝试做什么。我也无法评论他们对“个性”等事物的品味,此外,我的系统提示隐含地要求模型保持超专业和乏味。(我也对AI提供陪伴或情感支持没有兴趣,不想与它建立一种寄生社交关系。)
对我来说,它确实做得很好,尤其是在一个极其复杂的技术任务上。
请注意,我非常了解我要求系统执行的工作,我能够发现它所犯的错误并加以纠正,我认为经过几次迭代后完成95%的工作是一个非常好的结果,因为我可以纠正剩下的部分。
也许如果你试图让这个东西一次性完成一个有效的电路设计,而你对电气工程一无所知,这个东西仍然无法满足你的需求。但对我来说,它是一个惊人的工具,确实比o3有了明显的改进。
但在理解我试图做的事情、提出一个很好的模式和高层次的计划方面,它比我见过的任何东西都要好。只是低级编码方面它表现得不太好——通常在编码的LLM中,情况正好相反。
1.43K
热门
排行
收藏