热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Perry E. Metzger
疯狂科学家、Bon Vivant 和 Raconteur。
我看到很多人谈论他们发现GPT-5比之前的模型差。我无法评论他们的体验,但我自己的体验恰恰相反。
昨天我让GPT-5 Thinking为我设计了一种复杂的领域特定语言,用于指定CPU中机器指令的语义。(这个东西的目的是为了更容易创建和维护旧计算机的模拟器,这是我的一个爱好。)
这个大型语言模型虽然不是完美的,但在这个任务上表现得非常出色,展现了一些真正的创造力。最终得到的DSL非常优秀,如果我自己手动完成的话,肯定需要大量的工作。我还没有完全完成与这个大型语言模型的规范工作,但当我完成时,我怀疑它能够一次性完成大部分编译器的工作。
也许对某些人来说,这个东西的表现不佳;我不知道他们在尝试做什么。我也无法评论他们对“个性”等事物的品味,此外,我的系统提示隐含地要求模型保持超专业和乏味。(我也对AI提供陪伴或情感支持没有兴趣,不想与它建立一种寄生社交关系。)
对我来说,它确实做得很好,尤其是在一个极其复杂的技术任务上。
请注意,我非常了解我要求系统执行的工作,我能够发现它所犯的错误并加以纠正,我认为经过几次迭代后完成95%的工作是一个非常好的结果,因为我可以纠正剩下的部分。
也许如果你试图让这个东西一次性完成一个有效的电路设计,而你对电气工程一无所知,这个东西仍然无法满足你的需求。但对我来说,它是一个惊人的工具,确实比o3有了明显的改进。
43.37K
Perry E. Metzger 已转发
新消息:ChatGPT引发的精神病并不真实
如果你是一个在过去几个月里有上网经历的人,你可能已经看到关于ChatGPT让人发疯的故事。
这些文章的框架通常是相同的。一个并不疯狂的人开始无辜地使用ChatGPT(帮助提供法律建议等)。然后,这个并不疯狂的人询问ChatGPT关于模拟理论、人工智能意识或对摩洛克的血祭——接着,这个并不疯狂的人完全失控,随着应用程序变得越来越具有欺骗性而变得疯狂。
它迎合了他们的自大妄想。曾经ChatGPT告诉一个并不疯狂的人,如果他相信得足够强烈,他可以从高楼跳下并飞起来——并让他们在一个甜蜜的时刻(或者在那个家伙的情况下,实际上是每天16小时)感到自己是特别的,被看见的,并与某种比自己更大的东西相连。然后,这个并不疯狂的客户失控,变得暴力,住院,失业,或者在去年的春天发生的一起悲惨事件中,字面上死去。
显然,根据主流叙事,这一切都表明OpenAI在保护最脆弱的人群方面的不可接受的失败。
但事实是,正如@dodgeblake所写:“这比那要复杂一点。”
在对所谓“ChatGPT引发的精神病”的媒体报道的分析中,Blake认为这些“并不疯狂”的人实际上在接触这个应用程序之前就已经疯狂了。抱歉,但如果你相信ChatGPT说你实际上是《黑客帝国》中的尼奥,或者你有一个名叫Kael的宇宙隐形爱人(所有真实故事)?那是你的问题。
完整文章见下方 👇

106.04K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可