热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Bartosz Naskręcki
数学家 |副院长 @ 波兹南亚当密茨凯维奇大学|将严谨的数学与编程和机器学习联系起来|对人工智能真正理解的内容充满热情
与亚里士多德的自动形式化以及与 @OpenAI GPT Codex CLI(实际上是启用了 xhigh 和所有实验特性的 GPT-5.2)进行逆向工程。在处理 Bourbaki 的代数中关于矩阵的练习时,我获得了近 900 行完全文档化的 Lean 4 代码,包括证明的所有细节。
然后,我通过一个适当设计的代理设置将其传递给 Codex CLI,以逆向工程相应的 LaTeX 文件,直接从 Lean 重建证明步骤,采用 Leslie Lamport 的结构化证明风格。
这还不是 Langlands 计划,但我们确实需要这种中级数学的自动化。而这一切正在发生。我只是构建了正确的代理设置,将所有内容管道化,并从 Bourbaki 中抓取文本(即使那部分与 @grok 4.1 一起工作得很好,这对于实时预览 LaTeX 来说很酷)。
我将完成文档并将其发布在 GitHub 上。检查依赖图——亚里士多德自己处理了所有内容。证明是完全互动的。
我们现在生活在科学的未来中!




7
在这篇社区帖子中,我想分享一些高度吸引人的游戏和互动环境的链接(免费提供),帮助人们探索编程和数学中的高深概念。如果你知道其他有趣的地方,请在下面留言。玩得开心!
Lean:
一系列高度吸引人的编程难题,帮助你学习数学是如何被证明和形式化的。你将再也不会以同样的方式看待 5*7=7*5 的难度。
NandGame:
你可以从零开始制作自己的处理器(甚至 NAND 也是由更简单的电路构成)。非常上瘾,超级有趣!
Quantum Flytrap:
在这里你将最终理解量子计算。色彩丰富,无限吸引人,数学上非常深奥。
Scratch:
以有趣的方式学习编程。
Euclidea:
学习如何用尺子和圆规进行构造。它曾是学校教育的一部分,但现在是一个应用程序。既有趣又非常有信息量。
Planarity:
尝试找到一个图的嵌入,证明它确实是平面的。
Golly:
终极细胞自动机探索者。
如果你想深入了解:
SageMath:
这是一个强大的计算机代数系统,使用 Python 语法。它非常适合课程,SageMath 的语法与常规数学话语更为接近。我喜欢用 SageMath 教课。
GeoGebra:
你可以进行证明、计算和交互式小程序。这是学习本科数学许多不同方面的有趣方式。
Wolfram Demonstration Projects:
一系列数学小程序,帮助你理解非常复杂的主题。你不需要 Mathematica 来运行,但你需要它来设计自己的小程序。
The Mechanics of Proof (by Heather Macbeth):
这是一本书,配有一个互动的 GitHub 仓库,你可以更全面地学习 Lean 的结构和语法。
An Illustrated Theory of Numbers (by Martin H. Weissman):
这是一本关于初等数论及其应用的教科书。这些应用可以从网站上获得,作为一系列免费的 Jupyter Notebooks,教你关键概念。
Graphical Linear Algebra:
以插图和某种程度的互动方式学习代数中的深刻概念。
HomotopyContinuation.jl:
这是一个令人难以置信的美丽和互动的(使用 Julia)学习代数几何中一些高度复杂思想的方式(连通分量、同伦延续方法),并应用于来自应用的非常特殊的代数系统。你可以在这个过程中学习 Julia。
Mathamaze:
这是 Helena Verrill 的一项体验。美丽的几何、镶嵌、图案。简直太棒了。
难以解释:
n: the way of the ninja:
如果你认为数学很难。以艰难的方式学习耐心。警告:高度上瘾。
HyperRogue:
你可以在一个类 Rogue 的环境中学习双曲几何。

51
在这里,我展示了一篇最近数学论文的完整自动形式化(又一次!)
Barańczuk, Stefan. "在有限域上定义 n-空间子集的方程数量减少。" 图卢兹科学学院年刊:数学,第 6 卷,第 33 期,第 1 号(2024):177–182。
我在这个项目上花了几天时间。首先,我通过 @HarmonicMath 运行了亚里士多德,经过大约 15 小时,完全自动形式化了证明。然后,在 @PietroMonticone 的大力帮助下,我设法建立了证明的蓝图版本。这是一个所有 LaTeX 文档部分变得互动并可以被检查和研究的版本。我们可以看到证明中的依赖关系并研究它们的关系。
在后处理阶段,我还使用了 Grok Heavy 和 Codex CLI,结合 GPT-5.2 的 xhigh 模式,逐行分析了形式证明。这对那些不是专业 Lean 4 程序员的人来说是一个很大的帮助。你可以真正内化证明的所有步骤。
我想总结一下我的印象以及我从这次经历中学到的东西。@vladtenev @Leonard41111588 @HarmonicMath @llllvvuu @littmath @AlexKontorovich @jdlichtman @KenOno691 @CarinaLHong @gdb @hongyuan_mei




204
热门
排行
收藏
