Thinking Like a
Mathematician.

让 AI 像数学家一样思考

我们不满足于「预测下一个词」。在 GaussAI 的深层架构中,模仿了顶尖数学家的 认知工作流: 从理解问题到策略与草图,再到形式化与验证;失败时带着 累积教训 回退重来。

工作流是循环而非单向管道:形式化编译失败时进入反思(Reflection),更新 lessons,再退回理解、探索或策略等更早阶段——迭代上限通常为 8 轮。

Seven Stages.

每个阶段有独立 prompt 与产出物;进入阶段前应先读对应指引,并通读当次运行的 lessons.md

  • runs / · stage_01 … stage_07
  • max_iterations = 8
01

Understanding

澄清命题、符号与背景——先理解问题,不急于证明。

02

Exploration

结构探索、手算小例子,建立对结论的直觉。

03

Strategy

至少三条不同视角的路径规划,并与 lessons 对照。

04

Sketch

完整自然语言证明草图,作为形式化的蓝图。

05

Formalization

翻译为 Lean4,对接 Mathlib;真实编译,禁止臆断成功。

06

Reflection

失败时追加 lessons,声明下一轮 Mode,选择回退深度。

07

Validation

编译与公理审计通过后:复盘、归档至 Problems/,沉淀可复用引理。

三大核心机制

I · Learning Retreat

学习型回退

失败不是简单重试。lessons.md 累积死路、已验证子结论、陷阱与修订理解——只增不减,下一轮显式引用,从更高认知起点重来。

II · Structured Planning

结构化创新规划

Strategy 阶段产出固定 schema:问题定位、≥3 条不同视角路径、路径选择与 lessons 对照。禁止视角重复凑数,创新度需诚实标注。

III · Adaptive Temperature

自适应探索温度

Mode A 保守(1–2 轮)· Mode B 探索(3–4 轮)· Mode C 重构(5+ 轮)。可提前升级模式,不可降级;Reflection 需声明下一轮 Mode。

Lean4 · 公理审计 · 引理补全

编译通过 ≠ 证明有效。 需拦截 axiomsorry 与非常规公理依赖;必要时进入引理补全:先确认 Mathlib 确无,再建 Dependency DAG(深度 ≤4),自底向上证明 private lemma。

Audit #print axioms 白名单:propext、Classical.choice、Quot.sound;其它一律视为失败。
Prover 形式化阶段可对接 DeepSeek-Prover-V2:自草图生成代码,或由编译错误驱动修复循环。

lean_helpers /

setup_workspace.sh首次建立 Lake + Mathlib
init_run.sh新建 run 目录与 lessons
build_and_parse.sh编译 + 触发公理审计
archive_proof.sh验证通过后归档
call_deepseek.pysketch / fix 模式

按需检索,永不全文注入

资料经 MinerU 与索引管线生成 outline.jsonmethodology.md。 仅在 Mode A 的策略阶段查询;Mode B/C 不调用,以免保守检索压制探索。

kb_helpers: import_sources · search_outline · search_methodology · fetch_section

knowledge_base/

raw/           ← 原始 PDF / DOCX / MD
sources/       ← 统一 Markdown
outlines/      ← outline.json(精确行号)
methodologies/ ← methodology.md(怎么做)
master_index.json · master_topics.md

运行时写入 ~/math-agent-workspace/(Scratch.lean、runs/、Problems/);Skill 本体轻量驻留在 skills 目录,二者分离。

The Flow in Code.

草图、教训与编译反馈在同一叙事里交汇:左侧是探索与策略,中间是 Lean 检查点,右侧是反思驱动的修补——与真实 Skill 管线一致。

回到七阶段说明 ↗
/- Stage 04 sketch → Stage 05: Mathlib import -/ import Mathlib -- lessons: 避免对 n 直接归纳(见 Dead Ends #1) theorem target (n : ℕ) (hn : n ≥ 2) : ... := by /- build: 策略切换,非 syntax 花招 -/ -- unsolved goals at line 42 /- Stage 06 reflection: 追加 lessons,回退 Strategy (Mode B) -/ -- 新路径:强归纳 + Finset 引理 … ✓ lake build OK · axiom audit: propext, Classical.choice, Quot.sound only

联系与合作

我们欢迎与您在形式化数学与 AI 证明智能体方向开展交流。若您希望与我们共创调优,或申请产品与管线试用,请通过下方邮箱与我们联系

Primary contact

龚钰轩

北京航空航天大学

tangtaizong@buaa.edu.cn

建议在主题中注明「学术交流」或「产品试用」,便于我们转交对口同事并准备材料。

学术交流

发送邮件 →

本产品仍在不断优化中,正在适配更多数学研究分支。如果您对与围绕形式化数学Lean4 / Mathlib定理证明智能体Math Thinking Flow方法论 等主题感兴趣或有所见解,或希望本模型对您所研究的数学课题角度进行专属调优,欢迎您与我在邮件中沟通。

产品试用

发送邮件 →

若您希望体验 GaussAI / Math Thinking Flow 管线、了解开发过程内测与部署、或讨论定制化知识库接入与运维方式,欢迎来信。请在邮件中注明机构或个人名称、大致使用场景(如教学、科研课题、内部工具)、期望试用周期与联系人方式;我们将在评估需求后与您沟通下一步安排。

  • 管线体验 · 内测与反馈
  • 知识库与 Lean 工作区方案沟通

从结绳计数到算筹再到计算机

我们将生产力一步步解放,也诞生了一个个奇迹

可今天,当人工智能让我们可窥见彻底摆脱计数者的身份、 平静地交付那些我们曾经引以为傲的推导的未来时
无数人却不寒而栗

硅基智能能以相较于人成千上百万的速度淌过每一条河。
速度很快,快到我们窒息

当我们在这里反复确认人的生态位时,我们就已经在向技术低头了。

未来如何,你我皆不知,可我们知道:

技术,它只是一面镜子,照见我们真正擅长的事。
它丈量星辰的数量,而我们,负责为星空命名。

北航的玉兰花开了,开得那么美。
檐下的雨,一滴一滴,落在花瓣上,落在石阶的同一个凹痕里。

石阶不说话,只是慢慢变薄。