论文页 / 公式页 / 方法说明页

论文原始方法与公式

把模型到底做了什么讲到能看懂、能教学、能复述

这一页按问题定义、双图建模、规则优先级、能量最小化、最小编辑修复、训练目标、实验指标几个层次,把原始论文的技术核心完整拆开。页面里的公式直接来自论文源文件,并用 MathJax 渲染。

主目标:证据与文化冲突协调核心结构:证据图 + 先验图关键机制:规则优先级控制器结果输出:二维布局 + 2.5D 体量 + 修复展示
三阶段指标对比图

论文做的不是文化提示词,而是冲突求解

这篇论文真正解决的问题是:当历史证据说一种布局,传统建筑与风水文化又偏向另一种布局时,系统应该怎么办。它不是简单地把文化词汇塞进模型,而是把证据和先验拆成两张图,然后通过约束协调去求一个可解释、可行、且尽量不背离证据的解。

模型解决的核心问题和目标

论文的核心问题是:当历史都城缺少完整平面图和可直接重建的三维资料时,如何把零散史料、图像细节与传统建筑—风水文化逻辑结合起来,生成一个既不脱离证据、又具有文化可解释性的空间方案。系统目标不是追求唯一真值,而是建立一条“证据输入—文化协调—可解释修复—可视化展示”的计算链路。

  • 面对的是证据稀疏、来源异质、置信度不均衡的历史场景。
  • 目标是让模型输出既能对照史料,又能解释传统营建秩序。
  • 最终产物不是黑箱结果,而是可讲授、可展示、可复核的空间推断过程。

创新优化了什么

方法上的关键创新在于把“汴京相关证据”与“建筑风水文化先验”分成两张图来建模:一张是证据图,用来承接文本、图像、考古和地图片段;另一张是先验图,用来表达中轴、门阈、围合、水体关系等规则。相比只做生成或只做规则匹配,这种双图结构更适合处理历史资料不完整、置信度不均衡的场景。

  • 把证据约束与文化先验拆分建模,避免相互淹没。
  • 引入规则优先级控制器,让不同场景自动决定哪些规则更关键。
  • 通过最小编辑修复把“看似合理但不合礼序”的方案纠正成可展示状态。

具体算法实现方法是什么

算法链条分成五步。第一步,把公开史料整理为结构化场景资料包;第二步,用提案网络根据证据生成初始布局;第三步,用规则优先级控制器判断每条文化规则在当前场景中的重要性;第四步,进入协调阶段,让几何约束、拓扑关系和文化规则共同作用;第五步,在证据预算约束下进行最小编辑修复,得到可展示的二维布局与 2.5D 体量结果。

  • 提案网络负责给出对象存在性、关系初值、几何布局和体量先验。
  • 协调阶段联合处理重叠、通达、前后序列、围合和水体关系等约束。
  • 修复阶段保留证据预算,避免为了满足规则而过度篡改历史线索。

实验是如何进行的

当前系统以六个公开来源数据包为核心演示集,覆盖院落住居、桥关水系和市街桥市三类场景。每个场景都经历“证据提案—约束协调—修复展示”三阶段评估,并输出证据一致性、文化一致性和规则满足率等指标。与此同时,系统还保留最小基线组,用于比较只看证据、统一先验和不做修复等不同方案的表现差异。

  • 数据包全部保留来源链和标注依据,方便教学与复核。
  • 评测同时关注证据一致性、文化一致性和规则满足率,不只看单一指标。
  • 通过基线对比说明文化先验、规则协调和修复模块各自的实际贡献。

核心结论和效果是什么

实验表明,仅依赖原始证据通常难以得到满足传统空间秩序的方案,而加入文化先验后,模型能够明显提升规则满足率和空间解释性。当前公开数据包的修复后平均规则满足率已经达到满分水平,说明系统在不放弃证据约束的前提下,能够把传统建筑与风水文化转化为可展示、可讲授、可比较的数字人文成果。

  • 文化先验不是附加装饰,而是提升历史空间解释力的关键约束。
  • 证据提案、约束协调和修复展示三阶段结果差异清晰,适合课堂示范。
  • 系统既可面向学术表达,也可面向公众教育与数字展陈。

核心公式逐条解释

每条公式旁边都配上它在系统中的职责,避免观众只看到符号却不知道它在网页里对应什么。

场景状态表示

$$ \mathbf{Z}=\{(b_i,c_i,a_i,x_i,r_i)\}_{i=1}^{N} $$

系统把每个历史场景表示成一组对象状态。这里的 $b_i$ 表示几何轮廓或平面 footprint,$c_i$ 是对象类别,$a_i$ 是属性,$x_i$ 是连续空间参数,$r_i$ 是与其他对象之间的语义关系。

双图建模

$$ \mathcal{G}^{\mathrm{evid}}=(\mathcal{V}^{\mathrm{evid}},E^{\mathrm{evid}},\mathbf{u}^{\mathrm{evid}}),\qquad \mathcal{G}^{\mathrm{prior}}=(\mathcal{V}^{\mathrm{prior}},E^{\mathrm{prior}},\Pi) $$

论文不是把所有信息混成一锅,而是拆成证据图和先验图。证据图负责承接文本、图像、考古和平面线索;先验图负责承接建筑礼序、门阈递进、水体关系和空间围合等文化规则。

证据图消息传递

$$ \mathbf{h}_i^{(\ell+1)}=\mathrm{GNN}^{(\ell)}\!\left(\mathbf{h}_i^{(\ell)},\{\mathbf{h}_j^{(\ell)},e_{ij}\}_{j\in\mathcal{N}(i)}\right) $$

这一步是 evidence-driven 的提案网络。它先在证据图上传播信息,估计对象是否存在、对象之间的大致关系以及初始布局变量。

规则优先级控制器

$$ \alpha(c)=[\alpha_1(c),\ldots,\alpha_R(c)],\qquad \alpha_r(c)\in[0,1] $$

不同场景不能使用一套固定规则权重。控制器根据场景上下文 $c$ 输出每条规则的优先级。

主能量函数

$$ \mathcal{E}(\mathbf{Z})=\lambda_{\mathrm{evidence}}E_{\mathrm{evidence}}(\mathbf{Z};\mathcal{G}^{\mathrm{evid}})+\sum_{r=1}^{R}\alpha_r(c)\,\phi_r(\mathbf{Z};\mathcal{G}^{\mathrm{prior}})+\gamma\,\Psi(\mathbf{Z},\mathbf{Z}^{(0)}) $$

第一项要求方案不要脱离证据;第二项表示不同文化规则按场景权重参与优化;第三项限制结果不要偏离初始提案太远。这就是“约束协调”的核心。

硬约束集合

$$ h_j(\mathbf{Z})=0\ (j\in\mathcal{H}),\qquad g_k(\mathbf{Z})\le 0\ (k\in\mathcal{I}) $$

像非法重叠、不可达、围合错误、门阈顺序失真这类问题,会被作为硬约束处理。模型不是只会打分,而是必须进入可行解空间。

最小编辑修复

$$ \mathbf{Z}^{\mathrm{repair}}=\arg\min_{\mathbf{Z}\in\Omega}\ C_{\mathrm{edit}}(\mathbf{Z},\hat{\mathbf{Z}})+\beta\sum_{r\in\mathcal{R}_{\mathrm{soft}}}w_r\,\phi_r(\mathbf{Z}),\qquad \Delta_{\mathrm{evidence}}(\mathbf{Z},\hat{\mathbf{Z}})\le \varepsilon $$

修复不是随便美化,而是在证据预算约束下做最小编辑。也就是说,只允许在不严重背离证据的前提下,对方案做最少量的结构调整。

训练目标

$$ \mathcal{L}=\mathcal{L}_{\mathrm{node}}+\mathcal{L}_{\mathrm{edge}}+\mathcal{L}_{\mathrm{layout}}+\eta\,\mathcal{L}_{\mathrm{priority}}+\mu\,\mathcal{L}_{\mathrm{consistency}} $$

训练阶段同时学习节点、边、布局、规则优先级和一致性稳定性。系统不是只学画图,而是同时学“什么对象存在”“对象如何相连”“几何如何摆放”“什么规则更重要”。

评价指标为什么这样设计

如果只看像不像,模型会滑向主观美化;如果只看离证据近不近,模型又无法解释传统空间秩序。所以论文故意把证据一致性、文化一致性、规则满足率和编辑代价拆开。

证据一致性 EC

看结果离原始证据有多近。

EC 越高,说明几何位置和关系越接近证据驱动的参考状态。它不是审美分,而是“你有没有把证据改得太狠”的约束指标。

文化一致性 CC

看传统建筑与风水规则满足得有多好。

CC 汇总了规则库的满足情况。中轴、门阈、围合、水体、可达性等规则会按严重度和场景权重聚合成一个整体分数。

规则满足率 FR

看所有硬约束是否真正满足。

FR=1.0 表示所有 hard rules 都过关。它比 CC 更严格,因为只要有一个硬约束没有满足,就不能算完全可行。

编辑代价 Edit

看修复为了变得更合理,究竟改了多少。

Edit 越小越好。它可以帮助观众理解:修复并不是自由发挥,而是尽量少动、少改,在尊重证据前提下恢复文化逻辑。

统计图表

这个阶段指标图用于说明:随着从证据提案走向修复展示,系统是否真正提升了规则满足率和文化解释性,同时又没有完全抛弃证据。

读图方式:如果 CC 和 FR 随着阶段推进变高,而 EC 没有完全崩掉,说明系统实现了尽量保留证据,同时恢复空间秩序的目标。

指标之间的关系

EC、CC、FR 之间存在天然张力。一个完全贴证据的结果,不一定满足传统礼序;一个过度追求文化一致性的结果,又可能偏离史料。因此网页把它们并列展示,避免观众只看单一指标。

  • EC 高:说明没有过度修改。
  • CC 高:说明文化规则被更好满足。
  • FR 高:说明硬约束全部过关。
  • Edit 低:说明修复是克制的而非任意的。