模型解决的核心问题和目标
论文的核心问题是:当历史都城缺少完整平面图和可直接重建的三维资料时,如何把零散史料、图像细节与传统建筑—风水文化逻辑结合起来,生成一个既不脱离证据、又具有文化可解释性的空间方案。系统目标不是追求唯一真值,而是建立一条“证据输入—文化协调—可解释修复—可视化展示”的计算链路。
- 面对的是证据稀疏、来源异质、置信度不均衡的历史场景。
- 目标是让模型输出既能对照史料,又能解释传统营建秩序。
- 最终产物不是黑箱结果,而是可讲授、可展示、可复核的空间推断过程。
这一页按问题定义、双图建模、规则优先级、能量最小化、最小编辑修复、训练目标、实验指标几个层次,把原始论文的技术核心完整拆开。页面里的公式直接来自论文源文件,并用 MathJax 渲染。
这篇论文真正解决的问题是:当历史证据说一种布局,传统建筑与风水文化又偏向另一种布局时,系统应该怎么办。它不是简单地把文化词汇塞进模型,而是把证据和先验拆成两张图,然后通过约束协调去求一个可解释、可行、且尽量不背离证据的解。
论文的核心问题是:当历史都城缺少完整平面图和可直接重建的三维资料时,如何把零散史料、图像细节与传统建筑—风水文化逻辑结合起来,生成一个既不脱离证据、又具有文化可解释性的空间方案。系统目标不是追求唯一真值,而是建立一条“证据输入—文化协调—可解释修复—可视化展示”的计算链路。
方法上的关键创新在于把“汴京相关证据”与“建筑风水文化先验”分成两张图来建模:一张是证据图,用来承接文本、图像、考古和地图片段;另一张是先验图,用来表达中轴、门阈、围合、水体关系等规则。相比只做生成或只做规则匹配,这种双图结构更适合处理历史资料不完整、置信度不均衡的场景。
算法链条分成五步。第一步,把公开史料整理为结构化场景资料包;第二步,用提案网络根据证据生成初始布局;第三步,用规则优先级控制器判断每条文化规则在当前场景中的重要性;第四步,进入协调阶段,让几何约束、拓扑关系和文化规则共同作用;第五步,在证据预算约束下进行最小编辑修复,得到可展示的二维布局与 2.5D 体量结果。
当前系统以六个公开来源数据包为核心演示集,覆盖院落住居、桥关水系和市街桥市三类场景。每个场景都经历“证据提案—约束协调—修复展示”三阶段评估,并输出证据一致性、文化一致性和规则满足率等指标。与此同时,系统还保留最小基线组,用于比较只看证据、统一先验和不做修复等不同方案的表现差异。
实验表明,仅依赖原始证据通常难以得到满足传统空间秩序的方案,而加入文化先验后,模型能够明显提升规则满足率和空间解释性。当前公开数据包的修复后平均规则满足率已经达到满分水平,说明系统在不放弃证据约束的前提下,能够把传统建筑与风水文化转化为可展示、可讲授、可比较的数字人文成果。
每条公式旁边都配上它在系统中的职责,避免观众只看到符号却不知道它在网页里对应什么。
系统把每个历史场景表示成一组对象状态。这里的 $b_i$ 表示几何轮廓或平面 footprint,$c_i$ 是对象类别,$a_i$ 是属性,$x_i$ 是连续空间参数,$r_i$ 是与其他对象之间的语义关系。
论文不是把所有信息混成一锅,而是拆成证据图和先验图。证据图负责承接文本、图像、考古和平面线索;先验图负责承接建筑礼序、门阈递进、水体关系和空间围合等文化规则。
这一步是 evidence-driven 的提案网络。它先在证据图上传播信息,估计对象是否存在、对象之间的大致关系以及初始布局变量。
不同场景不能使用一套固定规则权重。控制器根据场景上下文 $c$ 输出每条规则的优先级。
第一项要求方案不要脱离证据;第二项表示不同文化规则按场景权重参与优化;第三项限制结果不要偏离初始提案太远。这就是“约束协调”的核心。
像非法重叠、不可达、围合错误、门阈顺序失真这类问题,会被作为硬约束处理。模型不是只会打分,而是必须进入可行解空间。
修复不是随便美化,而是在证据预算约束下做最小编辑。也就是说,只允许在不严重背离证据的前提下,对方案做最少量的结构调整。
训练阶段同时学习节点、边、布局、规则优先级和一致性稳定性。系统不是只学画图,而是同时学“什么对象存在”“对象如何相连”“几何如何摆放”“什么规则更重要”。
如果只看像不像,模型会滑向主观美化;如果只看离证据近不近,模型又无法解释传统空间秩序。所以论文故意把证据一致性、文化一致性、规则满足率和编辑代价拆开。
看结果离原始证据有多近。
EC 越高,说明几何位置和关系越接近证据驱动的参考状态。它不是审美分,而是“你有没有把证据改得太狠”的约束指标。
看传统建筑与风水规则满足得有多好。
CC 汇总了规则库的满足情况。中轴、门阈、围合、水体、可达性等规则会按严重度和场景权重聚合成一个整体分数。
看所有硬约束是否真正满足。
FR=1.0 表示所有 hard rules 都过关。它比 CC 更严格,因为只要有一个硬约束没有满足,就不能算完全可行。
看修复为了变得更合理,究竟改了多少。
Edit 越小越好。它可以帮助观众理解:修复并不是自由发挥,而是尽量少动、少改,在尊重证据前提下恢复文化逻辑。
这个阶段指标图用于说明:随着从证据提案走向修复展示,系统是否真正提升了规则满足率和文化解释性,同时又没有完全抛弃证据。
读图方式:如果 CC 和 FR 随着阶段推进变高,而 EC 没有完全崩掉,说明系统实现了尽量保留证据,同时恢复空间秩序的目标。
EC、CC、FR 之间存在天然张力。一个完全贴证据的结果,不一定满足传统礼序;一个过度追求文化一致性的结果,又可能偏离史料。因此网页把它们并列展示,避免观众只看单一指标。