SPR：语义前缀路由研究档案

这是什么

SPR（Semantic Prefix Routing，语义前缀路由）是一组研究实验，目标是回答一个问题：

能不能用“路径”替代 Transformer 里的一部分稠密矩阵搜索？

开放实验记录在 GitHub：

https://github.com/houming818/sametime

其中 ara/ 是公开版 ARA 研究记录，保留 logic、trace、轻量 evidence summary 和可公开脚本，方便人类和 AI 一起复盘这条路线。

这里的“路径”不是比喻。它指的是一个 token、短语或句子在递归树、折叠栈或结构图中走过的可计算轨迹。路径可以被组合、比较、压缩，也可以作为下游生成或结构判断的输入。

这套研究现在按 ARA（Architecture / Reasoning / Artifact）方式整理：每个结论都要有证据，每个强 claim 都要有反证标准。

当前结论

SPR 目前不能简单写成“路径即语义”。更准确的判断是：

层	名称	当前状态
S1a	Token Path Hash	已成立：高容量、低碰撞、顺序可分
S1b	Context-conditioned Routing	受控 proof 已支持：仍需真实语料和基线战
S2	Fold Stack / Structure Routing	有证据：语义能预测部分结构动作，但仍需基线对照

最重要的变化是：Echo Test 不再被当作语义证明。

Echo 证明系统能把输入还原出来。它证明容量和稳定性，但不证明系统理解了上下文里的含义。

证据入口

对应的 ARA 文件在仓库中：

ara/s1-echo/logic/claims.md
ara/s1-echo/logic/experiments.md
ara/s1-echo/trace/research_dag.yaml
ara/s1-echo/evidence/README.md

关键脚本：

holds/SameTime/experiments/spr_s1_reproduce.py
holds/SameTime/experiments/spr_s1_falsification.py
holds/SameTime/experiments/spr_context_proof.py
s2_strategy_audit.py
s2_overnight_io.py

关键复现实验结果：

collision=True
sign_alt=True
solo=41311/41429
bleu4=99.99
token_polysemy=0.43
keyword_polysemy=1.00
context_route=1.00
context_route_shuffled=0.48

这组结果的含义是：

collision=True：pure roll 确实有顺序碰撞。
sign_alt=True：roll + sign_alt 修复了这个碰撞。
solo=41311/41429：路径空间足够大，几乎每个 token 独占组合叶。
bleu4=99.99：Echo 近乎完美。
token_polysemy=0.43：token-only route 不能区分多义上下文。
keyword_polysemy=1.00：这个多义词任务本身不是不可解，只是 S1 当前没吃上下文。
context_route=1.00：受控上下文信号进入 route 后，同词多义可以被路径分开。
context_route_shuffled=0.48：打乱标签后优势消失，说明 proof 没有只靠标签分布取巧。

阅读提醒

旧版 SPR 文章是实验史，曾经混合了探索、猜想和阶段性判断。新版专题只保留当前架构上仍然成立的叙事，并把过强结论降级为待验证假说。

License: GPLv3

SPR：语义前缀路由研究档案

这是什么

当前结论

推荐阅读顺序

证据入口

阅读提醒