AI Info Hub · 用更短的时间看懂真正值得关注的 AI 更新
LLM 在系统性泛化上仍卡在长度扩展,最短路径控制环境给出更细的失败画像
一篇新上线到 arXiv 的 ICLR 2026 工作用最短路径规划构造可控环境,把训练数据覆盖、RL 稳定性和推理时扩展拆开分析。结果显示模型对未见地图的空间迁移还行,但一旦任务长度拉长,仍会因递归不稳定而明显失效。
AI Info Hub · 用更短的时间看懂真正值得关注的 AI 更新
一篇新上线到 arXiv 的 ICLR 2026 工作用最短路径规划构造可控环境,把训练数据覆盖、RL 稳定性和推理时扩展拆开分析。结果显示模型对未见地图的空间迁移还行,但一旦任务长度拉长,仍会因递归不稳定而明显失效。