《Towards Knowledgeable Deep Research》提出 Knowledgeable Deep Research 任务、HKA 多智能体框架和 KDR-Bench,要求 agent 同时利用结构化表格与非结构化网页生成多模态长报告,在知识型深度研究上补齐了现有 Deep Research 评测的空白。
这篇论文想解决的是一个很实际的问题,现有 Deep Research agent 大多擅长搜网页、拼摘要,但一碰到表格、统计口径、跨数据源比对这类结构化知识任务,报告质量就会明显下滑。作者把这类更难的任务单独定义成 Knowledgeable Deep Research,并提出 HKA 框架,把规划、结构化知识分析、非结构化检索和写作拆成不同子代理协作完成,让系统既能查网页,也能围绕表格和图表做计算、分析与整合。
更关键的是,他们没有只给一个方法,而是顺手补上了评测基础设施。KDR-Bench 覆盖 9 个领域、41 个专家级问题,并配了上千张结构化表格资源,还额外标注了核心结论和关键点,方便从通用质量、知识利用和视觉呈现三个维度评价 agent。论文里给出的结果显示,HKA 在通用指标和知识中心指标上普遍强于现有 Deep Research agent,在视觉增强指标上甚至超过 Gemini Deep Research,这说明“会搜”已经不够,“会算、会画、会把结构化证据讲清楚”正在变成下一阶段的分水岭。
这件事值得关注,是因为它把 Deep Research 的竞赛方向往更接近真实分析工作的地方推了一步。未来无论是金融、产业研究、咨询,还是企业内部情报系统,真正高价值的任务都不会只靠网页摘抄完成,而是要把数据库、表格、图表和文本证据合在一起给出可追溯结论。KDR-Bench 这类工作如果被广泛采用,后面模型和 agent 工具链的优化重点,很可能都会向结构化知识推理、多模态报告生成和可验证分析能力继续倾斜。