Kimi-Researcher深度研究模型开启内测：可生成易追溯的万字报告

IT之家 6 月 21 日消息，IT之家从月之暗面 Kimi 公众号获悉，Kimi 的第一个 Agent（智能体）Kimi-Researcher 于 20 日开启小范围灰度测试。

Kimi-Researcher 是基于端到端自主强化学习（end-to-end agentic RL）技术训练的新一代 Agent 模型，也是一个专为深度研究任务而生的 Agent 产品。其后，月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。

对于每一个问题，Kimi-Researcher 都会自主规划任务执行流程，最终交付完整结果：

澄清问题（clarification）：理解问题时主动反问，构建更清晰的问题空间；
深入思考：每个任务平均进行 23 步推理，自主梳理并解决需求；
主动搜索：每个任务，平均规划 74 个关键词，找到 206 个网址，由模型判断并筛选出信息质量最高的前 3.2% 内容，剔除冗余、低质信息；
调用工具，交付结果：自主调用浏览器、代码等工具，处理原始数据、自动生成分析结论，端到端完成交付。

为了保证输出的质量和信息覆盖度，Kimi-Researcher 采用异步执行方式，用更多时间逐步推理、检索和撰写内容。

用户最终将收到 2 个交付成果。

一份信息详实、可溯源的深度研究报告

报告的平均长度在万字以上；
平均引用约 26 个高质量、可溯源的信源；
所有引用都内嵌在正文中，点击即可跳转，并高亮原文，便于验证与追溯。

一个可交互、可分享的动态可视化报告

结构化排版、思维导图，让趋势、异常等重要信息一眼可见；
无需阅读全文，也能迅速把握整体结构与核心结论；
支持在线生成链接并分享，方便展示。

官方宣布，在专为 AI 设计的高难度 benchmark“人类最后一次考试（Humanity's Last Exam,HLE）”中，Kimi-Researcher 在完全零结构、无流程设计的设置下，得分如下：

Pass@1 准确率：26.9%
Pass@4 准确率：40.17%

这一表现超过了 Claude 4 Opus（10.7%）、Gemini 2.5 Pro（21.6%），略高于 OpenAI Deep Research（26.6%），和 Gemini-Pro 的 Deep Research Agent（26.9%）打平，是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系，Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率，领先该榜中其他模型。

展开阅读全文

更新时间：2025-12-15

标签：科技深度模型报告平均自主信息准确率在线结论主动流程

1 2 3 4 5

Kimi-Researcher深度研究模型开启内测：可生成易追溯的万字报告

【展会直击】来成都耳机展，邂逅FOCAL,邂逅浪漫

Labubu价格跳水，黄牛麻了，等等党：赢了!

SerImmune获A轮投资

福达股份股价下跌7.22% 人形机器人板块走弱

三峡新材股价报2.98元董事会审议多项重要议案

寒武纪-U股价573.97元科创板百元股中溢价幅度居前

普京呼吁合作伙伴共同构建全球发展新模式

城地香江股价震荡下行盘中现快速反弹行情

拿到欧盟1.8亿美元后，塔利班对中企翻了脸，叫停中阿油田合作

厦门信达股价下跌3.29% 子公司业务范围披露

豪江智能股价小幅下跌公司披露与大疆无人机合作进展

宁波东力股价下挫7.56% 盘中振幅超8%

金杨股份股价下跌2.68%，回应参股公司持股情况

深入贯彻中央八项规定精神学习教育中央第十指导组指导督导市场监管总局见面会召开

联泓新科股价微跌0.20%，EVA改性技术获专利突破

方正科技获融资买入0.38亿元，近三日累计买入2.36亿元

茉莉奶白做烘焙？10W+网友在线等着抢……

饿了么主动报案！

隆华科技获得实用新型专利授权：“一种钼宽靶表面加工装

拓荆科技获得发明专利授权：“吸附力检测装置、方法、存

西力科技股价下跌1.71% 年度权益分派方案出炉

7月6日开幕！北京·昌平生命科学论坛携手全国医药工业信

国晟科技股价微跌0.99% 子公司签订10.43亿元光伏组件

6月份沪牌拍卖结果公布：中标率9.3% 平均成交价为93734

吉视传媒成立科技创新研究院