红杉中国正式开源AI基准测试xbench评测集

观点网讯：6月18日，红杉中国在中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch，旨在服务大模型和AI Agent开发者，避免静态评测集常见的过拟合问题，确保工具长期有效。

该开源举措将基于AI发展动态更新评测集，采用“黑白盒”机制提升模型评估准确性。红杉中国表示，这有助于推动AI技术创新，并为开发者提供可靠基准支持。

免责声明：本文内容与数据由观点根据公开信息整理，不构成投资建议，使用前请核实。

本文源自观点网

展开阅读全文

更新时间：2025-12-16

标签：科技红杉基准中国正式测试观点开发者模型本文技术创新举措静态

1 2 3 4 5

刚刚，豆包AI播客上线：8万字文档秒变节目，语气词和停顿都像人

智东西作者 | 陈骏达编辑 | 心缘智东西6月17日报道，今天，豆包电脑版和网页版全量上线了AI播客功能。用户上传PDF或网页链接后，可一键生成双人对话的播客节目。上线后，智东西第一

乐信众联取得一种数据处理方法及系统专利

金融界2025年6月17日消息，国家知识产权局信息显示，北京乐信众联科技有限公司取得一项名为“一种数据处理方法及系统”的专利，授权公告号CN114650640B，申请日期为2022年04月。天

京东CEO许冉：全职外卖骑手五险一金成本并非巨大到不可承担

南方财经6月17日电今日，京东集团CEO许冉在回应“外卖骑手五险一金成本”问题时表示，对于收佣金的外卖平台来说，其利润完全能支撑全职外卖骑手的五险一金，“为外卖员缴纳五险一

“AI赋能数字公共治理研讨会暨系列数智成果发布会”在深圳召开

6月15日，由电子科技大学（深圳）高等研究院（以下简称“高研院”）主办的“AI 赋能数字公共治理研讨会暨系列数智成果发布会”在深圳召开。数智公共治理四川省哲学社会科学重点实验室

顺利贯通！新线建设进展+2！

6月15日西安至十堰高速铁路（简称西十高铁）湖北段最长隧道园岭隧道和控制性工程郧西隧道正式贯通标志着西十高铁建设取得重要进展西十高铁全长约255.7公里，设计时速350公里，途

伊顿智能动力取得用于致动元件保护套环专利

金融界2025年6月18日消息，国家知识产权局信息显示，伊顿智能动力有限公司取得一项名为“用于致动元件、特别地是开关的保护套环”的专利，授权公告号CN112868078B，申请日期为2019

中航西飞获得发明专利授权：“一种压敏漆荧光光强的实验数据拟合方法”

证券之星消息，根据天眼查APP数据显示中航西飞（000768）新获得一项发明专利授权，专利名为“一种压敏漆荧光光强的实验数据拟合方法”，专利申请号为CN202211422015.8，授权日为2025年6

因技术故障等原因，印度航空取消至少5架次波音机型国际航班

△资料图记者17日获悉，因技术故障等原因，印度航空当天取消了至少5架次国际航班，涉及航班包括印度艾哈迈达巴德飞往伦敦、德里飞往巴黎、德里飞往迪拜、德里飞往维也纳以及伦敦

青海发布双万兆5G-A及“AI+政企融智”创新产品

本报讯（记者董洁） 6月17日，“万兆领航翼启AI+时代”中国电信双万兆5G-A及“AI+政企融智”创新产品发布会在西宁启幕。青海电信作为服务青海地方经济社会发展的主力军之一，始终

足球赛、种植牙、药店无人值守......感受机器人产业的创新发展

6月17日，北京机器人大世界，媒体记者在拍摄机器人整理桌面的现场展示。当日，记者跟随“活力中国调研行”主题采访活动来到这里，感受机器人产业的创新发展。近年来，北京市发挥科技

民生证券：在跨境支付中使用稳定币替代传统跨境支付的趋势或将持续推进

民生证券表示，6月18日陆家嘴金融论坛即将召开，若干重磅金融政策有望发布。近期金融科技具备“革命性”的稳定币加速推进，考虑到稳定币在跨境支付场景中的便捷性，后续在跨境支付

兰州高新区街道联合招行高新支行开展党建共建活动

为深入贯彻落实新时代党的建设总要求，强化基层党组织建设，进一步推动政企共建，加强党组织之间的交流合作，提升社区居民的法律意识和金融安全意识，关心关爱社区老党员。在“七一”

国际油价持续走强，能源化工ETF、标普油气ETF早盘涨约2%

每经记者：叶峰每经编辑：肖芮冬国际油价近期持续走强。6月17日，WTI纽约原油CFD大涨逾5%。受盘面影响，能源化工ETF、标普油气ETF早盘涨约2%。有分析人士认为，短期OPEC+实际增产幅

南京江北新区定向设立3亿元基金用于工业软件核心技术攻关

扬子晚报网6月17日讯（记者刘丽媛）6月17日，2025科技产业金融对接活动（工业软件方向）在2025南京软件大会期间举办。本次活动由南京市工业和信息化局、南京江北新区管理委员会共同

中石化召开集中整治违规吃喝推进会

微信公众号【石油快讯】 6月16日，中国石化集团公司以“现场+视频”形式召开警示教育会暨集中整治违规吃喝推进会。集团公司党组书记、董事长马永生主持并讲话。集团公司总经

上滑加载更多 ↓

红杉中国正式开源AI基准测试xbench评测集

刚刚，豆包AI播客上线：8万字文档秒变节目，语气词和停顿都像人

乐信众联取得一种数据处理方法及系统专利

京东CEO许冉：全职外卖骑手五险一金成本并非巨大到不可承担

“AI赋能数字公共治理研讨会暨系列数智成果发布会”在深圳召开

顺利贯通！新线建设进展+2！

伊顿智能动力取得用于致动元件保护套环专利

中航西飞获得发明专利授权：“一种压敏漆荧光光强的实验数据拟合方法”

因技术故障等原因，印度航空取消至少5架次波音机型国际航班

青海发布双万兆5G-A及“AI+政企融智”创新产品

足球赛、种植牙、药店无人值守......感受机器人产业的创新发展

民生证券：在跨境支付中使用稳定币替代传统跨境支付的趋势或将持续推进

兰州高新区街道联合招行高新支行开展党建共建活动

国际油价持续走强，能源化工ETF、标普油气ETF早盘涨约2%

南京江北新区定向设立3亿元基金用于工业软件核心技术攻关

中石化召开集中整治违规吃喝推进会

津媒：中国女足实力比赴美拉练有所提升，体现对东亚杯高度

2025中国网球巡回赛太原公开赛收官

柏林站第一轮中国金花一人晋级一人退赛，郑钦文收到了好

免签“朋友圈”持续扩容，“中国游”带火“中国购”

中斯马旅游论坛举行泉州成上台推介的唯一中国城市

微网云科技取得全闪存服务器专利

道通科技获得发明专利授权：“毫米波雷达测试系统及方法

月之暗面开源Kimi72B模型，超越DeepSeek R1登顶全球第一

掌阅科技：短剧《遮天》定档6月20日或开AI与真人实拍深

华裔天才少年成百亿富翁，曾献计特朗普，阻止中国AI技术抢