
1月10日,由清华大学基础模型北京市重点实验室发起的AGI-Next前沿峰会成功举办。多位学者和创业者们齐聚一堂,围绕大模型技术创新、产业发展路径等核心议题深入交流。与会专家表示,2025年中国开源模型表现亮眼,在多个国际榜单上,前五名开源模型均来自中国,展现了中国在开源领域的实力。
峰会上,月之暗面Kimi创始人、CEO杨植麟分享了团队在模型优化上的重要成果,“我们围绕Token效率和长上下文两个核心方向发力,自主研发的MUON二阶优化器,能让模型用50%的数据就达到同等测试效果,相当于把训练效率提升了一倍”。其团队推出的kimi K2模型作为中国首个Agent模型,已能完成两百步工具调用,在核心测试中展现出比肩国际前沿的性能。杨植麟还介绍了kimi Linear架构,“它解决了传统线性注意力在长任务上效果不佳的问题,在短程和长程任务上都比全注意力表现更好,速度还能提升6到10倍”。
清华大学教授、智谱创始人唐杰以“让机器像人一样思考”为主题,分享了智谱在可验证强化学习、多模态技术等领域的进展。“我们把Coding、推理、Agent能力整合在一起,让模型不仅能聊天,还能真正帮人做事”,唐杰介绍,团队开源的AutoGLM模型上线后三天就收获一万多个star,“这个9B规模的模型能快速完成复杂任务,比如帮用户订高铁票、整理景点信息,后台只需执行40步操作就能搞定”。
圆桌对话环节,专家们围绕产业分化、新范式探索等话题展开讨论。腾讯首席AI科学家姚顺雨表示,AI行业已呈现清晰的分化趋势,“To B领域里,智能度越高的模型越受青睐,很多企业愿意为优质模型支付溢价;To C场景则更注重场景化体验,额外的上下文输入能给用户带来更多价值”。阿里巴巴集团通义千问大模型负责人林俊旸认为,AGI发展应顺其自然,“无论是To B还是To C,核心都是解决真实问题,让人类世界变得更好”。加拿大皇家学院院士、香港科技大学荣休教授杨强认为“开源模式让知识和技术快速流动,尤其是在医疗、金融等领域,通用大模型与本地小模型的协作会越来越普遍”。
关于未来发展,姚顺雨表示,中国团队在工程落地和局部创新上优势明显,“只要解决算力和市场环境等问题,再增加一些前沿探索的冒险精神,中国完全有机会诞生全球领先的AI公司”。唐杰表示,2026年将聚焦全新模型架构创新、多模态感知等方向,“我们希望通过技术突破,让AI能完成更长时效的任务,真正成为人类的好帮手”。杨植麟说,“未来十年、二十年,我们会持续迭代模型,让AI成为探索未知世界的钥匙,助力人类攻克更多难题”。
文/北京青年报记者 温婧
编辑/北京青年报记者 朱开云 实习生 王恋齐
更新时间:2026-01-12
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号