从"抽风"到"稳健"，TACO框架如何给机器人VLA模型装上"稳定器"

机器人干活时突然"手抖"？最近VLA模型推理不稳定的问题让不少研究者头疼。

明明是同一个模型，微调完了干活，就因为初始参数有点小波动，成功率能从0%蹦到80%，这种"薛定谔的成功率"谁受得了。

要说这问题有多普遍，搞机器人具身智能的同行怕是最有体会，你让模型去抓个杯子，有时候稳得像老师傅，有时候能把杯子直接挥到地上。

这种不确定性，直接让不少VLA模型没法走出实验室。

这时候中国电信、清华、中科大的团队站出来了，他们搞出个TACO框架，专门治VLA模型的"手抖病"。

这框架一出来，业内不少人都觉得眼前一亮，毕竟这可是困扰大家好久的老大难问题。

VLA模型为啥总"走神"？

要说这背后的原因，还得从模型训练的两个阶段说起，VLA模型刚开始预训练时，就像厨师进了菜市场，啥都学一点，煎炒烹炸炖全会。

可到了微调阶段，相当于突然让他专攻川菜，问题就来了。

预训练时吸收的那些五花八门的动作模式，就像脑子里存了太多菜谱，微调时根本来不及彻底"格式化"。

结果就是干活的时候，模型时不时蹦出些不相关的动作，比如炒川菜呢突然来了个法式煎鹅肝的手法，不乱才怪，更麻烦的是微调数据集这摊子事。

这些数据往往来自不同的操作员，有人习惯左手拿勺，有人喜欢右手颠锅，甚至还有人喜欢边炒菜边抖腿。

模型学了这么多风格迥异的"武功秘籍"，最后练出来的可能就是套"四不像"拳法，举个例子就明白了。

你让模型学做鱼香肉丝，结果训练数据里混着十个人的做法，有人先放糖有人先放盐，有人勾芡厚有人勾芡薄。

模型学完了，下次做的时候可能这次按张师傅的路子来，下次又模仿李师傅的手法，味道能稳定才怪。

给机器人装个"稳定器"

中国团队搞出来的TACO框架，思路其实挺反常识的，一般解决模型不稳定，大家都想着从训练阶段下手，他们偏不，直接在推理阶段做文章。

这种"不修改模型参数"的思路，说实话刚开始我还捏把汗，没想到效果这么好，核心秘诀就在于"反探索"原理。

一般模型推理时喜欢尝试新动作，TACO偏要让它"保守"点，就像老司机开车，遇到复杂路况不会随便变道，而是盯着前车尾灯保持安全距离。

TACO让模型推理时只在已知的成功模式里选动作，不乱"创新"，Test-TimeScaling（TTS）这招确实聪明。

它不碰模型的"大脑"，只在输出结果时加个"过滤器"，就像给模型配了个经验丰富的老师傅，不管模型脑子里多混乱，老师傅总能挑出最靠谱的那个动作执行。

这种"不动内核只调输出"的做法，既安全又高效，耦合伪计数估计器这玩意儿，说穿了就是让模型自己当自己的"裁判"。

团队在VLA模型最后加了个轻量级的Coin-FlippingNetwork，专门判断当前动作靠不靠谱。

本来想单独训练个验证模型，后来发现直接让VLA自己验证自己更省事，还省了不少计算资源，高保真特征搜索的操作也挺巧妙。

他们让模型用不同噪声水平跑N次，然后挑个最接近成功案例的结果。

这就像学生考试遇到不会的题，先在草稿纸上多算几遍，哪个答案出现次数多就选哪个，正确率自然高。

从实验室到生产线的跨越

模拟环境测试的时候，TACO框架的表现就让人眼前一亮，在RoboTwin基准测试里，模型成功率一下子提了不少，Simpler-WindowX测试里也有明显进步。

最让人惊讶的是LIBERO-long终生学习测试，在已经很高的成功率基础上还能再往上提一提，真实机器人实验更有说服力。

他们用RealMan75双臂机器人做了五个常见任务，接收书籍、收纳充电器、整理纸和笔、操作笔记本电脑，还有同时拿两本书。

本来平均成功率也就四成，用上TACO框架后直接冲到五成六，要说哪个任务进步最明显，整理纸和笔那个活儿提升了足足四分之一，笔记本电脑操作也提高了一成五。

有个细节挺有意思，之前机器人拿笔记本电脑老怕捏坏了不敢用力，现在能稳稳抓住边缘，开合屏幕也不会晃悠了。

这框架最难得的是不挑模型，不管你是flow-matching还是diffusion架构的VLA模型，都能直接用。

而且加的这些模块都特别轻巧，不会给机器人增加多少计算负担，实时控制完全没问题，如此看来，TACO框架不光解决了稳定性问题，还指明了一条新路子。

以后搞VLA模型，可能不用老想着从头改网络结构了，在推理阶段动动脑筋说不定更有效。

中国团队这次的创新，确实给机器人具身智能领域提了个醒，有时候解决问题的钥匙，可能藏在你没想到的地方。

现在不少实验室已经开始试用水TACO框架，有人开玩笑说这下机器人终于不会"间歇性抽风"了。

从实验室到工厂车间，VLA模型要走的路还长，但TACO框架至少让我们看到了突破瓶颈的希望。

说不定过两年，我们身边的服务机器人，背后都藏着这个"稳定器"呢。

展开阅读全文

更新时间：2025-12-29

标签：科技稳健机器人框架模型稳定成功率老师傅阶段动作笔记本电脑实验室团队

1 2 3 4 5

政企携手搭平台共绘人工智能产业发展新蓝图

12月24日，乌鲁木齐市“人工智能+场景应用”政企对接会议在新疆软件园举办。此次会议由乌鲁木齐市数字化发展局主办，乌鲁木齐经济技术开发区（头屯河区）数字化发展局、新疆软件园

牵手节卡机器人，建霖家居旗下阿匹斯将转型智能机器人公司

12月25日，建霖家居（603408.SH）在一场签约仪式上透露，旗下全资子公司厦门阿匹斯智能制造系统有限公司（下称：阿匹斯）将向智能机器人公司转型，专注于机器人智能化升级及应用场景落地研

世界级突破！中国能建数科集团发布人工硐室储气库系统解决方案

华声在线12月25日讯（记者谢璐摄影范远志）今天，中国能建数科集团在长沙市望城区发布人工硐室储气库系统解决方案。该集团在日前圆满完成大型人工硐室储气原位试验，成功实现世

手机如何用“物理魔法”挑战单反的变焦霸权？

你是否曾疑惑，为什么专业摄影师总是扛着笨重的单反相机，而手机摄像头明明看起来只有一个小点，拍照效果却越来越惊人？当你想拍清远处风景时，手机屏幕上“放大”的滑块，和单反镜头“

夸克AI眼镜G1首销，1999元起

IT之家 12 月 26 日消息，阿里旗下夸克 AI 眼镜现已在京东开启首销，其中 G1 风尚眉框款最低到手价 1999 元，而续航套装定价为 2297 元（加配换电仓 / 电池 x1）。夸克 AI 眼镜 G1 可

“卫星锅”为何被禁止？它到底能看见什么？原来大家都小看了它

普及兴起话当年卫星锅在中国农村那可是老一辈人记忆里的宝贝。从上世纪八十年代末开始，它就慢慢冒头了，当时电视信号覆盖还不广，尤其是偏远地方，很多人家连个清晰频道都收不到。

白銀期貨202526

白银期货深度分析：供需失衡与工业革命双轮驱动的历史性行情一、价格现状：狂飙突进的"白银之年"最新价格：截至2025年12月25日，国际现货白银突破70美元/盎司，创历史新高；沪银主力合

中国决心已下，说什么也不买了，白宫后知后觉，转头宣布对华加税

前言这不就是“强买强卖”吗？12月8日，已重返白宫的特朗普突然祭出了一招看似大度的“解禁令”。那就是允许顶尖芯片巨头英伟达，向中国出口备受瞩目的H200芯片。但可熟悉特朗普

12月26日（25日收盘）成品油调价预估上调（第1轮第4个工作日）

离岸人民币兑美元汇率升破7大关，为2024年9月以来首次，年内累计升值超4.5%。2026年第一轮的第4个工作日，国际原油综合估价58.693美元/桶，相较于基准价+1.74美元/桶或+3.06%，对应涨

每周要闻 | 2025年12月15日—2025年12月22日要闻汇总

一、南亚1.印度泄洪引发巴基斯坦严重水危机12月19日，印度未提前通报开启印控克什米尔萨拉尔大坝闸门泄洪，导致巴基斯坦旁遮普省杰纳布河水位急剧上涨，堤坝决口、村庄受淹。巴方

广东汕头乘风而起向未来

汕头海域的海上风电场。（资料图片）近日，来自近30个国家和地区的能源领域各界代表齐聚广东汕头，参加第二十二届世界风能大会，共议风电前沿技术，解锁全球“潜力市场”机遇，探寻中国风

股民提前坐稳扶好，下周这一周，行情可能会迎来更大级别变盘！

刚经历市场直线跳水的惊魂时刻，持仓个股从红盘翻绿、盈利瞬间蒸发，还没等缓过劲来，又要面对下周可能到来的更大级别变盘——想加仓怕探底未完，想减仓又怕踏空突破，持仓不动又担心

快讯：现货白银首次突破74美元/盎司

来源：市场资讯快讯：2025年12月26日，现货白银首次突破74美元/盎司，日涨幅扩大至3%。

京奕绿能开业，60亿加码绿色高端涡流纺

2025年12月23日，江苏京奕绿能新材料科技有限公司在江苏射阳港经济开发区零碳产业园开业，标志着其在绿色高端涡流纺新材料领域的关键布局正式启航。京奕集团负责人介绍，作为集团

没有看跌的因素！明年黄金牛市延续2026年黄金价格将突破5000美元

近期黄金价格持续上涨，12月24日现货黄金强势突破4500美元，并触及到4525.7美元的历史高位，虽然在圣诞前夕，部分投资者获利了结，黄金价格出现下跌，现货黄金回落至4480美元附近。但分

上滑加载更多 ↓

从"抽风"到"稳健"，TACO框架如何给机器人VLA模型装上"稳定器"

VLA模型为啥总"走神"？

给机器人装个"稳定器"

从实验室到生产线的跨越

政企携手搭平台共绘人工智能产业发展新蓝图

牵手节卡机器人，建霖家居旗下阿匹斯将转型智能机器人公司

世界级突破！中国能建数科集团发布人工硐室储气库系统解决方案

手机如何用“物理魔法”挑战单反的变焦霸权？

夸克AI眼镜G1首销，1999元起

“卫星锅”为何被禁止？它到底能看见什么？原来大家都小看了它

白銀期貨202526

中国决心已下，说什么也不买了，白宫后知后觉，转头宣布对华加税

12月26日（25日收盘）成品油调价预估上调（第1轮第4个工作日）

每周要闻 | 2025年12月15日—2025年12月22日要闻汇总

广东汕头乘风而起向未来

股民提前坐稳扶好，下周这一周，行情可能会迎来更大级别变盘！

快讯：现货白银首次突破74美元/盎司

京奕绿能开业，60亿加码绿色高端涡流纺

没有看跌的因素！明年黄金牛市延续2026年黄金价格将突破5000美元

牵手节卡机器人，建霖家居旗下阿匹斯将转型智能机器人公

千方科技2025年中期现金分红预案：拟10派0.2元

情绪越稳定，成绩越好。

科普南阳丨“塑料瓶变冬衣”：是黑科技还是智商税？

你若相信，必能看见：哺育中国科技创新力量的鸿蒙布道师们

中国卫通、烽火通信、金风科技、北斗星通，谁是商业航天

中国气象局气候变化检测与应对重点创新团队：三年攻坚

基金：机器人板块下跌，要不要出来观望

山东蜜獾不敌安徽皖江龙：从“单打狂欢”到“团队迷失”

中传景创团队考察汉川市汈汊湖国家湿地公园共商湿地

从&quot;抽风&quot;到&quot;稳健&quot;，TACO框架如何给机器人VLA模型装上&quot;稳定器&quot;

VLA模型为啥总"走神"？

给机器人装个"稳定器"

从实验室到生产线的跨越

从"抽风"到"稳健"，TACO框架如何给机器人VLA模型装上"稳定器"