小米AI实力再次得到验证，声音识别算法能力居国际前列

近日，小米自研声音识别算法取得最新进展，算法模型领先其他机构，性能国际排名中拔得头筹。小米是在 Google 发布的 AudioSet音频标记任务中获得的这一突破。

Google 将 AudioSet 数据集分为三个子集，前两个子集用于训练，被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中，小米的声音识别算法模型在业界突破了50 mAP，刷新了音频标记技术指标。此外，小米还发布了一个 Mini 版模型，适合资源受限的场景。

这项技术的突破意味着小米的声音识别算法能力再次突破，在小米的众多智能硬件设备应用此项技术后，可以更敏锐地捕捉和识别环境声音，大幅提升硬件的智能化程度，从而为用户创造更加便捷的智能生活体验。

与此同时，小米声音识别算法下的音频标记技术能力，有力推动了业界前沿研究的相关研发进程。

小米此次精进后的声音识别算法，它能够广泛应用于小米的智能设备中。音频标记算法能够识别广泛的环境声音，比如婴儿的啼哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等，并让环境中的声音以文字等模态表达，让声音被“看”见。这可以让硬件设备更加智能，为用户带去更高效和更准确的声音识别体验。

目前，小米手机中的“小米闻声”可以监测 14 种重要的环境音，包括火警、婴儿啼哭、烧水壶声等，并以手机通知栏进行文字推送。有效的帮助了听障人士生活，小米手环也可以同步显示和接收这样的声音信息。

这项算法在智能家居设备上的应用则更加广泛。当前，小米的声音识别算法已经应用于众多的智能家居设备中，比如米家摄像头的宝宝哭声监测功能，它能在监测到宝宝哭声的时候，实时向用户手机推送通知。Xiaomi Sound 音箱也搭载了声音识别功能，它能够识别家用报警器、婴儿啼哭、火警、流水、猫叫、狗叫等六种用户关心的家居环境声音。小米健康 APP 的睡眠鼾声监测，则可以帮助跟踪用户睡眠时的鼾声梦话。

为了更好的发挥这项算法的潜力，小米通过其 AIoT 平台生态，为这项算法技术的应用提供了广阔的空间。目前，小米的声学语音团队已将自研声学语音技术全面应用于小米手机、音箱、电视、耳机、手表、机器人等 79 个品类，共计 5000多款智能产品中。

而在声音识别算法所属的人工智能领域，小米更是积极投入其中，作为小米长期持续投入的底层赛道之一。据悉，小米自2016年组建AI团队以来，人工智能团队经过7年6次扩展，人员规模已达3000多人。同时，小米 AI 技术能力也已经覆盖了视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态等众多方向，并全面赋能了手机、汽车、AIoT、机器人等众多业务板块。今年4月，小米正式组建了 AI 大模型团队，全面拥抱大模型，目前陆续有了一些应用尝试。其中第一个应用大模型，就是将智能语音助理小爱同学升级了大模型版本，并开启邀请测试。

展开阅读全文

页面更新：2024-05-08

标签：小米算法声音声学前列标记模型实力能力智能用户设备国际技术

1 2 3 4 5

小米AI实力再次得到验证，声音识别算法能力居国际前列

黄河流域最大水电站一一青海拉西瓦水电站正式转入生产运行阶段

聚焦创新应用和城市治理，来看这个大数据创新应用竞赛给出的方案

超级杂交稻、北斗卫星…湖南科技创新展陈中心有这些亮点！

350万vs110万，首回合打响，短期内华为仍难撬动苹果高端市场份额

又是智商税？卖6499元的二代 Apple Watch Ultra，到底值不值得买？

西南地区首座大型抽水蓄能电站开始带电调试

北京文化论坛｜王志鸥：科技艺术打造中国文化记忆

2023年重庆网络安全宣传周信息通信行业在行动

安徽科大讯飞等成立数智科技公司，含建筑智能化系统设计业务

云上护航，让企业数字化行稳致远

基金委查处8起学术不端案件，引发社会关注和讨论

报告：教师是未成年人最偏好职业，网红等职业受追捧程度下降

朝鲜女主播一句话，让韩国人血压升高，莫名的优越感，不该再有了

纽约时装周第二波：刘雯瘦脱相，龚俊排场大，何穗孙怡扛住了镜头

80年代的天才童星方超，因身高被电影学院拒收，后遇贵人成功转型

安徽科大讯飞等成立数智科技公司，含建筑智能化系统设计

国际足联：2030年男足世界杯计划将在三大洲六国举行

张家口第一县争夺战：怀来与张北，到底谁更有实力问鼎？

周鸿祎：大模型为文化产业发展带来新机遇

祥鹏航空正式复航昆明=曼谷国际航线

俄美宇航员成功对接国际空间站，太空合作助推国际关系

华为首款智能金表亮相引领智能手表新潮流

俄“联盟MS-24”载人飞船与国际空间站对接

成都10月将再添一条国际航线，2小时飞越南河内

江苏一县级市，由泰州代管，面积并不大，实力却强得“过分”