人工智能盛宴：阿里开源领先全球的AI——语言模型体系AliceMind

据悉，阿里巴巴达摩院已正式开源深度语言模型体系AliceMind。

历经三年研发，AliceMind从通用语言模型StructBERT的基础上，拓展到多语言、生成式、多模态、结构化、知识驱动等领域，能力全面；先后登顶GLUE等六大AI权威榜单，6月还入选了2021世界人工智能大会最高奖SAIL奖TOP30榜单。

达摩院相关负责人表示，希望通过开源来降低业界研究和创新应用的门槛，助推语言AI进入大工业时代。

自然语言处理（NLP）被誉为AI皇冠上的明珠，传统NLP模型制作复杂，耗时耗力，且用途单一，难以复用，犹如手工作坊。

但近几年兴起的预训练语言模型，正在改变局面，有望让语言AI走向入可规模化复制的工业时代。如果用炼钢来类比，以前要获得一个可用的NLP应用模型，要从铁矿石开始炼钢，周期长，费用高，产量低；但现在有了开源的预训练语言模型，相当于有了现成的粗钢，只需要把粗钢炼成所需的特定钢材，效率大为提升。

据介绍，达摩院深度语言模型体系AliceMind，包括通用语言模型StructBERT、多语言VECO、生成式PALM、多模态StructVBERT、结构化StructuralLM、知识驱动LatticeBERT、机器阅读理解UED、超大模型PLUG等，此次大部分已开源。（请访问github.com的/alibaba/AliceMind）

AliceMind先后登顶了GLUE Benchmark、多语言XTREME在内的六大权威AI榜单，上周再次登顶的多模态权威榜单VQA Challenge 2021，类似看图问答，给定一张图像和关于图像的自然语言问题，AI需要提供准确的自然语言答案。

AliceMind战胜了微软、Facebook等几十家国际顶尖团队，将纪录从去年第一名的76.36%显著提升到79.78%，接近人类水平（80.78%）。霸榜背后，是AliceMind持续创新和进化。

达摩院团队在BERT基础上提出优化模型StructBERT，2020年多次在NLP顶级赛事GLUE Benchmark上夺冠。该模型通过在句子和词级别引入两个新的目标函数，好比给AI装上“语法识别器”，在面对语法错乱时，AI依然能准确理解并给出正确回应，大大提高机器对语言的整体理解力。

而此次在VQA Challenge 2021登顶的多模态模型StrucVBERT，融合了通用模型StructBERT和结构化模型StructuralLM，同时引入文本和图像模态，利用更高效的视觉特征和创新的注意力机制在统一的多模态语义空间进行联合建模。

据了解，AliceMind掌握语言超过100种，具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力，目前已成为阿里的语言技术底座，日均调用量超过50亿次，活跃场景超过200个，已在跨境电商、客服、广告等数十个核心业务应用落地。在阿里之外，AliceMind广泛运用于医疗、能源、金融等多个行业。

其中，浙江电网公司以AliceMind为底座为员工构建智能化运维平台，应用于变压器检修、供电抢修等业务，已经开始在国家电网公司统一推广。

阿里达摩院深度语言模型团队负责人黄松芳表示，“预训练语言模型已成为NLP领域的基石和原材料，AliceMind开源将降低NLP领域研究和应用创新的门槛，助推行业从手工业时代走向大工业时代。”

小天评论，AI人工智能必然是未来的主要生产力，目前已经在各行各业崭露头角，不仅节省了大量的人力，还提高了效率，科学是第一生产力，人类未来的幸福生活，需要依靠AI的广泛应用。

我是小天方夜谭，尽量分享一些自己看到的信息，希望每篇几分钟即可快速看完，欢迎大家关注，谢谢！

展开阅读全文

页面更新：2024-04-18

标签：阿里人工智能达摩模型语言自然语言底座盛宴门槛语法深度图像团队体系领域权威时代全球财经

1 2 3 4 5

人工智能盛宴：阿里开源领先全球的AI——语言模型体系AliceMind

董明珠8亿退休金落地，放弃另外8亿，持股计划获股东大会审议通过

人类手机通信典藏馆，男子花200万收藏上万部手机，满满的情怀

大众计划2035年在欧洲停售燃油车，中国车厂谁能弯道超车？

死神突降时急救知识能救命，欧洲杯某球员休克倒地，幸得及时施救

清华大学有虚拟学生华智冰后，腾讯带来全球第一位数字美女航天员

特斯拉中国公布28.5万辆Model3和Y召回详情，OTA升级后有哪些变化

欧洲杯意大利淘汰世界排名第一的比利时（2-1）胜利进四强

滴滴快的合并成绝唱，虎牙斗鱼被禁止合并，《反垄断法》一视同仁

中国空间站全中文操作界面和说明，以后拍电影不用翻译是什么区域

Win11将支持安卓应用，WinX又可以洗白成正版了，抢先看新UI动画

广东13省联盟药品集采点评：国采续约品种为主，生长激素未纳入

财经信息汇总（7月9日）

滴滴全网下架，其他网约车开始抢占空白市场！最终结果如何？

财经信息汇总（7月14日）

财经信息汇总（7月19日）

清华大学有虚拟学生华智冰后，腾讯带来全球第一位数字美

财经信息汇总（7月9日）

财经信息汇总（7月14日）

财经信息汇总（7月19日）

财经信息汇总（7月13日）

财经信息汇总（7月20日）

财经信息汇总（7月12日）

财经信息汇总（7月21日）

财经信息汇总（7月15日）

财经信息汇总（7月28日）