阿里达摩院在机器视觉问答VQA榜单中首次超越人类

8月12日消息,在国际权威机器视觉问答榜单VQA Leaderboard上,阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。

阿里达摩院在机器视觉问答VQA榜单中首次超越人类


今年6月,阿里达摩院在VQA 2021 Challenge的55支提交队伍中夺冠,成绩领先第二名约1个百分点、去年冠军3.4个百分点。此次达摩院再次以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。

据了解,VQA是AI领域难度最高的挑战之一。在测试中,AI需根据给定图片及自然语言问题生成正确的自然语言回答。这意味着单个AI模型需融合复杂的计算机视觉及自然语言技术:首先对所有图像信息进行扫描,再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息,最后根据常识及推理回答问题。

阿里达摩院在机器视觉问答VQA榜单中首次超越人类

阿里达摩院在机器视觉问答VQA榜单中首次超越人类

值得一提的是,这不是阿里达摩院第一次在AI关键领域超越人类基准。2018年,达摩院曾在斯坦福SQuAD挑战赛中历史性地让机器阅读理解首次超越人类,引发海外媒体关注。

今年以来,达摩院在AI底层技术领域动作频频,先后发布了中国科技公司中首个超大规模多模态预训练模型M6及首个超大规模中文语言模型PLUG,并开源了历经3年打造的深度语言模型体系AliceMind,其曾登顶GLUE等六大国际权威NLP榜单。

阿里达摩院在机器视觉问答VQA榜单中首次超越人类


作者:林辰

展开阅读全文

页面更新:2024-03-01

标签:达摩   阿里   斯坦福   基准线   视觉   人类   机器   自然语言   准确率   基准   百分点   模型   图像   问答   领域   财经   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top