阿里达摩院在机器视觉问答VQA榜单中首次超越人类

8月12日消息，在国际权威机器视觉问答榜单VQA Leaderboard上，阿里巴巴达摩院以81.26%的准确率创造了新纪录，让AI在“读图会意”上首次超越人类基准。

今年6月，阿里达摩院在VQA 2021 Challenge的55支提交队伍中夺冠，成绩领先第二名约1个百分点、去年冠军3.4个百分点。此次达摩院再次以81.26%的准确率创造VQA Leaderboard全球纪录，首次超越人类基准线80.83%。

据了解，VQA是AI领域难度最高的挑战之一。在测试中，AI需根据给定图片及自然语言问题生成正确的自然语言回答。这意味着单个AI模型需融合复杂的计算机视觉及自然语言技术：首先对所有图像信息进行扫描，再结合对文本问题的理解，利用多模态技术学习图文的关联性、精准定位相关图像信息，最后根据常识及推理回答问题。

值得一提的是，这不是阿里达摩院第一次在AI关键领域超越人类基准。2018年，达摩院曾在斯坦福SQuAD挑战赛中历史性地让机器阅读理解首次超越人类，引发海外媒体关注。

今年以来，达摩院在AI底层技术领域动作频频，先后发布了中国科技公司中首个超大规模多模态预训练模型M6及首个超大规模中文语言模型PLUG，并开源了历经3年打造的深度语言模型体系AliceMind，其曾登顶GLUE等六大国际权威NLP榜单。

作者：林辰

展开阅读全文

页面更新：2024-03-01

标签：达摩阿里斯坦福基准线视觉人类机器自然语言准确率基准百分点模型图像问答领域财经技术

1 2 3 4 5

阿里达摩院在机器视觉问答VQA榜单中首次超越人类

马斯克嘲笑贝索斯的月球着陆器

亚马逊员工吐槽线下复工计划呼吁永久性远程办公

前7月全国快递业务量累计完成583.3亿件，同比增长42.9%

爱回收第二季度GMV达78亿元营收同比增56.2%

贝索斯旗下蓝色起源起诉NASA 抗议将登月合同授予SpaceX

滴滴上线试行“司机收入报告”

消息称抖音实现点外卖功能

腾讯回应微信刷掌支付：仅为内部技术预研无应用计划

58同城金融科技人才报告：IT互联网行业需求、求职热度双高

阿里巴巴公布二季度13F持仓哔哩哔哩仍为其最大持仓股

eBay第二季度营收27亿美元净利润同比下降57%

FDA紧急召回eBay平台上含有西布曲明的减肥药物

亚马逊AWS获得美国国家安全局授予的百亿美元秘密合同

国家统计局：1-7月全国网上零售额超7万亿元，同比增长21.9%

快手：“夺金特卖季”活动期间体育用品销量上涨超6倍

腾讯回应微信刷掌支付：仅为内部技术预研无应用计划

阿里巴巴公布二季度13F持仓哔哩哔哩仍为其最大持仓股

消息称阿里预研电商轻应用产品“快买”

全球最大主权基金持仓公布：阿里退出十大重仓

阿里巴巴张阔：高质数字化服务贸易体系正在形成

阿里妈妈发布“万相台”

小米汽车落户北京注册地为北京经济技术开发区

阿里巴巴联合农业农村部启动2021丰收节金秋消费季

崔东华：打破技术封锁，解决拦截导弹难题，为战舰穿上“铁布

世界上首个人类文明——苏美尔文明的起源和发展