AI大模型正解：通用VS垂直？

本报记者秦枭北京报道

作为当前全球科技发展的重要专项，人工智能也是我国的重要战略先导机遇。随着大模型等技术迎来商业化应用，全球各国都在孵化和孕育各类通用的行业大模型。

不过，相较于此前一窝蜂扎进通用大模型，如何基于大模型研发针对行业细分领域的垂直的模型受到更多的关注。当前，已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。

多位业内人士在接受《中国经营报》记者采访时表示，基于算力需求大、训练和推理成本高、数据质量不佳等挑战，未来底座大模型不会有特别多，而相比通用大模型，垂直大模型作为一种全新的生产力，随着其底层能力的不断突破，必然能实现企业的降本增效，带来上层应用的迭代和变革。

多模态大模型角逐

在“ 2023 中关村论坛”上发布的《中国人工智能大模型地图研究报告》显示，当前，中国人工智能大模型正呈现蓬勃发展态势。据不完全统计，截至目前，参数在 10 亿规模以上的大模型全国已发布了 79 个。“出品方”涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司。

但纵观国内的大模型，大多聚焦在语言模型上。

中科院自动化所 “ 紫东太初” 大模型研究中心常务副主任、武汉人工智能研究院院长王金桥对记者表示，“包括ChatGPT、以及国内的大模型基本上都聚焦语言模型，我们认识世界70%的数据是靠视觉，10%靠触觉，其他的靠听觉及其他的信息，要实现低功耗更类人的智能，必须融合多模态的信息。”

不仅如此，高成本、高门槛等问题也制约着大模型在商业场景的落地。百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级，腾讯混元大模型和华为盘古大模型参数量均在万亿级以上，阿里通义千问大模型参数更是在 10 万亿级以上。

王金桥表示：“未来底座大模型不会有特别多，因为底座大模型成本很高、技术门槛也高，底座大模型训练一次基本上要耗费约1000万元的电力的费用，所以不是所有的工作都能承担。国内的很多大模型还是围绕垂直行业的解决方案，模型不大，但是它们有一些行业的核心数据和业务系统的生产数据，所以他们在某些行业有一定的优势，我相信未来一定会是‘底座模型+垂直类’的模型互相融通。”

中国科学院自动化研究所副所长曾大军认为：“现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的方向发展，特别是金融、教育、医疗、交通等领域，大量的工作在试图降低大模型的成本。”

凌迪科技Style3D创始人兼CEO刘郴也认为，不是每个行业都有必要做大模型，对于对于一些企业来说，训练基础模型的成本非常之高，这对于很多企业来说是不现实的。未来大模型往往都是巨头的天下，企业直接使用就可以了，但是行业模型一定要训练，大模型未来会成为整个社会的基础设施，行业模型会成为行业的基础设施。

实际上，部分公司已经意识到这样的问题，在经历过最初的迭代升级，百度、阿里、华为等公司由最初的大模型开发下探到具体的行业应用中。

如中国科学院自动化研究所基于昇思推出的全模态大模型“紫东·太初2.0”定位相当于拥有世界知识的底座模型，通过产业联合体和专家数据在智慧汽车、智能医疗、智能制造、数字政务这四个领域开展应用示范。

共建AI生态

无论是基于自然语言处理、机器视觉、深度学习、强化学习，还是垂直行业模型，并不是互联网大厂们的“玩具”，也不是闭门造车就能完成的工程。

因研发推出ChatGPT而进入聚光灯下的OpenAI，也正因闭源备受争议。马斯克作为OpenAI的创办人之一，近日在社交媒体上炮轰：“OpenAI最初是作为一家开源的非营利性公司而创建的，为了抗衡谷歌，但现在它已经成了一家闭源的营利性公司，受微软控制……这完全不是我的本意。”

OpenAI CEO萨姆·奥尔特曼（Sam Altman）表示，我们未来会有更多开源，但没有具体模型和时间表。

“虽然现在的大模型竞争火热，但无论是OpenAI还是谷歌，都没有护城河，因为‘开源’正在AI大模型领域崛起。”在一份谷歌泄露的文件中，谷歌内部研究人员认为，开源模型或将引领大模型发展的未来，这份文件中提到“开源模型的迭代速度更快，可定制性更强，更有私密性，而当免费的、不受限制的替代品质量相当时，人们不会为受限制的模型付费”。

智源研究院院长黄铁军说道：“大模型产业很难形成垄断，需要共建产业闭环。从长远来看，大模型只是标签，而不是产品、一家公司的工具，所以整个大模型开源开放生态是必然的。”

在国内，大多数人工智能大模型的发展坚持开源创新和生态引导。目前，超过一半国内发布的大模型已经实现了开源。《中国人工智能大模型地图研究报告》显示，北京、广东、上海在开源数量和影响力上均排名前三。高校和科研机构是开源主力，清华大学的chatglm-6b、复旦大学的moss、百度的文心系列大模型在开源影响力上位居三甲。

昇思MindSpore开源社区的理事长丁诚对记者说道：“从开源社区的角度来看，我们是非常希望大模型生态能够互融互通。大模型训练过程当中，数据是非常核心的资产，各家大模型训练能把相关的数据贡献出来做开源共享，是可以集整个产业之力达到中国或者全人类更好的大模型。对于算法的核心资产，目前的确各家都有自己的核心武器，如果大家更开放一点，把这个东西以开源的方式共享出来，在技术上可以互通有无，可以实现更好的大模型为整个产业服务。”

在王金桥看来，业内都认为ChatGPT代表着人工智能的iPhone时刻，可以看到iPhone的生态是闭源的，安卓是开源的，但现在OpenAI的代码、模型、参数都不开放，也不申请专利，今年还迅速涌现非常多的开源开放的模型。“国内有这么多模型，这是依赖于全球开源体系集体智慧的贡献，开源开放才能实现我们的互融共通。而且越来越多的模型会开源开放，更多的模型会加入社区，来适配国产化的硬件，这样才能建立起相当于整个国内开源开放的体系，使我们能够基于中文的单模态或者多模态，实现互助融通的发展。”

（编辑：张靖超校对：翟军）

展开阅读全文

页面更新：2024-05-29

标签：太初模型人工智能底座中国参数未来国内数据行业

1 2 3 4 5

AI大模型正解：通用VS垂直？

中国跨境电商伙伴遍布全球国际跨境支付市场竞争激烈

（国际）第54届巴黎航展开幕

每日蝌学资讯｜中国科大观测到单体量子系统中最强的量子互文性；研究发现胰腺癌化疗耐药新机制

微软亚洲研究院回应撤离中国：不属实

探秘直播电商头部企业的“修炼法则”：坚持内容立身的长期主义

江盐集团：公司食盐产品外贸业务稳步发展，相关产品远销韩国、东南亚等地区

山西大同借首届“专业镇”博览会对接“京津冀”

苏南瑞丽航空股权拍卖落槌：成交价8.047亿元，接盘方仍为无锡国资

庆阳：躬身耕“云”东数西算再提速

国际航班在线值机只有6%免费选座，南航“吃相难看”

“云品甘味”亮相2023中国国际电子商务博览会

上海持续优化“沪惠保”方案两年多累计赔付超11亿元惠及数十万个家庭

招商蛇口以31.6亿元竞得北京丰台区羊坊村棚改地块

200亿控股亏损17亿的企业云南国企是抱了个“金蛋”还是“炸弹”

一季度我国银行办理非现金支付1277.53万亿元

中国跨境电商伙伴遍布全球国际跨境支付市场竞争激烈

每日蝌学资讯｜中国科大观测到单体量子系统中最强的量子

微软亚洲研究院回应撤离中国：不属实

“云品甘味”亮相2023中国国际电子商务博览会

中国首例五胞胎，今年满21岁，母亲坦言：如能重选，我一个也不

好消息！继美光之后，中国再次对4家美企出手，引发美大使不

迷之差距？一代女神，刘亦菲国际舞台放光芒，赵丽颖仍在国内

（体育）足球-国际邀请赛：中国队对阵巴勒斯坦队(6)

（体育）击剑亚锦赛中国队再得两铜

这个秋天如果梅西再次获得金球他的第8次中国之行将