深圳市政协委员肖京:设立数字化引导基金,夯实国家级数字化底座|聚焦深圳两会

南方财经全媒体记者 曹媛 深圳报道

中国已成为全球数字化竞争中的一支重要力量。

“目前,中国已经有非常强大的数字化建设基础,硬件方面实力雄厚,数据市场规模庞大,算力算法也在飞速发展。”深圳市政协委员,平安集团首席科学家肖京表示。

据IDC预测,中国智能算力规模将持续高速增长,预计到2026年将达到1271.4EFLOPS。

但放眼全局,国内虽然在数字化基础设施建设方面打下了扎实的基础,但是还建设得较为散乱,缺乏一个能统筹全局的数字化底座,不能形成合力对产业有效赋能。

今年深圳两会期间,围绕提案《设立数字化引导基金,夯实国家级数字化底座》,南方财经对话深圳市政协委员,平安集团首席科学家肖京。肖京长期从事人工智能,大数据相关的研发及应用工作。

“国内数字经济和人工智能发展亟需一个坚实的数字底座。尤其是chatGPT的成功,更加印证了强大数字底座的重要性。”他强调。

缺乏统筹全局的数字化底座

目前缺乏一个能统筹全局的数字化底座,不能形成合力对产业有效赋能。肖京认为,这在产业端具体形成以下几个问题:

企业没有资源或能力构建领先的数字化基础能力。比如算力需求就难以满足。AI模型所需算力一直在飞速增长,需要高性能计算设备等大量前期投入,尤其是近年来大模型已经成为AI发展的重要趋势,对算力的需求将大幅提高,一般企业很难不计回报做这样的投入。

其次,企业技术研发水平参差不齐。肖京介绍称,目前国内领先的龙头企业具备较好的技术能力,而绝大部分中小企业,需要把大部分精力和资源放在开拓市场上,没有太强的技术研发团队。这些企业的数字化建立在低水平的数据、算力基础、及研发技术上,结果就是低质量数字化系统的重复建设,导致大量的资源浪费。

此外,过度依赖国外基础软件工具,进一步抑制自主可控的数字化产业生态。肖京解释称,“由于国产数字化基础软件、工具不及国外同类产品成熟、标准,多数企业选择使用国外软件工具训练、调试数字模型系统,貌似走了捷径,但实际是饮鸩止渴,进一步加剧了对国外软件的依赖,不利于如华为等国产自主可控软件工具的发展壮大,及自主可控数字化产业生态的形成,同时还可能存在法律风险。”

ChatGPT印证强大数字底座重要性

肖京以近期备受关注的chatGPT为例,来印证强大数字底座的重要性。

一方面,ChatGPT单次训练费用高达1200万美元。“在国内,哪怕BAT这样的龙头企业也无力承担如此高昂的成本,更遑论其他独角兽和中小企业。并且各企业小而散的算力能力建设,带来巨大的资源浪费。”他介绍道。

另一方面,ChatGPT在核心理论上并没有突破,而是在工程上“大力出奇迹”的重大突破。ChatGPT的模型优化主要来自于算力的巨幅增加,GPT、GPT-2和GPT-3在算法模型上并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,算力上依托Azure AI超算基础设施(由V100GPU组成的高带宽集群)进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日),此外还有一支专业的标注团队进行标注。

肖京认为,中国在体制,工程化能力,工程技术人员,数据标注能力方面具备优势。

“因此,在未来的大模型浪潮中,我们具有得天独厚的优势。更应该有效利用我们的‘集中力量办大事’的体制优势,加快打造国家级的数字化底座。”他表示。

四方面夯实国家级数字化底座

“目前数字化底层资源整体利用率不足,亟需整体统筹形成合力,同时这些底层通用技术是各行各业数字化的共性需求,也适合整合起来统一赋能各产业的数字化建设”。肖京从机制,算力,数据,算法四方面提出建议。

机制方面,由政府统筹成立数字化引导基金和专门管理机构,统筹建设数字化底座。通过协调各方资源,引导重大科技基础设施、高校及科研院所、头部企业共同参与,集中贡献算力、数据、资金、人才及场景等各方资源,建立共享、共建、共用、共创机制和数字化底座的市场化运营机制,强化通用数字化建设底座的打造。

算力方面,加快推进自主可控的智算中心和智算网络建设,加强算力统筹管理和开放。肖京建议,加快深圳本地智算中心建设和鹏城实验室牵头的中国算力网覆盖,攻坚云网协同、算力度量、算力网络等关键技术,提升算力输出能力,形成巨大算力网络,对算力资源进行有效协同、统一规划。

而在数据方面,由国家统筹数据要素,推动数据资源共享。肖京认为,数据将是在大模型时代的最核心要素,目前国内虽然有很多数据,但可用的数据不多,从主流的训练数据集来看也远低于国外,亟需加强数据建设,把零散数据变成有效的数据资源。

最后,在算法方面,培育自主可控的AI框架底层生态,建设通用算法应用平台,实现普惠应用。“要让算法‘基建化’,才能为全社会及各行各业提供便捷的科学计算服务。”他强调。

更多内容请下载21财经APP

展开阅读全文

页面更新:2024-03-28

标签:底座   深圳   夯实   深圳市   政协委员   全局   中国   算法   两会   可控   模型   自主   能力   基金   数字   产业   基础   数据   资源   企业

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top