“智算中心”,还没有这个板块!



什么是智算中心?


简单理解就是人工智能计算中心,是指专门服务于人工智能的数据计算中心,由AI芯片和算力机组等设备组成,企业和研究机构可以依托智算中心提供的强大算力,驱动AI模型进行数据深度加工。就像工业时代工厂离不开高效集中供电,追求高度智能化产品的企业自然离不开高效的算力供应。没有高效率的人工智能算力,企业差异化竞争就很难出现,21世纪看数据,数据变现的价值就是算力推动数据转化成为利润,最有效的算力就是AI的人工智能算力,所以是智算中心


相比传统数据中心,智算中心能满足更具针对性的需求,以及更大的计算体量和更快的计算速度。目前我国的智算中心基本采用了高标准建设,100P算力是起步目标,该算力大约相当于5万台高性能电脑。建设智算中心相当烧钱,属于典型的高投入高产出。例如,作为生成式AI的代表,ChatGPT的训练过程完美演绎了智算中心的应用模式,微软专门为其开发者Open AI打造了超级计算机,拥有28.5万个CPU和1万个GPU,供Open AI在上面训练所有的AI模型,训练一次成本约为1300万美元。这也意味着,智算中心建设对软硬件的要求更高,地方政府背后的AI和ICT企业将扮演重要角色,华为、腾讯、曙光、浪潮信息、商汤科技等企业均已深度参与这个未来非常有前景的方向


发展前景


随着智能推荐,自动驾驶,智能制造等领域发展迅速,先进AI模型对算力的需求仍在倍数级增长。国家信息中心的上述报告预测,未来5年中国智能算力规模年复合增长率将超过50%。行业的增速非常迅速,因为算力对经济的拉动作用和产业升级非常明显


《指南》对投资智算中心的经济效益进行了测算。“十四五”期间,在智算中心实现80%应用水平的情况下,城市对智算中心的投资,可带动人工智能核心产业增长约2.9倍-3.4倍、带动相关产业增长约36倍-42倍。这是为什么目前全国有超过30个城市正在建设或提出建设智算中心,而且这些城市都是万亿级别俱乐部成员或者是发展速度非常快的城市的原因。因为智算对人工智能产业的带动是1:3,相关产业1:40,这个帐都会算,发展智算中心是人工智能产业升级的基础,这个基础有了,产业的杠杆撬动作用就来了,能够起到很好的吸虹效应


新型拓扑


智算中心网络通常采用CLOS架构,主要关注通用性,无法满足超大规模超算场景下低时延和低成本诉求,业界针对该问题开展了多样的架构研究和新拓扑的设计。直连拓扑在超大规模组网场景下,因为网络直径短,具备低成本、端到端通信跳数少的特点


IPV6 演进


IPv4 协议地址已经枯竭,所有运营商不能再申请到公网 IPv4 地址池。这将促使为移动终端和固定终端申请 IPv6 地址,以支撑各种业务的开展,实现万物互联和智能连接


智算中心间网络连接


更多的新型计算任务需要依赖“横向互联”和“纵向延伸”的多智算中心协同完成,智算中心之间的长距连接成为影响业务性能的关键。为了应对超长距传输的挑战,满足高性能算力互连要求,目前业界的研究方向有全光网络直连、广域确定性承载网络、智算中心与承载网智能协同,空心光纤等。引入空芯光纤,不仅可以实现容量距离积的大幅提升,更可大幅降低约1/3 的传输物理时延、并提高时间确定性,为构建低时延时间保证光互联网络提供基础支撑能力


自适应路由


目标是提升整网的有效吞吐,以及网络韧性,能够快速感知网络链路负载状态变化,识别出关键拥塞路径,快速调整网络转发路径,做到毫秒/亚毫秒级别的链路快速切换,动态选择轻载链路进行转发,满足超高性能网络的可靠性要求


端网协同流控


由于网络中流量的随机性以及路径的多样性,拥塞的出现不可避免。需要一种新型的端网协同的拥塞控制算法,网络提供的更精细信息以及更主动的控制,端侧更精准的调控速率,实现满带宽、低时延、快速收敛、公平性优等目标,有效提升网络的传输效率,保障大规模分布式 AI 任务的高效完成


在网计算


算力需求的爆炸式增长促进了计算产业的繁荣,数据中心网络带宽增长速度远远落后于算力增长。因此,两者之间的差距鸿沟,需要系统级的网络-应用协同设计才能跨越。近年来,随着可编程交换机的兴起和部署,利用在网计算压缩数据流量,提升计算传输效率成为一个有效的提升分布式系统的方法


DPU


DPU 作为一种新型可编程异构计算处理器,为高带宽、低延迟和数据密集型新型智算场景提供计算引擎,与 CPU 和 GPU 一起成为智算中心的三大支柱


智能ECN


智算中心网络同时承载计算、存储和管理等多种业务流量。不同业务追求目标不同,对网络的诉求不同。结合了 AI 算法的无损队列智能 ECN 功能可以根据现网流量模型进行 AI 训练,对网络流量的变化进行预测,并且可以根据队列长度等流量特征调整 ECN 门限,进行队列的精确调度,保障整网的最优性能




部分公司



易华录易华录从2016年起启动数据湖战略,探索政务大数据的全生命周期运营服务,目前在全国范围内成立了32个数据湖。这些数据湖在一定意义上都是城市的智算中心


浪潮信息浪潮信息的智算中心已在多个区域的核心城市与枢纽节点投建、投运,极大地促进了区域智能产业集群打造、智能创新加速和智能服务公共化。其中,宿州市与浪潮信息共同建设的淮海智算中心,采用全球领先的“E级AI元脑”智算架构,可提供超强性能。而今年启动建设的青田元宇宙智算中心,将成为国内首个算力、算法、开发平台一体化的新型元宇宙基础设施,可为数亿用户提供实时同步和持续有效的交互体验


紫光股份公司在智算中心方面也有充足的技术储备。“目前,紫光股份正在面向用户模型从‘练习-推理-应用’的整个生命周期,从MLOps、数据管理、弹性管理、异构算力四大能力入手,研究布局具备更快数据读取速度和更强训练算力的智算中心解决方案


中科曙光曙光的“5A级”智算中心建设方案已在广东珠海、安徽合肥、浙江桐乡等地陆续落成


商汤科技人工智能计算中心已在2022年1月启动运营

展开阅读全文

页面更新:2024-05-20

标签:曙光   中心   人工智能   板块   流量   模型   智能   产业   数据   城市   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top