芯片战场丨生成式AI时代 数据中心市场展开新竞赛
- 行业资讯
- 2024-02-03
- 5479
21世纪经济报道记者倪雨晴 深圳报道
随着AI技术演进,算力的竞赛拉开新序幕,芯片厂商正在提供更多元化的AI能力。
“互联网客户和我们合作非常紧密,例如美团,今年采用了第四代至强可扩展处理器支持一些AI推理工作,包括目标识别(Object recognition)或者是计算机视觉(Computer vision)等工作负载。”近日,英特尔数据中心与人工智能集团兼副总裁兼中国区总经理陈葆立在接受21世纪经济报道记者等采访时谈道。
日前,英特尔刚发布了第五代至强可扩展处理器Emerald Rapids,同样强调了AI性能。通过英特尔AMX(新的内置加速器),新产品无需添加独立加速器即可为AI加速,包括对参数量多达200亿的模型进行推理和调优。
当下,英特尔正处于“四年五个制程节点”的进程中,明年也将是发展的重要年份。据介绍,英特尔第一次采用了“双核并进”的路线图设计,同时推出性能核和能效核处理器,对应着Granite Rapids和Sierra Forest这两款产品,以满足不同数据中心需求。
这些都是英特尔AI版图中的重要产品布局,除了英特尔,英伟达、AMD等也在GPU、CPU领域排兵布阵,应对AI崛起后的新一波算力暴增需求。
对于算力趋势,陈葆立谈道:“我们非常看好数据中心市场的蓬勃发展。因为不管是CPU、GPU还是IPU,过去几年每年都有不同火的点,但数据中心整体算力需求始终在增加,需要去解决不同的问题。去年是整个行业缺货,今年一些智算算力的需求是远远大于供给的,这个情况会延续到明年。”
生成式AI为数据中心带来什么?
在今年的云栖大会上,阿里云创始人王坚表示,云计算和GPT的关系就是电和电动机的关系,“有一个非常让人吃惊的数字,可能平时大家不关心,就是全球电动机所消耗掉的电其实占了约50%。”王坚预测,“未来云计算的算力都会被这些在智能时代的电动机、所谓的模型消耗掉。”
这也意味着,以火热的大模型为代表的AI相关算力需求将进一步增长。根据《2022-2023全球计算力指数评估报告》,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元,其中生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。生成式AI计算占整体AI计算市场的比例将从4.2%增长到31.7%。
AI算力的迅猛之势可见一斑,这也将为基础设施数据中心带来新市场和新挑战。在陈葆立看来,AI已经是当今生活不可或缺的一部分,目前十分火爆的大模型是新技术演进,但它绝不是最终形态,极可能继续演进。
同时,他进一步谈道:“AI所需要的算力非常大,这给我们带来了更高的要求,不管是突破硬件的极限,还是创新软件编程的方式。例如,在今年之前,我没有花很多时间去了解网络架构,因为网络架构一直以来都比较平稳,没有问题,但因为AI需要的强大算力,其每一个算力节点之间的网络带宽不够了。”可以看到,AI的到来,也影响着底层设施的升级迭代。
有意思的是,随着AI热潮之下,“数据中心”似乎也有“升级”趋势,近年来各地争相建设“智算中心”、“超算中心”。“四五年前大家还在建设30P、50P算力的HPC(高性能计算)集群,现在都是几千P的。重点是,目前许多建设这些数据中心集群的公司并不是传统IT行业的公司,所有人都来做这件事情。”陈葆立分析道,“其中确实有一些技术演进,但这个现象还有部分原因是大家正在一窝蜂地追逐热点,而我们需要落实到实际需要解决的问题上。中国现在的‘百模大战’,是一个时代的需求,更需要关注如何将模型运用至不同行业中。”
谈及是否所有数据中心都一定要变成智算中心、智算中心就一定需要很多GPU、以及GPU一定要达到多少P的算力等话题时,陈葆立指出:“这些可能是被当前市场的导向引导偏了,答案都是:不一定。很多企业目前采用最新的至强处理器已经可以处理许多工作。当然,一些想要训练模型的公司需要加速卡,不管是来自英特尔还是友商,这确实是用户需求,但我并不认为所有公司都有这个需要,这超过了目前市场的实际需求。”
算力竞争维度增加
虽然数据中心市场有波动,但是从长期成长趋势看仍在上升。IDC发布的《中国数据中心服务市场(2022年)跟踪》报告显示,2022年,中国数据中心服务市场同比增长12.7%,市场规模达1293.5亿元人民币。IDC预计,未来五年,中国数据中心服务市场将以18.9%的复合增速持续增长,预计2027年市场规模达3075亿元人民币。
面对数据中心和AI带来的更大市场,芯片巨头们早已展开新竞争,并且竞争更加多样化。加上目前芯片限制的影响,中国市场的竞争就更加复杂。
首先,陈葆立强调:“英特尔肯定是继续合法合规地为中国市场客户提供产品。另外,我们拥有不同的产品线,以及多款产品,每个产品线也有不同的速度和速率,所以我们肯定有许多产品可以满足中国市场的需求。”
其次,从竞争的角度来讲,“我认为这取决于是短期还是长期竞争。如果只是看字面上的最新政策,以及当产品的衡量只有单一维度时,大家也许会觉得‘都拉平了’,即大家的产品都处于同一条线上。然而实际上,算力或者是智算,并非只有一个维度。”陈葆立说道。
比如在算力之外,存储能力也很关键,他举例道,今年的一个热门概念就是HBM(High Bandwidth Memory,高带宽内存),大内存可以提升大模型的训练和推理性能。此外,还有网络、多卡互连的速度和速率,以及数据中心节能减碳技术等。
因此,陈葆立指出:“在不同的维度和层面有非常大的竞争和发展空间。AI的算力不是一个单维度的,而是多维度的,所以我认为竞争没有结束,我们仍需要从多维角度去思考和考虑。”
另一方面,客户对于算力的需求也在发生变化。一位英特尔技术专家向21世纪经济报道记者表示,如果着眼于国内厂商的发展,其很大的一个趋势是“从无到有,从少到多”。很多客户数据中心服务器装机量越来越多,从原来单纯满足业务需求到现在有了更多的精细化运营,开始关注产品的稳定性、产品的故障率。
这也对数据中心的芯片提供商提出了更高的要求,芯片之外,英特尔高管也多次提到了数据中心硬件和软件生态协同发展。“比如某一个地方的算力增加了,但是相匹配的内存、散热或者软件跟不上,这对于用户来说,并没有很好应用到整体数据中心该有的性能。所以我们在系统上有多点投入,希望明年推出全新的Sierra Forest或是Granite Rapids下一代至强处理器的时候,产品的内核数量翻倍或者是三倍的时候,相应配套的内存、管理软件、安全软件等都能够跟上。”陈葆立谈道。