GPU粥少僧多,真的要延后出货吗?



By
jonson
14 3 月 24
0
comment

作者:畅秋

过去一年,用于AI服务器的GPU一直供不应求,而从未来一年的发展态势来看,相关产品的紧张程度有增无减。

据TrendForce(集邦咨询)预测,2024年全球服务器整机出货量约1365.4万台,年增长率约2.05%。同时,市场仍聚焦部署AI服务器,出货占比约为12.1%。

从各大ODM出货动态来看,今年,增长幅度最高的是Foxconn(富士康),预估出货量年增约5%~7%,包含Dell 16G平台、AWS Graviton 3与4、Google Genoa和Microsoft Gen9等订单。AI服务器订单方面,Foxconn今年已斩获Oracle订单,同时也承接了部分AWS订单。

增长幅度排名第二的是Inventec,预估出货量年增约0~3%。AI服务器方面,除了北美CSP,中国客户,如ByteDance需求最强,预估今年Inventec 的AI服务器出货量年增长率可达双位数,占比约10%~15%。

排在Inventec之后的是广达和Supermicro,预计今年服务器出货量年增长率持平。

整体而言,各家ODM在2024年的出货仍以AI服务器最为强劲,主要受惠于北美云端数据中心厂商订单带动,预计今年AI服务器出货增长率和占比都将达到两位数百分比。就出货种类而言,今年,搭载高端AI训练芯片(如英伟达H系列和AMD的MI系列产品)的机种出货量有机会翻倍增长。这对英伟达和AMD来说,意味着更大商机。

店大欺客?

目前,英伟达占据80%的AI服务器GPU芯片市场份额,AI系统和互联网大厂都需要该公司的GPU,因此,英伟达在该市场拥有很大话语权。

最近,有外媒报道,英伟达可能刻意延后出货,以限制竞争对手接单。

报道称,如果英伟达发现客户正在寻求更好的业务机会,则可能会拖延数据中心GPU的出货。英伟达的竞争对手、人工智能芯片创业公司Groq表示,由于客户担心英伟达报复性出货延迟,都心存恐惧地对取得或设计人工智能技术保密。

Groq首席执行官罗斯(Jonathan Ross)表示,由于潜在客户担心被英伟达发现与其它厂商讨论接单,客户们都会否认自己曾与这些竞争对手公司会面。实际上,这种情况在业界并不少见。罗斯说:“很多人都说,如果英伟达听说客户正在会面,它们会否认这一点。问题是你必须提前一年向英伟达付款,可能会在一年内得到硬件,也可能需要更长时间。”

外媒甚至暗示,微软、Google和亚马逊等科技巨头正打造自有人工智能加速器,但都坚称不打算成为英伟达的竞争对手,因为英伟达在人工智能市场中占有主导地位。

针对罗斯的声明,英伟达CEO黄仁勋告诉行业分析师,他试图公平地向客户分配GPU,并将避免向不立即使用加速器的公司出售产品。

在Groq指控英伟达使用延后出货手段后,AMD前副总裁赫克尔曼(Scott Herkelman)表示,英伟达的确采取类似策略,他甚至称英伟达为“GPU独占集团”。他在社交媒体X上发文写道:“这种情况发生的次数比预期的要多。”

赫克尔曼的表态十分引人关注,因为他从2016年起负责AMD的图形业务部门,该部门在消费者和数据中心业务方面与英伟达竞争,直到2023年离开AMD。更重要的是,他在2012年9月~2015年5月间担任英伟达GeForce业务总经理。

不过,目前尚不清楚是否有证据证明英伟达确实有上述行为。

如何保持行业领导地位?

英伟达在占据AI服务器用GPU市场主动地位的情况下,一定会想方设法实现利润最大化,具体措施方面,除了高定价,保持客户粘性是很重要的方式,在这方面的具体措施,包括技术性的,如用CUDA软硬件生态系统牢牢地抓住广大工程师,还有就是商业操作层面的,要尽量降低竞争对手的获客机会。

在当前的AI服务器和相关GPU市场行情下,无论是GPU提供商,还是系统集成商或互联网大厂,都越来越敏感了,特别是互联网大厂,都在做两手准备,在向英伟达采购更多GPU的同时,正在加紧自研相关芯片。对于英伟达的各种客户而言,更多地接触AMD和英特尔是必然。

微软、Meta、亚马逊等云服务提供商为了降低芯片成本,并使芯片供应链多元化,减少对英伟达的依赖,不仅开始提升采购AMD的MI300系列产品数量,要求ODM厂设计专门采用MI300系列产品的AI服务器,还纷纷加强自研HPC芯片力度,争取将更多自研芯片用于自家的互联网和云计算系统。

AMD是英伟达最大的竞争对手,由于受到越来越多英伟达客户的关注,对AMD产品的采购量在增加,使得该GPU“二哥”的行业地位持续提升,这在资本市场上有越来越明显的表现。最近,AMD股价涨幅超过9%至每股192.53美元,创造历史新高,2月份累计上涨了14.8%,市值首度突破3000亿美元。

根据道琼斯市场数据,AMD的市值达到了3110亿美元。在近期的连续上涨之后,AMD股价越来越贵,其市盈率接近50倍,远高于英伟达的32倍。

这样看来,虽然英伟达依然很风光,但受限于先进制程、封装产能,以及来自各级别芯片对手的竞争,该公司的危机意识也在增加。

对于英伟达来说,要加快推出新品和优化原有产品的节奏。

英伟达AI年度盛会“GTC 2024”将于3月18日在美国登场,届时,黄仁勋将公布旗下最新的AI芯片、采用新一代Blackwell架构的B100 GPU。据悉,该新品将由台积电3nm制程代工生产,最快今年第四季度出货。

GTC大会不仅将世界各地的专业工程师、研究人员会聚一堂,还将邀请多位科技大老亲自到场,活动预计将涌进超过30万人(线下和线上总参与人数),今年的GTC也被外界看作是观察2024和2025年AI关键技术发展进程的重要风向标。

英伟达即将发布的B100,与目前的H系列GPU相比,整体效能有大幅提升。其中,光是HBM内存容量,就比H系列最强的H200芯片高出约40%的容量,使得B100能应对高效能HPC或加速LLM的AI训练需求。据了解,B100芯片的AI效能,至少是Hopper架构H200的两倍,可以达到H100的4倍以上。

多家AI服务器系统大厂已经开始争夺B100,包括已成为英伟达B100模组供应商的代工大厂纬创,以及提供3nm或4nm制程技术的台积电,还有现已开始接到来自英伟达B100 AI服务器水冷项目订单的代工大厂英业达。英业达表示,今年的AI服务器市场仍以英伟达产品为主流,并以高端训练用的AI服务器产品为市场主力。

对于即将发布的新品B100,英伟达对所搭载的散热技术也进行了升级,从原来的气冷转为水冷,对此,黄仁勋曾提到,自己坚信浸没式水冷技术是未来发展方向,将带动整个散热市场迎来全面的革新。据悉,英伟达从B100开始,未来所有产品的散热技术,都将由气冷转为水冷。

中国市场给英伟达增添了更多危机感

英伟达对竞争对手带给它威胁的重视程度,从它对中国大陆市场及本土芯片企业的态度就可以看出来。

中国大陆市场占英伟达销售额的20%左右,近两年,该公司不得不多次改变GPU性能规格,以满足美国政府的出口要求。

2022年8月,美国政府禁止向中国大陆出口英伟达的A100和H100芯片,因为这些芯片的通信带宽达到了600GB/s或更高。针对中国大陆市场,英伟达随后推出了A800和H800处理器,通信带宽都明显低于600GB/s。

2023年10月,美国商务部工业与安全局(BIS)表示,将使用 “性能密度”作为新参数对受限芯片进行分类。根据新规定,英伟达的A800、H800、L40、L40S和RTX 4090相关产品被禁止销往中国大陆。针对这项规定,英伟达又于去年11月推出了三款AI芯片——H20、L20和L2,但要到2024年第二季度才能量产交付。

针对RTX 4090在中国大陆销售受限问题,英伟达开发出了RTX 4090 D显卡,通过降低部份规格,以符合美国出口管制要求。据悉,RTX 4090 D满足综合运算性能(TPP)4800限制,RTX 4090的TPP是5286。

最近,英伟达推出了最新版本的中国特供GPU和显卡RTX 5880 Ada,符合4800 TPP的限制规定。英伟达将AD102芯片用于RTX 6000 Ada和RTX 5000 Ada,RTX 5880 Ada很可能使用相同芯片的变体。AD102拥有18,432个CUDA内核。

随着近几年美国限制政策的出台,以及中国本土企业和产品竞争力的提升,英伟达等厂商的技术和产品优势正在缩小。例如,H20在性能和效率上仍比中国本土AI芯片具有优势,但这种优势正在缩小,因为多家中国本土芯片厂商正在快速发展。

由于中国本土AI芯片与英伟达特供版产品之间的差距在缩小,进入2024年以来,多家中国互联网大厂和云服务提供商表示,今年下订的英伟达H20等产品数量将远少于原本想买的,因为来自中国本土的相关芯片用量增加了。

测试结果显示,H20能在多个处理器之间高效传输数据,比中国本土相关芯片更适合AI计算应用,但是,需要更多H20才能表现出英伟达常规GPU的算力,这就大幅提高了成本。相比之下,中国本土最先进的AI芯片也能处理AI相关应用,只是处理任务的复杂度低于英伟达的。知情人士表示,多家中国互联网大厂和云服务提供商已经把一些AI芯片订单转至本土厂商,以华为为例,据悉,该公司去年已从本土互联网大厂手中拿到至少5000组Ascend 910B芯片订单,预定今年交货。

2月下旬,黄仁勋在接受外媒采访时表示,如今,整个科技行业都在争相开发和优化自己的芯片技术,无论是TPU团队、AWS Trainium和Interentia团队,还是微软的Maia项目,以及中国各大云服务提供商和初创公司,都在这一领域投入了大量的精力。这种竞争态势确实非常激烈。

对于中国大陆的竞争对手,黄仁勋表示,华为是非常好的公司。尽管他们受到现有半导体制程技术的限制,但他们仍然可以通过将许多芯片聚集在一起来构建非常强大的系统。为了与华为竞争,英伟达正在向客户提供两款专门针对中国市场的新AI芯片样品。

这是英伟达首次公开将华为列为竞争对手。此前,英伟达唯一一次公开提到华为是在2017年的一份财报中,当时,该公司表示,华为将使用英伟达的Volta HGX架构为数据中心构建AI系统。在那份报告中,英伟达还将华为列为其AI智慧城市平台的合作伙伴,而现在,华为成为了英伟达不得不重视的竞争对手。

结语

经过2023年的火爆,2024年的AI服务器市场很可能会更加旺盛,这给相关高性能芯片、特别是GPU厂商提供了更多商机。

对于行业领导厂商而言,众多竞争对手,甚至包括客户都虎视眈眈。站得越高,如果处理不好的话,摔得就会越惨,需要在技术、产品和商业推广等多方面,充分发挥原有优势,压制竞争对手,才能保持行业地位。

对于英伟达来说,2024年的AI服务器GPU市场依然会是它的天下。但在不断变化、发展的高性能计算市场,谁能断定两三年后的技术和产品市场会有多大变化呢?就像两年前,谁能断定华为能在2023年实现手机处理器制造突破一样。

发表回复