11月27日,在Arm Tech Symposia深圳场上,Arm高级副总裁兼基础设施事业部总经理 Mohamed Awad接受了与非网记者的采访。他重点强调了Arm从IP提供商向计算平台公司的转型,并详细介绍了Arm全面计算解决方案、Arm® Neoverse™平台、Arm Corstone™和SOAFEE等技术在不同领域的应用。Awad特别强调了对中国市场的重视,提到中国合作伙伴基于Arm架构的芯片出货量已超过300亿颗,展示了Arm在中国市场的强大影响力和增长潜力。同时,他强调了Arm作为一家全球公司,持续遵守各市场要求的法律法规,并在此原则下,与全球合作伙伴保持合作。
Arm Neoverse平台的历史与现状
自1990年成立以来,Arm作为全球芯片IP行业的领导者,以其独特的IP技术授权模式打造了强大的Arm生态系统。Arm的低功耗处理器设计和软件平台已被广泛应用于超过2700亿颗芯片,覆盖从传感器、智能手机到超级计算机的多样化应用。Arm® Neoverse™平台专注于高性能计算、云数据中心、边缘计算、网络等领域,自推出以来,该平台的发展一直呈上升趋势。而今年下半年,Arm Neoverse计算子系统(CSS)的推出则标志着定制芯片领域的变革,这一平台预集成了Arm Neoverse,并完成了验证配置,显著降低了开发成本并加速了产品上市。
2018年底,Arm发布了Neoverse的初步路线图,旨在服务高性能计算市场。最初的平台产品基于16nm工艺,采用Cortex-A72、Cortex-A75 CPU核心。2019年2月,Arm推出了Neoverse N1和E1。N1面向高性能设备,基于7nm工艺,与Cortex-A76同源,性能比A72提高60%。E1则专注于高效数据处理,吞吐量性能提升2.7倍,适用于多种设备。
2020年9月,Arm更新了Neoverse路线图,增加了V1和N2两个平台,并将Neoverse分为V、N、E三大系列。V系列专注于高性能应用,N系列平衡性能、功耗和面积,适用于云、5G、网络和边缘,而E系列强调能效,适用于5G、网络和基础设施边缘领域。
2021年3月,Arm发布了Armv9指令集,并在4月详细介绍了Neoverse N2和V1的技术细节。其中,N2基于 Armv9 架构,采用5nm工艺,相比N1在相同功率和面积效率下,单线程性能提升40%,频率提高10%。N2适用于多种应用,从云计算到边缘设备。V1平台采用7nm/5nm工艺,单线程性能比N1提升50%以上,适用于高性能云、高性能计算与机器学习等领域。
2022年9月,Arm再次更新Neoverse路线图,宣布推出两个新品——V2和E2。V2配备最新V系列核心,采用Armv9架构,致力于提供领先的单线程性能,适用于云端、超大规模和HPC工作负载。E2结合了Arm Cortex-A510 CPU和可扩展的Neoverse系统背板,允许在受限应用中使用云端技术。
Arm Neoverse 计算子系统 (CSS)
2023年8月,Arm推出基于Arm Neoverse N2平台所开发的Arm Neoverse CSS N2。Arm Neoverse CSS N2从每芯片24、32和64个核心设计进行扩展,具有连接DDR5、LPDDR5、PCIe/CXL和其他类型IP的接口。相较于独立的IP,Arm Neoverse CSS 将促使Arm生态系统通过更低的成本、更少的风险以及更短的时间,打造出专用芯片。Arm Neoverse CSS N2作为Neoverse CSS的第一代产品,优化了功耗、性能与面积(PPA),提升了Neoverse N2的每瓦性能与效率。
革新基础设施:全新系统架构挑战传统
面对数据需求的增长和功耗限制的挑战,数据中心和网络基础设施面临巨大压力。因此,系统级芯片(SoC)的设计成本和复杂性不断上升,迫切需要高效的专用处理产品以创新应对。全新系统架构的引入正在彻底改变基础设施领域,以解决长期存在的行业痛点。
基础设施领域的传统系统架构
Arm高级副总裁Mohamed Awad指出,传统的服务器系统架构通常由一个通用的现成CPU管理多个加速器,这种布局限制了性能,因为所有加速器都必须通过CPU访问额外的内存,导致无法达到内存一致性和充分利用加速器性能,特别是在应对生成式AI时代的需求时。
面向新的技术需求,基础设施领域出现了现代化的系统架构
现代架构采用了创新方法,以一种现代化的系统架构为例,其中每个定制化CPU都与一个加速器直接连接,实现了更强的内存一致性。这种一对一的CPU与加速器组合允许定制化的CPU设计,根据具体的使用场景和应用需求来优化,从而提高加速器的使用效率和整体性能。Awad强调,这种架构能够为特定用例量身定制CPU,实现最佳性能,满足未来基础设施的市场需求,包括生成式AI。
NVIDIA GH200 Grace Hopper 超级芯片采用 Arm Neoverse 搭配 NVIDIA GPU,满足 AI 性能的需求
这种架构还支持多种直连方式,包括裸片对裸片或SoC的直连,确保内存一致性,作为独立系统运行。这种灵活性和直连能力使得性能和效率达到优异水平。NVIDIA GH200 Grace Hopper超级芯片就采用了这种架构。这个超级芯片结合了72颗Arm Neoverse核心和NVIDIA GPU,其AI性能比基于x86架构的系统提高了10倍。这种全新的系统架构显示了Arm在推动技术创新和满足市场需求方面的领先地位,特别是在高性能计算和AI应用领域。
Awad认为,Arm在AI计算领域的核心作用不仅体现在硬件和软件的紧密集成上,还包括在性能和计算能力的提升上。此外,他提到Arm致力于将AI技术从传统服务器扩展到边缘和网络领域,实现数据流程的全面融合。
Neoverse CSS平台如何赋能客户?
从超大规模云服务商到初创企业,在 Arm 平台上赋能创新
随着AI、5G、云数据中心和边缘计算的快速发展,Arm致力于引领技术创新,通过其Neoverse CSS提供快速、低风险的定制芯片解决方案,满足专用处理的需求。Arm高级副总裁Mohamed Awad强调,Arm不仅能帮助合作伙伴构建定制化CPU,还通过强大的软件生态系统加速产品上市。多家知名企业与初创公司,包括阿里巴巴、鸿钧微电子、遇贤微电子、云豹智能,正与Arm深入合作,利用Arm的计算平台开发其优化的产品和解决方案。
Arm Neoverse CSS使合作伙伴能专注于SoC和系统级创新,显著缩短产品开发周期。例如,借助Neoverse CSS ,合作伙伴能在13个月内实现100核心以上系统的Linux启动。Neoverse CSS 提供了更高的创新自由度,并针对存储、IO、加速和物理拓扑等方面提供差异化解决方案。Arm Neoverse CSS 和全面设计生态项目的推出旨在简化芯片设计和制造流程,支持新一代数据中心和网络基础设施的发展。
微软 Azure Cobalt 100
最近,微软发布了基于Arm Neoverse CSS的Azure Cobalt 100 CPU,彰显了Arm在赋能合作伙伴实现定制芯片的领导地位。此外,Arm与亚马逊云服务(AWS)、阿里巴巴等超大规模云服务商的合作体现了其技术的适应性和灵活性。Awad提到,借助新的现代化系统架构,如NVIDIA GH200 Grace Hopper超级芯片,展示了其在AI性能方面相比传统x86架构系统提高10倍的强大优势,证明了Arm在现代基础设施设计中的关键角色。
Arm全面设计生态项目:赋能定制芯片革新与技术融合
Arm 全面设计 (Arm Total Design) 生态项目助力合作伙伴加速基于 Neoverse CSS 的芯片开发
在Neoverse CSS的基础之上,Arm还宣布推出Arm全面设计(Arm Total Design)生态项目,进一步结合生态系统的力量,简化定制芯片的开发流程,使交付变得更加容易、便捷。Arm全面设计生态项目的推出意味着ASIC设计公司可以更快地启动设计项目。这个系统不仅促进了在Neoverse CSS基础上的快速创新,还利用了Arm及其合作伙伴在基础设施软件生态系统中多年的投资。Arm Neoverse CSS和全面设计生态项目的推出,旨在简化复杂的芯片设计和制造流程,支持新一代数据中心和网络基础设施的发展。该生态项目不仅加速了基于Neoverse CSS的定制SoC的开发,而且为合作伙伴提供更多机会和资源,共同推动基于Arm技术的创新。
Arm全面设计生态系统使ASIC设计公司能够更快地启动设计项目,并为IP供应商提供预集成、预验证和预优化的高级IP。EDA合作伙伴可以无缝支持最先进的工具和流程,简化SoC设计。商业固件解决方案可在芯片流片前开始开发,Neoverse CSS的设计经过专门优化,充分发挥领先工艺节点的优势。此外,Arm生态系统可助力驱动定制芯片变革。这种架构提供了灵活性以支持创新、多样化和差异化解决方案,并依赖强大的软件生态系统。合作伙伴利用这种定制化与标准化的平衡,实现了多项行业创举,加速了无线网络到云计算等关键行业市场的增长。
可以说,Arm全面设计生态项目整合了ASIC设计公司、IP供应商、EDA工具提供商、代工厂和固件开发者等行业领先企业,在芯片开发的各个阶段引入关键专业知识,旨在提供广泛应用于AI、云、网络和边缘等领域的专用解决方案。通过优化设计流程和降低成本,加速产品上市时间。
Arm全面设计生态项目通过半导体设计和制造行业的专业知识加速定制芯片的开发,使高性能、高效率的解决方案更广泛地可用,满足AI驱动的未来需求。这个生态项目不仅加速了基于Neoverse CSS的定制SoC的开发,也为合作伙伴提供了更多的机会和资源,共同推进基于Arm技术的创新。在芯粒(chiplet)技术领域中,Arm Neoverse CSS具备让定制芯片更易获取的特性,支持新兴的chiplet技术。通过与Arm全面设计生态项目成员和更广泛的生态系统在AMBA CHIC2C、UCIe和其他计划上开展合作,Arm正在推动将基本接口和系统架构达成业内一致性,实现围绕多芯片芯粒SoC设计的创新发展。例如,Socionext利用Neoverse CSS进行了多核CPU芯粒的概念验证,采用TSMC 2nm工艺节点进行设计开发,面向服务器CPU、数据中心AI边缘服务器和5/6G基础设施提供解决方案。
总结:赋能定制化是Arm 架构的精髓
值得一提的是,Arm Neoverse 平台的增速很快。如今所有主要的公有云都提供基于 Neoverse 的云实例。Awad表示,未来很多合作伙伴将会在 2024 年将第一代CSS设计投入生产,比如微软Cobalt 100在 2023 年就已经实现。
此外,Awad也再一次强调了中国市场对Arm业务发展的重要性。他强调了Arm从IP提供商已转型为计算平台公司,在致力于 IP 授权业务的同时,也专注于通过完整且全面的解决方案,为合作伙伴带来选择的灵活性,帮助他们更快地将产品推向市场。他也提及了Arm全面计算解决方案、Neoverse平台、Corstone和SOAFEE等产品在多个领域的广泛应用。在汽车行业方面,Awad提及了SOAFEE项目,旨在应对软件可移植性、加速软件开发和软件可升级性的挑战。他还强调了Arm在物联网领域的投资,包括IP和围绕平台的整体解决方案。
此外,对于高性能AI计算领域CPU融合GPU是否会成为主流的问题,Awad指出目前尚不确定这是否将成为未来的趋势。他解释说,毫无疑问地,任何通用CPU旁边都一定会有一个加速器,无论是紧密耦合还是中散耦合的方式。他补充说,Arm的优势在于能够帮助合作伙伴从头开始构建定制化的CPU,并利用Arm的软件生态系统加速开发和上市进程。
值得一提的是,Awad强调赋能定制化是Arm架构的精髓所在。比如NVIDIA选择的新的架构方式是将HBM连接到加速器,而非DDR5直接链接HBM,也就是说最终的芯片架构是根据客户的应用场景和需求进行定制的。“对于 Arm 来说,每一个客户、每一个芯片设计方,都可以选择最适合他们的架构方式。” Awad表示,设计者无需改变其现有的芯片设计流程。借助 Arm Neoverse CSS 以及 Arm全面设计,芯片设计者的工作流程可以得到进一步简化。从软硬件合作伙伴到代工厂和 EDA 技术的先行者,Arm 全面设计生态项目汇集了半导体设计和制造行业的专业知识,加快了针对工作负载优化的定制芯片的开发速度。这对芯片设计者来说是帮助其加速和优化,而不是去改变他的设计流程。