RISC-V服务器提速,芯企布局几何?



By
jonson
18 3 月 24
0
comment

在国内,RISC-V常被称为我国芯片产业换道超车、自主可控的一条关键路径,其发展也受到广泛关注。

过去的几年里,RISC-V主要被应用于一些简单的MCU,出货量集中在一些中低端需求,如打印机、显示器等。然而,如今RISC-V正逐渐向高性能计算领域迈进,如服务器CPU、AI加速芯片、车规级芯片等。

实际上,自2018年开始,RISC-V在云计算和超算中心里的动态便持续受到从业者们重点关注,只是几年过去,RISC-V的高性能之路仍道阻且长。

不过业内普遍认为,近两年RISC-V产业将出现转机。而从新闻动态上也不难看出,距离RISC-V爆发的节点越来越近,不仅是因为产业规模在逐渐壮大,还因为新的产品在不断发布和进入商用,这点在服务器市场已有所体现。

一是在去年六月,算能便拿出了RISC-V服务器芯片SG2042;二是近日法国的云服务器厂商Scaleway也推出了RISC-V服务器,名为Elastic Metal RV1。据悉,二者的芯片内核均是来自某国产芯片910。

出现能够商业化的产品是令业内振奋的事,不过要成功并非那么简单。那么,服务器芯片是一个什么样的市场?RISC-V架构在服务器芯片市场有哪些优势?布局服务器的RISC-V IP和芯片公司现状又如何?

服务器芯片是一个什么样的市场?

服务器芯片,主要以针对数据中心、云计算、企业级应用等大型计算需求而设计的处理器芯片,目前主要分为专用计算和通用计算两个市场。

其中,通用服务器可以运行多种不同类型的软件和服务,具有通用性和灵活性。通用服务器芯片主要有Intel Xeon、AMD EPYC等,搭配通用操作系统如Linux、Windows Server等使用。通用服务器常见于企业数据中心、云服务提供商、网络服务器等场景,用于托管各种企业应用、网站、数据库、存储等。

而专用服务器则是专门执行特定类型任务或应用的服务器。专用服务器通常配备专用的硬件和软件,如专用芯片(如GPU、TPU等)、特定的加速器、定制化的操作系统或应用软件等。专用服务器的应用场景包括高性能计算(HPC)、人工智能训练、视频处理、区块链节点、游戏服务器等。

按芯片架构来分,目前通用服务器以X86为主导,部分终端客户会使用ARM,信创市场会选择龙芯等自研架构,而RISC-V则非常少

据业内人士透露,目前服务器采购方主要为国内三大运营商,在采购计划方面已设定了ARM服务器的比例,但尚未给RISC-V划定采购比例

不过也有云服务商表示,很多客户不在乎采用ARM还是x86,而是关心系统运行速度更快或费用更低,或者哪种服务器有更多内存。

在专用服务器领域,RISC-V架构很早就已被大厂看中,如国外的谷歌、亚马逊、IBM,国内的字节、腾讯、百度等,各家在自己的云计算业务里,自2018年起便在使用RISC-V服务器芯片。但据了解,该市场体量并不大,且以上公司大部分为自研自用节省成本,对于RISC-V产业而言没有商业化逻辑

当下服务器市场芯片的X86玩家以国外的英特尔、AMD为主,国内的海光、兆芯也都采用了x86架构IP内核授权模式。ARM玩家有鲲鹏、飞腾,二者获得了ARM V8的永久授权,此外也有ARM的新进入者如遇贤微、鸿钧微、启灵芯等。

据了解,ARM能够挤进服务器市场的核心优势在于,基于ARM的服务器可以支持多样化和快速变化的工作负载,并且更具可扩展性和成本效益;其次,对于不同的利基型市场能够提供更高的定制化,生态系统也更灵活;另外,ARM架构服务器体积相对较小,符合现今微型数据中心的需求。

那么,RISC-V又是否具备一些差异化的优势,能够与X86和ARM掰掰手腕呢?

X86、ARM、RISC-V,何时能实现三足鼎立?

在服务器领域,RISC-V对比其他架构的优势可以分为技术市场两方面讨论。

从技术上来说,倪光南院士在最近的达摩院玄铁RISC-V生态大会上提到,对比X86,RISC-V可能从以下两个方面实现超越

• 今天x86架构仍垄断着服务器和桌面领域,这是因为过去几十年里,x86架构在这些领域形成了强大的生态,以致于其他架构因生态较为薄弱而不能取代它,假以时日这种情况会发生变化。另一方面,现在的x86架构也已经不是纯粹的CISC了,实际上在它内部也用硬件将某些CISC指令转化为它内部的RISC指令再予以执行。

• 在后PC时代,CPU架构的竞争力不仅要体现在性能上,还需在芯片面积、能耗、价格、研发周期、生态支持等等方面全方位地体现出来。以此衡量,x86架构不但在新兴须过没有优势,而且在传统领域市场总量也不会有多大增长,甚至其份额也可能被RISG所蚕食

而对比ARM,倪院士则为RISC-V总结了以下优势:

• 简单。RISC-V架构的规模比私有的ARM架构小得多。例如ARMW8的手册有2500页(与X86相仿),而RISC-V手册仅有200页;

• 干净RISC-V的推出比ARM迟25年,技术新,吸纳了处理器技术发展中的许多经验教训川,例如避免了微架构之类依赖于特定技术的特性。

• 模块化。RISC-V整体架构由一个小而紧湊的标准基础指令集再加上若干标准矿扩展指令集构成,用户还可以再加上自定义的扩展指令集。

• 可定制化。为易于扩展而预留很大的操作码空间;便于用户按需自定义扩展指令。

从市场的角度来说,RISC-V一方面满足的是我国对芯片自主可控的需求,另一方面则是能满足专用服务器的定制化需求。有从业者表示,未来RISC-V服务器应该会先从信创市场起量(基于信息安全考量),但再往后会因为CPU无法再往上提升性能而诞生定制化的需求。

从价格上来说,目前RISC-V IP核的授权费和版税只有ARM的1/3-1/4。如果采用RISC-V方案,能很大程度降低芯片、服务器厂商的成本。

但是,业内人士表示,RISC-V进入服务器市场还有几大挑战:

第一是通用软件的不适配。通用服务器市场需要用到通用的操作系统和软件,但目前很多商业软件并不RISC-V适配。尤其数据中心这样的强生态市场,需要完成的工作包括需要大量的商业软件支持、各软件之间的相互协作、协议/规范的制定等,而RISC-V基金会目前才刚开始这部分的工作。

第二是适配价格昂贵。服务器产品定型就要大量资金(约一千万),因为并不是简单的组装,需要考虑的东西很多很复杂,主要是稳定性,一台服务器要跑很多卡,无法保证不同方案跑起来都很容易,并且在试验阶段就很烧钱。

第三是服务器适配难度极高。目前大部分服务器公司均是买现成的板卡用,因为想要把芯片适配到板卡上需要复杂的流程及大量的时间。

不过即使困难重重,RISC-V服务器如今已初现曙光。并且,倪院士在活动上也提到,RISC-V自定义扩展指令是实现DSA(特定领域架构)的有效途径,并对我国基于RISC-V架构的DSA新型服务器机遇进行了介绍。

那么,现在全球哪些玩家在布局RISC-V服务器呢?

哪些公司在布局RISC-V服务器?

目前国内外已有不少公司进入了RISC-V服务器赛道,不过其中部分公司主要涉及服务器中的AI加速芯片。IP公司包括阿里达摩院、SiFive、Ventana、Tenstorrent等;芯片公司包括算能、进迭时空、希姆计算、蓝芯算力、微核芯、超睿科技等。

01、阿里达摩院

达摩院是一家致力于探索科技未知,以人类愿景为驱动力的,立足于基础科学、创新性技术和应用技术的研究院。达摩院聚焦数据科学领域“智能”和“计算”两大方向,研究布局包括视觉技术、语言技术、决策智能、视频技术、医疗AI、智慧育种、RISC-V、计算技术等方向。

2019年7月,阿里达摩院面向高性能市场发布了RISC-V处理器核——玄铁C910,后来基于玄铁C910设计了曳影1520 SoC。如文首提到,目前某国产芯片便是基于玄铁C910内核,某云服务器厂商Scaleway便是基于曳影1520 SoC开发了服务器。

02、SiFive

SiFive是一家无晶圆厂半导体公司,也是基于RISC-V指令集架构(ISA)的商用RISC-V处理器IP和硅解决方案的提供商。

2021年12月,SiFive发布了IP核P650,据了解,该产品配有128KB一级缓存、2MB二级缓存、16MB三级缓存(16核)等配置,性能指标为11.x SPECInt/GHz,对标ARM Cortex-A77,可用于数据中心等场景。

不过,网络上暂未检索到其产品商用情况。

03、Ventana

Ventana Micro Systems是一家芯片设计领域的知名初创公司,主要产品为基于RISC-V架构的服务器芯片。

2022年12月,Ventana公司就曾发布了全球首款基于RISC-V架构的服务器CPU——Veyron V1。

据了解,该产品采用5nm制程工艺,基于Ventana自研的高性能RISC-V内核,8流水线设计,支持乱序执行,主频超过3GHz,每个集群最多16个内核,多集群最多可扩展至192核,拥有48MB共享三级缓存,拥有高级侧信道攻击缓解措施、IOMMU和高级中断架构(AIA)、支持全面的RAS功能、自上而下的软件性能调整方法,可以满足数据中心的各种需求。号称性能可超越AMD EPYC 7763。

而在2023 RISC-V峰会上,Ventana又发布了其第二代服务器CPU——Veyron V2,在指令扩展、内核设计、互联标准、制程工艺等众多方面进行了全面升级。官方宣称其性能超越了AMD的高端服务器芯片Epyc 9754。

同样,网络上暂未检索到其产品商用情况。

04、Tenstorrent

Tenstorrent是一家AI处理器的初创公司,于2016年3月在加拿大多伦多成立。该公司由前AMD Ljubisa Bajic、Milos Trajkovic和Ivan Hamer创立,但Jim Keller于2021年1月加入,担任总裁兼CTO。之后2023年1月,Jim Keller成为CEO。

Tenstorrent在2022年发布了一款名为Wormhole的产品,可以用于服务器中的AI训练。据了解,虫洞芯片将提供两种版本:一种是可以轻松插入服务器的PCIe插卡,另一种作为一个Wormhole模块使用,该模块由一个芯片和6个GDDR6存储器组成。它还将所有16个以太网端口接到板上,模块的每一边有四个端口。

05、算能

算能致力于成为全球领先的通用算力提供商,专注于RISC-V、TPU处理器等算力产品的研发和推广应用。

服务器产品方面,算能在2023年发布了SG2042多核处理器,基于平头哥高性能玄铁RISC-V内核,主频2GHz,9-12流水线设计,支持乱序执行,主频高达2GHz,每个Cluster最多4个内核,单SoC芯片拥有64核,64MB共享三级缓存,单SoC处理器有64核,拥有64MB系统缓存。

据悉,算能在2023年已开始出货。

06、进迭时空

进迭时空是一家计算芯片企业,专注于研发下一代RISC-V架构的高性能CPU并提供软硬一体优化的计算解决方案。

在进迭时空官网的一篇新闻中显示,该公司计划于2024年推出第一款RISC-V处理器核“X100”。在研发方面,该公司已经完成了面向数据中心服务器芯片的“X100”核的研发工作。

据了解,“X100”是国内首款支持完整虚拟化能力的RISC-V CPU核。目前,阶段性能单核跑分8 SPECint2k6/GHz,频率在12nm工艺下可达2.3GHz,支持64核同步计算,通用计算性能对标ARM A75,在向量计算、AI计算等方面通过指令扩展和优化大幅领先业界同规格产品。该CPU核满足服务器规格需求,拓展了RISC-V在高性能通用计算的应用边界。

07、希姆计算

希姆计算成立于2019年4月,是国内最早基于RISC-V做数据中心芯片设计的企业,确立了基于RISC-V指令集设计数据中心高性能芯片的技术路线、由专用计算(DSA,领域专用架构)向通用计算(CPU)逐步演进的发展战略和以AI芯片为切入点、先推理后训练的产品规划。

希姆发布了STCP920系列人工智能计算卡,该产品基于RISC-V扩展指令集,是希姆计算推出的人工智能计算加速卡,具备强大的云端AI计算能效比和良好的可编程性,混合支持FP16/INT8数据类型。

08、蓝芯算力

蓝芯算力成立于2023年5月,是一家致力于设计高性能芯片的公司。2023 年 5 月,字节跳动负责RISC-V以及服务器芯片业务负责人卢山从字节离职创业,成立蓝芯算力,据称其主要业务方向仍是RISC-V数据中心CPU(中央处理器)。

据了解,蓝芯算力的业务方向为基于RISC-V指令集的高性能服务器CPU研发,目前已经取得了多核SOC CPU子系统在硬件仿真器上运行程序等重要的阶段性进展。

09、微核芯

微核芯主要从事RISC-V开源高性能通用CPU芯片的研发和销售。创始人郇丹丹及其团队是中科院计算所龙芯团队的核心成员,在高性能通用处理器领域拥有超过20年的研发、量产和市场推广经验,均获得过国家级科技奖励。

据了解,微核芯的产品方向包括开源高性能通用CPU芯片(包括数据中心服务器芯片和终端芯片)和开源高性能处理器平台。

10、超睿科技

超睿科技专注于研发RISC-V架构的高性能、高能效、智能化的多核处理器芯片产品。该公司自主设计开发采用RISC-V指令集架构的UR-A和UR-E系列处理器核IP,提供IP授权服务,同时开发自主品牌的桌面和服务器用高性能多核处理器芯片系列产品,提供面向应用领域的芯片产品定制化开发业务,满足专业领域的特定计算需求。

据介绍,超睿科技规划了A系列(高性能)、AE(高可靠性)、E系列(高能效)三个系列。A系列着重考虑性能,适用于桌面、服务器等应用场景,可落地于云计算、HPC、AI以及智能座舱等领域。目前,A系列的第一代处理器核UR-A1已经完成研发,第二代核UR-A2预计2024年6月完成研发。

发表回复