全新DDR5内存架构满足AI时代存储需求



By
jonson
03 7 月 24
0
comment

在如今诸多移动设备中,电源管理IC(PMIC)是最常见的芯片之一,它主要用于管理主机系统中的电源设备,将电池电压转换并分配到各个组件,就像人体的心脏向各个器官供血一样。包括像摄像头、显示、移动AP以及存储器等器件都需要PMIC芯片的支持。

尤其随着AI技术的发展,对于应用于数据中心中的DDR存储器提出了新的要求。Rambus产品营销副总裁John Eble表示:“目前,随着基于大语言模型(LLM)生成式AI技术的不断发展,它的功能也变得越来越强大,需要实现多模态输入和输出等功能,如给AI提供一段文字作为指令,AI产出的内容可能是一张图片;或者所输入的指令是包含了图片和文字的组合,而AI能够提供的是一张有改进的图片;也有可能输入的时是多张图片和一段文字,而AI能够产出一段视频,所以当这种多模态的输入输出功能被实现以后,生成式AI将有着无限的可能性。”

而为了实现这些功能,AI模型需要越来越多的数据量进行训练,以Open AI的ChatGPT为例,2022年发布的GPT-3使用了1750亿个参数进行训练;而在不久后,即2023年发布的GPT-4,它的训练参数量已经大幅增长至1.5万亿个。

如此庞大的AI工作负载也对内存带宽和容量的需求大幅增长,尤其在AI训练阶段,主内存的容量需求通常需要是GPU内存容量的两倍,并且还有一个额外的需求,就是这部分的主内存也必须有着非常高的带宽。只有这样,才能让GPU本地内存满足这个数据的吞吐速度。

基于此,DDR内存也进行了架构更新,新一代的DDR内存产品DDR5,它相较于前一代的DDR4最大的变化就是将PMIC芯片放在了DDR5内存条上。

John Eble表示:“在DDR4之前,PMIC芯片都集成在主板上,而到DDR5,将PMIC芯片放置在了DIMM端。这种改变带来了诸多优势,一是不仅可以节省主板空间,而且不再需要设计来自主板的电压调节对内存模块的支持;

二是由内存模组上的PMIC向模组提供输入高压12V电源,避免通过模块连接器从主板向内存模组组件输出如1V的电压,大大降低了输电网络上的IR下降问题;

三是为DIMM上的敏感元件提供了更严格的电容容差,帮助实现更高的DDR5目标性能水平。”

那为何需要做这一改变呢?John Eble解释道:“这与DDR5采用的全新架构有关。相较于DDR4,DDR5已经开始转移到了双通道架构,如下图中的双通道RCD在主机端以DDR5速度运行。因此,它的运行速度与DRAM相同。图中每个引脚的开关频率将比DDR4高出一倍多。DDR5的每通道最高频率速度达到8400MT/s(最高可达8800MT/s)。

因此,更高的数据传输速率(裕度至关重要)、所有这些数据信号所需的连接器引脚数量的增加以及主电源电压从1-1.2伏降至1.1伏,这些因素共同促使我们决定采用专用的电源管理IC,帮助控制更加精细的电压。”

DDR5和DDR4 RDIMM架构对比

因此,Rambus近期推出了全新的DDR5服务器PMIC系列,支持广泛的数据中心用例。据John Eble介绍,Rambus DDR5服务器PMIC系列包含了符合JEDEC超高电流(PMIC5020)、高电流(PMIC5000)和低电流(PMIC5010)规范的三款产品。

其中,PMIC5020将使未来几代DDR5 RDIMM的性能和容量达到新的基准。Rambus的这一PMIC芯片系列与其DDR5 RCD、SPD Hub个温度传感器IC一起组成了一个完整的内存接口芯片组,适用于各种DDR5 RDIMM配置和用例,也就是为RDIMM制造商提供“一站式”的解决方案。

另据John Eble介绍,极高电流的PMIC 5020目标是约30安培的最大持续直流电流,是这三种服务器PMIC中最新定义的。Rambus也是首家提供样品的公司。

高电流PMIC 5000一直是主要的PMIC,支持的最大持续直流电流大约为20安培。这款特定的PMIC针对标准到四阶模块,容量为64GB、96GB和128GB。低电流PMIC 5010面向容量较低的市场,它支持的最大持续电流约为12安培。

另外Rambus的DDR5产品也已经通过所有3家主要DRAM供应商的认证,RDIMM制造商不需要再进行重新验证,节省了产品开发时间,加快了产品的上市时间。

当然,将PMIC集成到内存条上也面临着一些设计挑战。John Eble表示,首先是散热问题。PMIC会产生热量,而且它靠近对热非常敏感的DRAM芯片,这是一个问题。因此,进行热模拟并确保热量以一种不会影响模块的方式消散,这一点非常重要。

第二个设计挑战实际上是如何将PMIC及其无源元件安装在模块上,因为模块的尺寸是固定的,而且模块上已经有很多元器件了。因此,为PMIC腾出空间,确保其功率完整性达到最佳状态,并确保其不会造成任何干扰或散热问题,这是一个很大的挑战。

第三个挑战是确保PMIC上的开关稳压器不会将任何不需要的噪声引入DIMM的其他部分。

最后一个设计挑战是需要确保PMIC芯片可靠且强大。现在PMIC位于可维修模块上,它可能会经历某些压力条件,如将模块插入插座或将其拔出时,需要进行插拔操作,这可能会影响到PMIC芯片。

AI时代的来临,为诸多行业带来了变革,内存作为关键组件之一,也不例外。在模块上安装PMIC就是一个显著的变化,John Eble表示,这遵循了微电子行业将供电设备尽可能靠近使用点的趋势,但DDR5内存模块是第一个在内存模块上集成PMIC的主要内存类型。未来,随着对更高性能和电源效率的需求不断增长,可能会定义新型内存模块。而且,这些模块很有可能会继续在模块上集成PMIC,以进一步优化电源管理并提高整体系统性能。

发表回复