突发!AMD新款处理器发布,用NPU强攻AI PC市场?



By
jonson
06 6 月 24
0
comment

来源:雷科技AI硬件组 |

编辑:冬日果酱 |

2024 台北电脑展,各家大厂都铆足了劲,尤其是英伟达、AMD、高通以及英特尔这几家。昨天,也就是 2024 台北电脑展前夜,英伟达率先举办了首场主题演讲,但这场演讲的内容与消费者的直接关系并不大,更多还是关于之前发布的 Blackwell GPU,Omniverse 和数字孪生技术。相较之下,AMD 的关系就大了。

6 月 3 日,2024 台北电脑展开幕首日,AMD CEO 苏姿丰在主题演讲期间发布了首发 Zen 5 架构的锐龙 9000 系列桌面处理器,以及下一代 AI PC 芯片——锐龙 AI 300 系列 APU(第三代)。其中,锐龙 AI 300 系列配备了号称「移动端最强 NPU」的 XDNA AI NPU,算力可达 50TOPS,超过高通骁龙 X Elite 宣称的 45TOPS,也达到了微软对新一代 AI PC「NPU 算力 40TOPS 以上」的标准。不仅如此,苏妈还表示锐龙 9000 系列桌面处理器将于 7 月上市,搭载锐龙 AI 300 系列的下一代 AI PC 也将从 7 月开始陆续发布,将包括惠普、华硕、联想等各大品牌。

留给高通、英特尔的时间不多了。桌面 PC 市场另谈,目前笔记本电脑市场每一家几乎都在强调 AI PC,而随着微软真正开始将基于端侧算力的 AI 功能导入 Windows,基于「NPU 算力 40TOPS 以上」的新一代 AI PC 与此前所有 PC 之间的区别可能会不断变大。

换言之,锐龙 AI 300 系列的上市,也意味着骁龙 X Elite 在 NPU 算力上保持优势的「窗口期」的结束。至于英特尔,是继续落后推出配备更强 NPU 算力的新一代处理器,还是更早推出,可能还要等候英特尔 CEO 帕特·基辛格(Pat Gelsinger)在 6 月 4 日的主题演讲。在此之前,锐龙 9000 系列桌面处理器以及锐龙 AI 300 系列才是重点。

1.Zen5 架构大改版,锐龙 9000 系列终于来了

事实上,在不久前外界都还以为,AMD 应该会在今年第四季度才会发布 Zen 5 架构的下一代桌面处理器。结果就在这几天,首发 Zen 5 架构的锐龙 9000 系列突然流出,又在 6 月 3 日发布,甚至很快就将于 7 月底正式上市。说回锐龙 9000 系列,首先肯定绕不开 Zen 5 架构的升级。官方表示,Zen 5 架构改进了分支预测精度和延迟、加宽流水线和矢量单元以提升吞吐量、加深整体窗口尺寸以提升并行度等。还提升了前端指令带宽、二级缓存至一级缓存/一级缓存至浮点单元数据带宽、AVX-512 指令吞吐量和 AI 性能,最高提升幅度可达 2 倍。

虽然 Zen5 架构目前公开的细节还很少,但可以肯定这是一次大改版,遵循了 Zen 架构奇数代大改的规律,也带来了大幅度的性能提升。官方声称,Zen 5 架构对比前代 IPC(每时钟指令数)平均提升了约 16%,在某些测试中甚至可以达到 35%。

锐龙 9000 系列依然采用了 Chiplet(小芯片)设计,包括一个 CCD 和一个 IOD,首发包括了四款型号:锐龙 9 9950X、锐龙 9 9900X、锐龙 7 9700X、锐龙 7 9600X。

其中,AMD 宣称锐龙 9 9950X 是「地表最强消费级 CPU」。16 核心 32 线程,配备 16MB 二级缓存和 64MB 三级缓存,还有 4GHz 基础频率、5.7GHz 加速频率以及 170W 的热设计功耗。这些规格和上代旗舰锐龙 9 7950X 基本一样,但得益于 Zen 5 架构的升级,锐龙 9 9950X 性能依然有了大幅提升。根据 AMD 官方测试,锐龙 9 9950X 与英特尔酷睿 i9-14900K 相比,在游戏场景中的速度快了 4%-23%,在生产力场景的测试中快了 7%-56%。其他型号当然也受益于 Zen5 的架构升级,对比上代:

    锐龙 9 9900X 还是 12 核心 24 线程、缓存和加速频率不变,但热设计功耗从 170W 降低到了 120W;锐龙 7 9700X 还是 8 核心 16 线程,缓存不变,但加速频率从 5.4GHz 提升到 5.5GHz,热设计功耗则从 105W 降至 65W;锐龙 7 9600X 还是 6 核心 12 线程,缓存不变,但加速频率从 5.3GHz 提升到 5.4GHz,热设计功耗同样从 105W 降至 65W。

2.50TOPS!最强移动端 NPU 算力

相比锐龙 9000 系列,笔记本电脑用户可能更关心的还是锐龙 AI 300 系列。去年年初,AMD 发布了全球首款集成独立 NPU 的 x86 处理器——锐龙 7040 系列,基于全新 XDNA 架构,独立 NPU 算力可达 10TOPS,异构算力可达 33TOPS。紧接着在年底,AMD 又发布了锐龙 8040 系列,将独立 NPU 算力提升到 16TOPS,异构算力提升到 39TOPS。但在最新发布的第三代锐龙 AI 300 系列上,AMD 在 NPU 上实现了算力的飞跃,可以独立提供高达 50TOPS 的 AI 算力,几乎翻了两番。除此之外,锐龙 AI 300 系列还集成了最新的 Zen 5 CPU 以及 RDNA 3.5 GPU,依然采用台积电 4nm 工艺。

图/ AMD这里需要指出的是,锐龙 AI 300 系列的 CPU 部分实际包括了 Zen 5 架构和 Zen 5c 架构(小核)。但不同于英特尔的「大小核」设计,Zen 5c 架构与 Zen 5 架构拥有一样的 IPC 性能,区别只是 Zen 5c 占用芯片面积更少,策略上也更注重低功耗。回到具体产品上,锐龙 AI 300 系列首发只有两款型号,包括锐龙 AI 9 HX 370 以及锐龙 AI 9 365。

其中,锐龙 AI 9 HX 370 作为旗舰产品,CPU 拥有 12 核心 24 线程,最高主频达 5.1GHz,二级缓存和三级缓存分别提升到了 12MB 和 24MB;被命名为「Radeon 890M」的 GPU 在升级架构之外,CU 单元也从 12 个增加到了 16 个。锐龙 AI 9 365 在各方面都有一些小变化,CPU 拥有 10 核心 20 线程,最高主频为 5.0GHz,二级缓存调整为 10MB;GPU 方面采用 Radeon 880M,CU 单元还是 12 个。性能方面,AMD 对比了目前所有主流处理器:

– 锐龙 AI 9 HX 370 在游戏性能方面比英特尔 Core Ultra 9 185H 强 36%;- 对比骁龙 X Elite 更是在日常办公、生产力创作、多任务以及图形等方面都有不同程度地领先;- 对比苹果 M3 同样优势明显,尤其是在 3D 图形性能上。

而在 NPU 方面,两款锐龙 AI 300 系列产品都采用了最新基于 XDNA 2 架构的 NPU,NPU 算力达到了目前移动端最强的 50TOPS。最后,AMD 表示搭载锐龙 AI 300 系列的笔记本将从 7 月份起陆续上市,目前已有 100 多款设计,涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要 OEM 品牌,其中华硕就覆盖了高中低多个档位的产品,包括 ROG 幻系列、ProArt 和无畏系列、灵耀和天选系列。最强 NPU 算力,

3.就是最好的 AI PC?

AI PC,毫无疑问是今年乃至未来数年 PC 行业最重要的议题,这种趋势当然也蔓延到了这届台北电脑展,各家主题演讲和展会活动的核心都离不开「AI PC」。其中竞争的关键一环在于 NPU 算力,包括 AMD、高通以及英特尔都在强调自家最新一代产品提供的 NPU 算力。

但诚然,NPU 算力目前来看将是各家新一代 AI PC 竞争的关键发力点,但绝对不能忽略 NPU 的实际功耗表现。我们要明白,强调 NPU 算力的本质,是希望通过 NPU 低功耗高 AI 性能的优势,将 AI 算力真正应用到 PC 的日常体验之中。

换言之,低功耗和高 AI 性能必须同时满足。然而以 XDNA 2 架构图来看,整体布局与上一代基本一致,更多的变化来自核心数量和内存模块的增加。其中,AI 计算引擎模块——AI Tile 的数量从 20 个增加到 32 个,内存模块——Mem Tile 的数量从 5 个增加到 8 个。

当然,我们也不能忽略 XDNA 2 架构上的改进,包括引入更多 AI 应用采用的 BF16 浮点精度,让很多 AI 应用不需要多一步转换,提高执行效率。但不管是高通的骁龙 X Elite,还是锐龙 AI 300 系列,抑或是英特尔即将发布的 Lunar Lake,实际上我们都还不能断定它们在 AI 应用上的表现,毕竟目前还没有任何一台真正搭载这三款处理器的上市产品:肯定不能只看纸面数据。

另一方面,更好的 NPU 就意味着更好的 AI PC 吗?应用生态是绕不开的一环,虽然之前发售的 AI PC 宣传铺天盖地,但实际上用上 AI 算力的应用少之又少,这方面苹果 Mac 甚至还比 Windows 阵营好些,至少你可以看到剪映等一批应用真的用上了端侧的 AI 算力。

M3 MacBook Air,所幸的是,当软件厂商也意识到 AI 是大势所趋的时候,推动应用生态是相对容易的。按照 AMD 的说法,他们 2024 年内的 ISV 合作厂商将超过 150 家,既有 Adobe、微软、Topaz Labs,也有百川智能、钉钉、无问芯穹、有道等国内软件厂商。同样的,微软、高通、英特尔也都会撬动更多的软件厂商在 AI 应用上适配新一代的 Windows,这是开放生态的优势。

不过开放生态也有自己的劣势。Windows 阵营每家努力的方向不尽相同,微软围绕 Windows 和 Copilot Runtime,高通的核心是骁龙 X 系列和 Windows on Arm 生态,AMD 和英特尔则围绕自己的处理器和 x86 生态,有时候甚至是互相拉扯。

4.还有一个问题

正所谓「不看广告看疗效」。公允地说,现在各家厂商宣传的 AI PC 还很难吸引大众消费者,最核心的问题是——消费者到底能用 AI PC 干什么?「消费者并不知道自己需要什么,直到我们拿出自己的产品,他们就发现,这是我要的东西。」乔布斯还解释到,「我是相信倾听消费者的,但是消费者并不清楚现在科技的发展水平,他们并不知道科技可以干什么,他们也不能预测下一个改变整个行业的突破口在哪里。」这是 PC 厂商应该承担的责任,在快速变化的生成式 AI 技术与消费者朴素的需求之间,用产品告诉普通用户 AI PC 的价值,满足那些过去求而不得的需求。

发表回复