高通 Adreno GPU 产品线已经在多代骁龙手机系统级芯片(SoC)中取得了显著成就。
高通的目标不仅限于手机市场,随着AI PC的机会,高通显然有更远大的抱负:进军更高功率和性能需求的领域。骁龙 X Elite,特别是其集成显卡Adreno X1,如何在竞争激烈的笔记本电脑市场中脱颖而出。
Part 1
Adreno X1:命名和架构
高通为其最新的骁龙 X Elite 选择了一个新颖的命名方式,将其集成显卡称为 Adreno X1。尽管内部驱动程序依然称其为 Adreno 741,这意味着 Adreno X1 是 Adreno 730 的扩展版本。Adreno 730 曾在骁龙 8+ Gen 1 手机芯片中表现不俗,而 Adreno X1 则进一步提升了性能。
在测试过程中,Adreno X1 在三星 Galaxy Book4 Edge 上表现优异,而英特尔的 Core Ultra 7 155H 和 AMD 的 Phoenix 也在各自的设备中进行了对比测试。
● GPU 性能:频率与内存子系统
为了应对高性能需求的 PC 游戏,高通对 Adreno X1 的频率进行了提升。在骁龙 X Elite 的高端版本中,Adreno X1 可以达到1.5 GHz的频率,而在我们测试的版本中被限制在1.25 GHz。这一频率远高于 Adreno 730 在骁龙 8+ Gen 1 中的900 MHz。
高通还增强了内存子系统,采用了128位的LPDDR5X内存控制器,支持高达64GB的DRAM容量,确保了GPU的稳定运行。与英特尔的 Xe-LPG iGPU 和 AMD 的 RDNA 3 iGPU 相比,Adreno X1 在理论FP32吞吐量上表现非常接近。
● 着色器处理器与执行单元
Adreno X1 由多个着色器处理器(SP)组成,每个SP包含两个微着色器处理器纹理处理器(uSPTP)。这种结构类似于AMD的RDNA系列和Nvidia的Maxwell及Pascal架构。Adreno X1 使用大型64宽或128宽向量(波),这使得它在处理数据时能够保持较高的效率。
高通没有公开Adreno X1的最大占用率,但每个uSPTP都拥有192KB的寄存器文件容量,比Adreno 730的64KB提高了50%。然而,这一改进并未完全解决高端着色器程序在使用大量寄存器时的延迟问题。
Part 2
内存访问与缓存结构
Adreno X1在内存访问和缓存方面也进行了优化。每个uSPTP专用的2KB纹理缓存确保了基本的内存访问效率。与AMD和英特尔的iGPU相比,Adreno X1在缓存带宽和延迟方面具有一定的竞争力。它新增了128KB的集群缓存,进一步优化了内存访问。