尊龙凯时官网,尊龙凯时,AG尊龙凯时,尊龙娱乐,尊龙体育,尊龙凯时人生就是搏,尊龙凯时体育,尊龙凯时平台,ag尊龙,尊龙平台,尊龙,尊龙官网,尊龙登录入口,尊龙官方网站,尊龙app下载,尊龙凯时APP下载尊龙凯时官网,尊龙凯时,AG尊龙凯时,尊龙娱乐,尊龙体育,尊龙凯时人生就是搏,尊龙凯时体育,尊龙凯时平台,ag尊龙,尊龙平台,尊龙,尊龙官网,尊龙登录入口,尊龙官方网站,尊龙app下载,尊龙凯时APP下载尊龙凯时官网,尊龙凯时,AG尊龙凯时,尊龙娱乐,尊龙体育,尊龙凯时人生就是搏,尊龙凯时体育,尊龙凯时平台,ag尊龙,尊龙平台,尊龙,尊龙官网,尊龙登录入口,尊龙官方网站,尊龙app下载,尊龙凯时APP下载尊龙凯时官网,尊龙凯时,AG尊龙凯时,尊龙娱乐,尊龙体育,尊龙凯时人生就是搏,尊龙凯时体育,尊龙凯时平台,ag尊龙,尊龙平台,尊龙,尊龙官网,尊龙登录入口,尊龙官方网站,尊龙app下载,尊龙凯时APP下载

对追求超高性能或者对内存、扩展性能等特性有需求的工作站用户或专业用户而言,AMD的锐龙线程撕裂者系列处理器基本上是目前市场上唯一的选择,毕竟对手的HEDT平台自酷睿i9-10980XE、X299平台后就很长时间再无更新,至强处理器的核心数量也有明显不足。而在2022年3月,AMD发布的锐龙线WX系列处理器中,AMD就将单个插槽的处理器核心数量提升到了64核、128线程,把专业平台的性能推向了一个高峰。
在一年后的2023年10月,凭借着强大的创新与执行力,锐龙线WX系列的“接班人”按时到位。AMD特别邀请《微型计算机》记者前往AMD美国奥斯汀总部发布了其新一代AMD锐龙线WX系列、锐龙线系列处理器,以及新的Radeon Pro系列专业显卡,其AMD锐龙线程撕裂者处理器的最高单插槽处理器核心数量攀升至惊人的96核心、192线程。那么,全新的锐龙线程撕裂系列处理器有哪些型号和新的技术特性、新的Radeon Pro系列又有怎样的独特之处呢?今天本文就和大家一起来解读AMD线程撕裂者和Radeon Pro全新产品的配置、架构和相关性能信息。
在处理器发展历史上,AMD对Chiplet架构的应用绝对是值得重点铭记的经典技术应用案例。AMD通过Chiplet技术和处理器架构更新,极大地提高了单插槽处理器核心数量上限。除了针对企业级用户的EPYC处理器外,借由强大的架构、技术优势,AMD在2017年推出了首代锐龙线程撕裂者Ryzen Threadripper处理器,一上市就凭借强大的规格和极高的性能得到了工作站和专业用户的青睐。随后AMD又推出了多代线程撕裂者产品,无一不是占据了当时的处理器性能之王宝座。从市场角度来看,锐龙线程撕裂者整个产品线很好地填补了从HEDT平台到企业级平台之间的鸿沟,让工作站与专业用户也能够以较低的成本享受到企业级产品的技术,实现了从消费级到企业级产品的平滑过渡。
时间来到了2023年,AMD当前在市场上最重要的产品是以Zen 4架构为核心的锐龙系列处理器,以及EPYC 9004系列企业级产品。在锐龙线程撕裂者这条产品线上,AMD依旧依靠的是Zen 3架构的线系列。时不我待,终于在2023年10月中旬,AMD发布了全新的线程撕裂者系列,包括锐龙线 WX以及锐龙线系列。除此之外,AMD还发布了新的Radeon Pro W7900和Radeon Pro W7800,我们一起来了解一下这些产品的情况吧。
AMD给出的例子显示,虚拟产品、汽车仿真、老化基础设施改进模拟以及AI行业,在2023年到2032年的10年内,将拥有至少10%的增长率,诸如AI的年化复合增长速度可以达到19%,容量日渐增加,市场前景还是非常巨大的。AMD还给出一个数据,那就是工作站设备的性能从2017年到2023年增长了11倍,市场产品也覆盖了从台式机到笔记本电脑的各种形态,使用这种产品的企业也包含了包括阿斯顿马丁、EA、EPIC、FOX Sports等诸多不同行业和类型在内的企业。
在更具体的一些性能指标上面,AMD给出了锐龙线WX对比前代产品在技术上的提升,包括整体架构从之前的Zen 3提升到Zen 4,IPC得以大幅度提升(后文还有详细解读),L3缓存数量提升至384MB,核心数量从前代64颗提升至最多96颗,线线程。频率方面是本次线WX的亮点,提升至最高5.3GHz,对如此核心规模的处理器来说,依然能达到5GHz以上的超高频率是非常难能可贵的,很多最高频率在5.0GHz以上的处理器,一般产品核心数量要少得多。另外还有整体互联规格从之前的PCIe 4.0提升至PCIe 5.0,带来了互联性能的翻倍提升等。
本次AMD推出了6款锐龙线WX处理器产品,其中最高端的产品是7995WX,96核心192线核心、32核心、24核心、16核心和12核心的产品。除了96核心的7995WX外,其余的产品核心数量完美对位上代产品。但是值得注意的是,整体Boost频率都超越了5GHz,32核心以及以下产品的Boost频率甚至达到了5.3GHz。相比之下,上代产品的最高频率为4.5GHz,比新一代产品低了不少,相对应的上代产品TDP只有280W,新一代产品的功耗有所增加,达到了350W。
当然,如果有HEDT用户特别喜欢超多核心处理器,AMD也特别提到,AMD TRX50系列芯片组也是支持线WX系列处理器的,因此玩家也可以购买诸如锐龙线芯片组,实现HEDT平台的96核心192线程,这可能是目前市场上能够实现的单插槽性能最强的x86平台了。不过AMD没有提及线程撕裂者Pro系列处理器在TRX50芯片组的平台上使用后,Pro系列的安全特性等究竟是否可以开启,目前来看大概率也是直接关闭的,其他的包括内存通道、PCIe通道等,应该也不可能拥有Pro系列的规格了。接下来让我们继续深入了解,来看看线全系列究竟为什么这么强。
缓存方面最明显的改变是每个核心的L2缓存翻倍到了1MB,这样可以降低CPU核心的未命中率并增加命中率,同时也降低了从L3以及内存读取数据的几率。但是由于L2缓存增大,因此延迟也相应提升,L2目前的延迟增加到了最多14个周期,L3延迟提升至最多50个周期。L3缓存方面Zen 4继承了Zen 3的改进,那就是每个CCD中的8个CPU核心共享32MB L3缓存,L3相对L2采用了包含式设计,也就是说L3中拥有L2的数据标签,这样一来可以更好地探测数据存储情况并快速查找信息。
在指令集方面,Zen 4实现了对AVX 512指令集的支持。Zen 4采用了2个AVX 256来合并执行一个AVX 512,而英特尔采用了独立的AVX512 SIMD核心。AMD的设计可以节省晶体管资源,并且在很大程度上不需要降低频率来运行AVX 512,但是当同时执行AVX2和AVX512的时候,则必须完成一个后再执行另一个。AMD表示,自己的AVX-512比之前的Zen架构多核心执行FP32的工作效能提升了30%。此外,现在Zen 4也可以实现对BF16数据格式的支持了,这是AI计算中新兴起的一种重要数据格式。
首先来看整个锐龙线全系列的宏观结构图,从图中可知,完整版本的线个CCD,每个CCD有8颗CPU核心,12个CCD总计96颗CPU核心。所有CPU核心和外界数据的沟通交换都通过中央的IOD完成。IOD中布局了PCIe 5.0控制器、DDR5内存控制器、第三代Infinity Fabric以及安全处理器等。值得注意的是CCD的布局,12个CCD被平均分布在IOD左右,每侧6个,同时单侧的6个CCD也是上下各三个分布。
值得注意的是,目前给出的锐龙线程撕裂者宏观架构图对应的是Pro系列,一共12个CCD,而HEDT平台的锐龙线个CPU核心,因此只布局了8个CCD。另外,对那些核心数量低于96个的线程撕裂者Pro系列处理器来说,比如64个核心的Pro 7985WX,应该也是只有8个CCD启用,并且这8个CCD应该是更靠近IOD核心的,远端的部分则由一个单纯的硅片进行占位。AMD在EPYC处理器上有类似的方案,也就是不一定都采用有功能的CCD,或者干脆就是硅片。至于不让其空置的原因,AMD解释最主要原因是整个处理器PCB面积太大,需要受力平衡。
最后再来看看锐龙线WX系列处理器的IO配置方案。我们多次提到,本次最新的处理器最多可以提供128个PCIe 5.0通道,AMD还给了用户自由配置的方案,比如可以选择x16的配置,或者2个x8配置,或者4个x4、8个x2或者干脆16个x1,其中x1配置也可以转为其它接口使用,比如16个SATA接口等。不过每个高带宽PCIe通道最多只可以容纳9个设备,包含8个x1和1个x8配置。AMD还提到,目前新的产品所能提供的带宽拜PCIe 5.0所赐,比前代锐龙线%以上。
另外,根据AMD给出的锐龙线全系列平台示意图来看,锐龙线个PCIe 5.0,对应的是启用了所有的内存控制器、所有的GMI3总线以及所有的SERDES单元。相应的锐龙线个PCIe 5.0,对应的是只启用了4个DDR5内存控制器、GMI3连接也由于CCD变少而关闭了4个,另外2个SERDES单元对应的连接也直接关闭了不少,以降低PCIe 5.0总线数量。从这一点来看,锐龙线全系列产品使用的都是一样的IOD单元,只是通过屏蔽改变了部分功能。
锐龙线程撕裂者系列从处理器作为目前核心数量最多、功能特色最复杂的产品,其整体性能表现不但依靠于处理器本身的硬件架构,还在很大程度上依赖AMD和行业软件对CPU的优化,尤其是如何使用如此多的CPU核心以及CPU内部各种功能如何更好的配合行业软件发展等。好在现在的线程撕裂者系列处理器已经并非初代产品的吴下阿蒙状态,由于其产业地位和强势的性能表现,AMD和整个产业界逐渐形成了相互优化和相互匹配的正向循环。
首先是高效率利用所有的CPU核心。AMD提到很多应用计算资源耗费非常严重,可能需要数小时、数天才能计算完成,这就要求这类应用能够很好的针对处理器的优化,尤其是需要具有极高的并行性,比如3D渲染可以很好地分配在每一个CPU核心上进行,从而充分使用处理器的性能。不过,一些应用存在并行性方面的瓶颈或者问题,比如Silhouette Edge这类可以并行化但是尚未很好并行化的应用、H.264的编码这种具有结构序列化瓶颈的并行算法以及Adobe After Effects这种粗粒度并行化应用等,都需要双方配合做出很好的优化才能更高效率的执行,AMD也为其做出了相当多的努力。
第三再来看看有关SoC层级的优化。这部分内容主要是要求软件能够很好地使用缓存、内存子系统等,以避免数据不断的迁移所造成延迟和性能损失,另外很好的使用AVX 512也能够充分发挥系统性能。AMD进一步解释道,锐龙线缓存容量,每个CCD拥有32MB L3缓存, L3缓存总容量最高可达384MB,如果可以很好地使用所有缓存,尤其是利用AMD提供的三种线程绑定策略,应用程序将通过缓存容量获得显著的性能提升。
AMD给出了六款锐龙线程撕裂者Pro处理器的性能提升幅度参考值。从这些数据可以看出,在图形渲染、Keyshot光线追踪、Ansys mechanical机械分析软件中,顶级的7995WX可以调用所有96颗核心,相对其他产品拥有明显优势。而在其他测试中,核心数不多不少,工作频率高的7985WX、7975WX拥有不错的表现。这显示了全新架构、超多核心以及更高频率的AMD锐龙线WX系列所拥有的显著优势。
相对应的,AMD在高端市场方面布局了Radeon Pro W7900和Radeon Pro W7800两款产品,其中前者拥有48GB、384bit显存,96个CU和64TFLOPS算力,支持DP2.1和AV1编解码,TDP功耗控制在295W;后者则拥有32GB 256bit显存,70个CU和45TFLOPS算力,支持DP2.1和AV1编解码,TDP功耗控制在260W。这两款产品都采用了AMD最新的NAVI 31芯片和RDNA 3架构,整体性能和规格表现还是非常不错的。
除了两款定位高端的产品外,AMD还有Radeon Pro W7600和W7500两款定位中低端的产品。这两款产品都拥有8GB显存,CU单元分别是32和28个,算力方面则分别为20TFLOPS和12TFLOPS,支持AV1编解码,端口方面同样支持DP2.1,功耗最低甚至来到了70W。在和上代产品的对比中,W7500略低于W6600大约20%,但是W7600显著胜出W6600大约19%,形成了比较好的高低搭配。
由于多款产品存在,AMD目前能够针对高端、中端和低端市场形成完整布局。在专业显卡的御用测试:SPECviewperf测试中,入门级市场的W6400相比英伟达的T600、T400表现出了极高的性能优势。中端市场的W7500、W7600也能够完胜对手的T1000和A2000。高端和顶级市场方面,W7800和W7900带来了更好的性价比,同时性能展示出了针对同价位产品的优势。至此,AMD在专业级GPU上形成了完整的竞争布局。
至此,本文针对AMD锐龙线系列处理器以及Radeon Pro GPU的介绍就告一段落了。从这些处理器的技术规格、特性以及所展示出来的性能来看,至少在目前的市场上,这两大类处理器都拥有极强的竞争力。工作站方面,凭借96核心、64核心设计,AMD锐龙线WX的多线程性能在市场上几乎没有同类可以与之竞争。在HEDT高性能平台上,同样对手早也没有产品可以应对,而AMD不仅能让普通电脑的处理器核心数量提升到64核心,更能借助TRX50主板的“超能力”,让普通电脑也能使用PRO 7995WX这类顶级工作站处理器,将处理器核心数提升到96核心、192线程。而且它们还均拥有PBO精准性能提升技术,并支持手动超频,对于没有搭建服务器条件,但需要强悍处理器性能的用户来说,AMD锐龙线系列处理器的确就是市场上仅有的选择。