数码科技

AMD Pinnacle Ridge 技术解析【IPC/工艺/性能】

本文地址:http://www.moepc.net/?post=4852

原文作者:The Stilt

来源:https://forums.anandtech.com/threads/ryzen-strictly-technical.2500572/page-72#post-39391302


这篇是Summit Ridge的:

AMD Ryzen: 严谨技术解析 http://www.moepc.net/?post=1406


这篇是Raven Ridge的:

AMD Raven Ridge CPU/GPU 架构性能解析【IPC、超频】http://www.moepc.net/?post=4372


Pinnacle Ridge的Zen核心也作出了与Raven Ridge APU同样的改变。


围绕Zen核心的最大变化在于L2缓存的延迟,从Summit Ridge的17 CKLs降至12 CLKs。剩下的就是制程、Scalable Data Fabric(SDF),IMC 和不同组件固件/软件配置。


相较Summit Ridge,Pinnacle Ridge的IPC平均要高约1.5%。部分对延迟敏感的程序(比如WinRAR)能达到8%。


测试采用的都是当时的最新版程序(18年2月-4月),所有公开或者自己编译的程序所用的Intel编译器都打了补丁,防止针对特定厂家CPU的优化。


3.8GHz 单线程IPC测试配置

  • R7 1700 3.8GHz
  • ASUS Crosshair VI Hero (bios 6001, PinnaclePI 1.0.0.0a)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • R7 2700X 3.8GHz
  • ASUS Crosshair VII Hero (bios 0097 ? 0505, PinnaclePI 1.0.0.0a ? 1.0.0.2)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • Core i7-8700K 3.8GHz (Ring / LLC 3.5GHz)
  • ASUS PRIME Z370-A (bios 0607 / 0613 打了最终版Spectre微码补丁 Spectre ?Code 0x84)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • Core i9-7960X 3.8GHz (Mesh / LLC 2.4GHz)
  • ASUS Rampage VI Apex (bios 1102 打了最终版Spectre微码补丁 Spectre ?Code 0x2000043)
  • Corsair LPX 3600C16 4x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334


关于表格


“ER”代表“Extremities Removed”,在总值中排除每款处理器成绩过好和过差的测试项目,降低极端情况影响。包括:Pinnacle Ridge的3DPM(过低)和WinRAR(过高);Coffee Lake的GCC(过低)和NBody(过高);Skylake-X的GCC(过低)和Linpack(过高)。


“Excl. >=256b”说明排除了128bit以上指令对性能影响较大的成绩,包括Coffee LakeSkylake-X的Embree、Variable Density Fluid Simulation、Linpack、NBody和X265。【相当于排除了Skylake Client支持的AVX2和Skylake Server支持的AVX2/AVX-512对性能的影响】


几周前我给出的IPC数字和现在的差距比较大,原因是libBullet这项测试。不知为何,以前libBullet在Ryzen CPU上的性能都很差,直到最近不知哪里改了,性能突然能和Intel CPU相当(比原来提升了3倍)。编译的程序、测试方法和系统设置都没动,可能是AGESA或者操作系统的更新解决了某些问题。


3.8GHz 单线程IPC测试结果


点击查看原图


SKU vs SKU 测试结果


测试配置:

  • R7 1800X
  • ASUS Crosshair VI Hero (bios 6001, PinnaclePI 1.0.0.0a)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • R7 2700X
  • ASUS Crosshair VII Hero (bios 0505, PinnaclePI 1.0.0.2)
  • G.Skill FlareX 3200C14 2x8GB, 2933MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.248 / 16299.334
  • PR Notes: “ASUS Performance Enhancement” == “Default”, “Precision Boost Override” & “Precision Boost Override Scalar” == “Auto” (Enabled).
  • Core i7-8700K
  • ASUS PRIME Z370-A (0613 w/ ?Code 0x84)
  • G.Skill FlareX 3200C14 2x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • CFL Notes: Power limits were manually enforced and verified (95W PL1, 119W PL2, 1 second Tau). 1C = 4.7GHz, 2C = 4.6GHz, 3C = 4.5GHz, 4-5C = 4.4GHz, 6C = 4.3GHz.【手动调了功耗限制】
  • Core i7-7820X
  • ASUS Rampage VI Apex (bios 1102 w/ final Spectre ?Code 0x2000043 patched in)
  • Corsair LPX 3600C16 4x8GB, 2666MHz CL14-14-14-32
  • Windows 10 Enterprise x64 16299.251 / 16299.334
  • SKL-X Notes: Ring/LLC was limited to 2.4GHz, power limits were manually enforced and verified (140W PL1, 175W PL2, 1 second Tau). Windows Update automatically installs TBM3 application, and therefore it was utilized during the tests. AVX2 / AVX512 offsets were manually enforced and verified. Single threaded workloads: non-AVX2/AVX512 = 4.5GHz (TB3), AVX2 = 4.0GHz, AVX512 = 3.8GHz. nT workloads: non-AVX2/AVX512 = 4.0GHz, AVX2 = 3.6GHz, AVX512 = 3.3GHz.【mesh默认2.4GHz,手动调了功耗限制,单线程频率:AVX2=4.0GHz,AVX512=3.8GHz,一般4.5GHz;多线程频率:AVX2=3.6GHz,AVX512=3.3GHz,一般4.0GHz


点击查看原图


做出的改变


Pinnacle Ridge采用GF 12nm LP(“Leading Performance”)工艺,属于14LPP的加强版。按照GF的说法,12LP提供>10%的性能提升和最多15%的密度提升(相较14LPP)。




Pinnacle Ridge对性能影响最大的调整之一是加速算法 – XFR2。上代Summit Ridge的XFR收到的反响不佳,因为XFR的实用性很差,没有达到宣传所说的效果。Summit Ridge的XFR频率基于活动的CPU核心数,类似于Intel的睿频。





而Pinnalce Ridge的XFR2则取决于物理限制,比如温度、功耗、电流或者稳定性。在达到任何一项限制之前,都可以保持高频率。



PPT: 主板插槽的功率容量

TDC: 主板VRM持续电流

EDC:主板VRM峰值/瞬间电流


400系主板新增的“Precision Boost Overdrive”功能则可以调高上面提到的物理限制的数值。105W TDP的SKU(比如2700X)的默认限制是这样设置的:PPT 141.75W,TDC 95A,EDC 140A,tJMax 85°C(绝对值,不带offset)。


打开“Precision Boost Overdrive”之后(AGESA默认是打开的),PPT基本上不受限制(1000W),TDC增加到114A,EDC增加到168A。主板厂商可以根据主板的设计及电气特征,自行调整这些限制。


人们通常会误以为XFR会自动超频,实则不然,无论是XFR还是XFR2都不会自动超频。XFR/XFR2只会尝试在设置的限制内最大化性能。比如默认的2700X加速频率永远都不会高于4.35GHz(宣传的最大频率)。


同一颗CPU里的不同核心,天生体质也不一样,并不是所有核心都能达到最大频率(需要太高电压)。




AMD给Pinnacle Ridge增加了“特挑核心”的功能,类似Intel Skylake-X的Turbo Boost Max 3.0。体质最好的两个核心能够达到标称的最大频率,其余核心频率略低。在Ryzen Master里,体质最好的核心用金色星星标注,体质第二好的核心则用银色星星标注。


点击查看原图


通常体质最好的是核心0,体质最差的是核心7。顺序可能会有变化,我这里测过的CPU的体质排序也都不一样。目前还不知道会不会有Ryzen的CPU亲和性管理软件,程序运行的单线程性能可能会有些许波动,纯粹看运气(把程序调度到体质好的核心去需要时间)。


一般情况下,体质最好和最差的核心之间的性能差距大约为1.8%,最差情况下大约3.6%(4.2GHz-4.35GHz)。除开“运气”(调度)因素,每颗CPU由于体质不同也有差距。


内存控制器


Pinnacle Ridge的内存控制器和Raven Ridge的相同。这俩的软件配置稍有区别,但用的是同样的PHY IP,控制器固件也是一样的。


相较Summit Ridge,Pinnacle Ridge改进的内存控制器延迟平均(2133-3466)要低<8.7%。当频率低于2666MHz时延迟差距最大,频率越高差距越小。


同时SDF延迟也稍有降低。CCX之间的通信延迟平均降低了<2.2%,也是频率越高差距越小。内存运行在3200MHz时,SDF延迟的改进几乎可以忽略不计。


点击查看原图


虽然Pinnacle Ridge改进了延迟是极好的,但平均内存延迟(DDR4 2133-3466)依然比Intel最接近的对手Coffee Lake高<38%。而且内存极限频率也和Summit Ridge、Raven Ridge相同。现实点估计DDR4 3400-3533,取决于CPU体质、主板和内存。体质好的CPU可能上到3600稳定。受测的所有2700X最多都只能达到DDR4 3400-3533(主板是C7H和B350I PRO AC),无论用什么设置和内存套装都一样。内存测试用的是“Ram Test”,因此要求门槛会比大多数测试媒体高。


测试的样品中:

  • 12.5%的2700X内存能达到3400MHz
  • 25.0%的2700X内存能达到3466MHz
  • 62.5%的2700X内存能达到3533MHz

不同体质CPU的内存控制器也有较大差距。大多数CPU给1.050V SoC电压就能达到DDR4 3466以上,区别在于加压之后。有些U增加SoC电压就能够达到更高内存频率,有的则完全上不去,甚至还有稳定性变差的情况。所有受测样品加压到1.150V SoC电压后稳定性都变差了(错误开始增加)。最稳定的高频都是用低于1.1V SoC电压达成的。


理论上某些主板可能能上的更高,不过总的来说内存超频受到的还是内存控制器本身的限制,而不是主板的信号布线。所以400系主板应该也没法明显提升内存超频性能。


工艺


和上代一样,高端Pinnacle Ridge的超频空间也非常之小。个人而言,我甚至反对超频2700X,因为大多数情况下超频会降低单线程性能。


点击查看原图


如上图所示,大致情况和Summit Ridge、Raven Ridge一致。直到3.5GHz为止都能保持优秀的能效,4.0GHz以下还算理想。再往上电压就会大幅增加,比如4.1GHz就需要在4.0基础上加0.112V电压,功耗也增加了41.5W(34.3%)。


再往上的话散热就成了问题,高端风冷和一体水冷在满载情况下基本会达到极限。开放式风冷测试平台,室温22°C的情况下,用利民的Thermalright Ultra 120 Extreme(搭配68CFM风扇)压制4.1GHz / 1.337V的2700X,拷机温度达到了93°C(包含10°C offset)。


下面这个功耗曲线只包含了VDDCR_CPU的功耗,只有CPU核心的功耗。还要加上CPU SoC的VDDRC_SOC功耗(一般15-30W,看给了多少SoC电压)才是整个CPU的功耗。


点击查看原图


Pinnacle Ridge的高温和降低的电压说明,GF的12LP制程漏电量比14LPP要高得多,降低的功耗没法补上电压的缺口。

4.2GHz往上是可能的,但想日常用基本得用非一体的高端水冷,高端主板,电压也会增加到不够安全的程度。

因此个人建议不要超频,推荐另辟蹊径 – 寻找XFR2留下的可能性。某些华硕主板就有额外的XFR2相关增强【Performance Enhancement设置,C6H/C7H之类的主板已经有了】,能够保持全核4.1GHz以上,两个体质较好的核心保持4.3GHz以上,而无需进入实际的超频模式【进入超频模式的话,如果你超不到4.3往上就相当于降低了单线程性能】。


华硕C7H,C6H更新BIOS后也有PE的设置


降低的那点全核性能比单线程性能提升要小得多,因为大多数CPU的全核频率都不会比4.1GHz高太多。个人估计,对于高端散热+高端主板用户,Pinnacle Ridge 八核的平均频率会在4.1-4.15GHz(上代平均3.85GHz)。




剩下部分后面会更新…


本文地址:http://www.moepc.net/?post=4852

MOEPC.NET编译,转载请保留出处。

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

42 评论

  1. 平台2600X C6H 换了几套内存,最终淘了HOF 3600 EX 内存电压。1.46V, soc 1.08v. 可以上3533 C14 稳定。
    注意soc 1.1v以上3533 压力测试会报错。 soc降压1.1V以下很稳
    记得zen soc可以上1.2V有利于内存超频, zen+ soc电压务必 低于1.1v ,否则稳定性是开倒车

    1. @超内存:zen+soc给1.05v就够用了,zen我倒是给到1.1日常

      1. @FlyWood:我的是zen+ 主板华硕c6h, 这板soc和NB电压好像绑定同频,
        如果soc 1.05v, NB电压也是1.05V左右, 这电压可能会影响CPU稳定。。。

  2. 怎么解释momoka开启CB15测得的L2 L3缓存延迟与ZEN+几乎一致?

  3. 2700x到手了,搭配x370taichi。因为bios原因,xfr2是不启用的,自然也没有pbo。cpu全默认+3200c14内存,r15得分1743(设置为实时的优先级分数是1782),看hwinfo的SVI2TFN 的cpu功耗(mosfet输出电流*输出电压),r15过程中最高到101w,全核频率3.85.
    在游戏(一个线程满载,多个线程有不同程度负载)时,频率在3.925上下波动。
    空载情况下,大约4个核心跑在3.0,剩下跑在4.0-4.25不等。

        1. @FlyWood:我的意思是用ryzenmaster超频单核,达到类似pbo的效果。

          1. @vagabond:我还是等等bios更新吧……

    1. @FlyWood:尝试vcore offset -0.075v:游戏频率上升至4.05;r15 4.0左右

  4. zen+温度传感细分出来CPU温度和二极管,而CPU二极管却总是80+,我的NZXT机箱风扇HUB只认那个二极管导致风扇一直全速….恶心

  5. 那么1700X 1800X+C6H可以用PE+超外频来玩吗 还有就是C6H用aida64之类的软件风扇会抽风的问题到底能不能修复…

      1. @FlyWood:好吧 在考虑要不要把1700X换2700X,我这个体制太雷了 自动的时候3.9就只有瞬间 绝大部分时间都是3.7 还是5周的前期版有segfault 虽然并没有体感上的区别也没遭遇过来自CPU方面的死机(倒是那张公版1080ti降压超频满载偶尔翻车,默认情况也有微量概率,蛮蛋疼)

  6. 我觉得ipc不应该差intel那么多啊!?我的错觉?GF的12nm lp性能也就这样了,希望7nm不要翻车,要求不高,至少甜点频率跑到4.4以上吧。现在频率上太吃亏了。

    1. @ウルサイ:本来Zen的IPC就在HSW BDW这个级别,Zen+又只是个微调的架构

    2. @ウルサイ:建议看除去256bit的IPC
      差距大概8%。
      游戏的话还会更小。

      1. @剧毒术士马文:我就想呢!4代-6代就提升了10%不到,6代-8代ipc零提升,纯粹是升频率和加核心,若是加上avx256的话,差了十几就可以接受了,A的设计在这方面是很吃亏。

  7. 你们好,请问Performance Enhancement设置在哪才能找到,翻了C6H的官方页似乎不见有对其的详尽说明,看B站的C6H超频教学视频里的UEFI界面也不知晓在哪

  8. GF还是不行
    不过12nm 比三星14nm略强点。 同频功耗更低

  9. 理论上某些主板可能能上的更高,不过总的来说内存超频受到的还是内存控制器本身的限制,而不是主板的信号布线。所以400系主板应该也没法明显提升内存超频性能。
    拿华擎和C6H做下对比?

  10. 12LP静态功耗增加了吗
    怪不得raven还是14lpp,用12lp续航可能尿崩

  11. 那么有没有什么方法可以把单核、多核睿频的频率按比例往上拉呢?

  12. 12LP制程漏电量比14LPP高得多。。。这么尴尬么

    1. @马文的小弟弟:这篇文章后面说到,2700x用了高静态漏电率的硅晶圆,为了能够以更低电压达到指定的频率

  13. 看游戏测评的视频,afterburner显示的是4.2ghz,难道是6核4.1+2核4.3?
    另外应该是每个ccx最好的核心是星星,第二好的是圆圈,剩下两个啥都没有。然后其实自己用ryzen master超频也可以只超单核。

    1. @vagabond:你说的是CCX内的体质
      文章里说的是整个die的体质
      这两个功能都有 不重复

  14. 看起来是2700x在x370上的时候ryzen master就不会有pbo的选项了么

    1. @FlyWood:有的,b350都有,只要更新最新的ryzen master。

      1. @vagabond:那么这次370和470可以说是没啥区别了啊,除了那个storemi软件

        1. @FlyWood:storemi是啥?
          不过可能300系主板没有400的好用,因为我试着超频单核没感觉出更好超。

          1. @vagabond:就是农企类似傲腾的功能,加速盘,不过所有ssd都可以用

          2. @vagabond:一个类似intel rst的软件,支持dram,3dxpoint,nvme盘和hdd变成一个混合盘

          3. @vagabond:主要是看300系开了pbo之后全核会不会更高吧

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮