数码科技

Naples Q2到来:双路64核128线程,E5-2699A v4的2.5倍性能? 及个人解析

AMD刚刚在Youtube上发布了NipplesNaples的预热视频

地址:https://youtu.be/PN93G6Rg2ek

正好我刚刚写完关于Zen架构在Naples、Raven Ridge上能耗比预测的文章,这来的很及时。

Naples主要面向服务器/HPC,Zen架构设计之初首先考虑的市场。

Naples采用了4个Zeppelin die(Summit Ridge 8C),每个195.2mm2, 共780mm2,192亿晶体管,180W TDP

对比:Broadwell-EP HCC为456mm2,72亿晶体管,165W TDP

img015.jpg

每路Naples拥有最多32C/64T,8通道 DDR4,128条PCIe 3.0。

双路就有了64C/128T,2×8通道DDR4,32 个DIMM内存槽,128条PCIe 3.0通道!(双路时,每路CPU使用64条PCIe3.0通过Infinity Fabric通信,剩下的64条PCIe 3.0供拓展。

由于Zen架构的SoC设计,主板上不将再有芯片组,全部都由CPU集成。

img016.jpg

img011.jpg

img012.jpg

img013.jpg

并且AMD称Naples拥有几乎完美的拓展性,无论是核心数增加,还是双路,性能增长也几乎没有损失。

img017.jpg

img018.jpg


在测试中AMD的双路Naples样品使用16GB DIMM,共16通道 – 512GB DDR4 2400。而双路至强E5-2699v4在使用同样16GB DIMM的情况下,只能达到8通道 – 384GB DDR4 2400,PCIe也只有80条。

AMD称下面的这些测试对CPU,内存,I/O子系统都有压力。但进一步的详细系统设置没有披露,所以这些结果我们应该持保留态度。


img019.jpg

每路Naples采用了4个Zeppelin die(SummitRidge 8C)

每个195.2mm2,共780mm2,192亿晶体管。

双路时,每路CPU使用64条PCIe3.0通过Infinity Fabric通信

剩下的64条PCIe 3.0供拓展

所以才会有8×16=128的计算方法

img020.jpg

DEMO1中使用同样的DDR4 1866内存,两个平台均为44C/88T,Naples达到了2699v4的2倍性能。

img021.jpg


DEMO2中Naples用了频率更高的DDR4 2400,开启了全部的64个核心,跑出了712.85 COMPUTATIONS/s,而E5-2699A v4只有286.53 COMPUTATIONS/s,Naples为E5的2.5倍


img022.jpg

DEMO3中双路E5由于内存不足无法顺利完成,而Naples由于内存拓展能力更强,得以完成如此大量的模拟。


那么,如此性能,到底是AMD的Marketing bullshit还是实际可达到的呢?

可以继续往下看,下面是对Zen架构的能耗比解析。


在Ryzen 7系列的测试中,很多媒体注重于超频测试,但正如我之前说过的,高端Ryzen的超频空间非常小,大概在4.2GHz左右。

因为默频就已经很高,同时本来就是高密度库,Zeppelin用的还是低功耗制程(三星 14nm LPP)。

超频能力一般,那降频呢?

Bitsandchips在对1800X进行降频的过程中发现,Zeppelin在低频率下功耗比出色。

img002.png

img004.png

img005.png

平台功耗

Zeppelin可以在3.0GHz下达到0.8875V的vCore,通过测算出的TDP大概在45W。
而CinebenchR15分数依然有1300cb以上。

同样其他媒体比如ComputerBase的降频测试也差不多

都和之前我翻译的文章《AMD Ryzen: 严谨技术解析》:http://www.moepc.net/?post=1406

Anandtech论坛给出的曲线吻合

可以从曲线中看到,Zeppelin的频率在3.3GHz之前是完美的线性增长(每100MHz需要25mV)。首次偏差出现在3.3GHz,第二个也是最后一次偏差出现在3.5GHz。在这之后电压已经不是线性,需要的电压大幅上升。


OCRU做的表格,完全符合上面的结论,3.8GHz之后每100MHz都需要加0.1V电压。

所以在三星14nm LPP制程下,最理想的频率范围在2.1-3.3GHz,在这里Zen架构能发挥最佳能耗比。

在目前的Ryzen 7系列中,高端的1700X/1800X其实是通过牺牲部分能耗比,来达到高频率的,因为桌面版需要一定的高频率。(即便牺牲了能耗比功耗还是比Broadwell低…)

但在服务器/移动版上则不同,在这里能耗比至关重要。

上面这张图是Ryzen 7 1800X在不同cTDP下CinebenchR15的多核分数。

我们可以根据这些数据估计一下接下来的Naples和Raven Ridge潜能如何。


首先看看H2到来的RavenRidge,RavenRidge只使用了1个CCX,和目前的八核SummitRidge能耗比可能会稍有不同。


目前的APU,是由CPU+GPU共享TDP,因此经常会有一方被TDP所限制而无法完全发挥性能。


而Zeppelin的能耗比在低功耗下尤其出色。

25W cTDP,600cb,这是桌面版i5 6600/移动版4712MQ的默认水平。

30W cTDP,850cb,位于桌面版i7 6700和7700之间,高于7820HK(~767cb)。

35W cTDP,1000cb,大约是i7 5820K的默认水平。

45W TDP,2.8GHz,1200+cb,略高于桌面版i7 6850K。


说明用RavenRidge,甚至用目前的SummitRidge实现移动工作站,是可能的。

RavenRidge用单个CCX理论上能达到Broadwell移动版i7的性能,而功耗更优。


然后是Q2,一两个月后就将到来的Naples


img006.png

CERN在去年初就已经提到了Naples

img001.jpg

Naples实物

Naples主要面向服务器/HPC,Zen架构设计之初首先考虑到就是服务器/HPC市场,因为这里占营收的大块。

双路Naples拥有最多64C/128T,2×8通道 DDR4,32 个DIMM内存槽,128条PCIe 3.0通道。


img005.jpg

img002.jpg

img004.jpg

img007.jpg

img008.jpg

img009.jpg

img010.jpg

img014.jpg

Intel目前的E5-2699A v4为22C/44T 2.4-3.6GHz,145W TDP(Broadwell-EP)

E7-8890 v4为24C/48T 2.2-3.4GHz,165W TDP(Broadwell-EX)

而Purley(Skylake-EP/EX)最多也为28C/56T


点击查看原图

基于上面的能耗数据,可以预测:


由于45W下2个CCX的8C/16T Zeppelin可以达到2.8GHz,100W左右的16C/32T Naples估计能达到2400cb,

可以估计8个CCX的32C/64T [email protected]能有180W左右的TDP,而CinebenchR15分数可以达到4800左右,为2699v4的1.75倍。


更新:根据官方给出的双路Naples为2699V4的2.5倍性能来看,单路Naples应为2699V4的1.75倍,刚好与猜测吻合。



img003.png

点击查看原图

当然,这些只是个人目前的猜测,实际情况还是需要等到Naples的具体测试。


img001.jpg

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

37 评论

  1. 1个Zeppelin die能提供32条PCIE
    4个Zeppelin die=Naples 32C=128条PCIE
    单路为4×32=128条
    双路每个CPU只能提供4×16=64条,另外64条为Infinity Fabric使用
    所以一共是8×16=128条

  2. 每路Naples采用了4个Zeppelin die(SummitRidge 8C)······所以才会有8×16=128的计算方法
    结合图片看了很多遍还是不明白为什么会从这个推出那个?
    单路Naples从图片上看不是8个吗?1die=2内核?所以才单路4die?

  3. 那可能仅仅是物理层是pcie,实际跑的是别的东西;又或者是作为冗余存在的

  4. 而且这个die size都是错的
    实际die size在195mm2

  5. 原生最大应该是32。
    IO hub已经包含。我看过几乎所有主板的结构图 16 GFX 4NVME 4SB
    Naples单路可以给出128 Zeppelin单个就是32

  6. 你是想说单个summitrage die是32吧,ccx core直连df没任何其他io。
    桌面只给16+4+4可能是IO hub的带宽不足带来的的影响。
    https://i1.wp.com/thetechaltar.com/wp-content/uploads/2017/03/C6eUL0DWAAAeCQG.jpg
    我这边说不止32是因为后藤下面这个图里面标DDR4的其实是pcie才对,你可以看到die的中央下方还有一个2x,当然能不能用就不知道了。
    http://pc.watch.impress.co.jp/img/pcw/docs/1047/507/01.png

  7. 目前还是1U 2U主力 .这次已经塞了不少了…核心面积已经780了…

  8. 高密服务器现在都是1u塞4块双路版,x79时候5u塞8路的板子现在都没有了。
    估计以后这玩意也会出4路版,有些项目吃内存,有些项目吃运算能力,小实验室自己搭平台,一台机器能多塞点也还是好的。

  9. AM4接口支持32lanes PCIE,但目前只启用24。summitridge core的x光图甚至不止32

  10. 最上面第一幅图,单颗naples有128条PCIE??
    那这个是怎么胶水来的?8核不是最多24条吗?

  11. Anand说是单颗CPU就有128lanes……
    双路的时候每颗U拿出64lanes,以IF互联,所以2S时还是给你用128lanes……
    大概可以治治什么都希望直连CPU的强迫症患者吧……

  12. gg
    我的预测和官方的数据基本符合
    而且我预测是有依据的

  13. 顺带一提农企这种强行往2S系统里塞4S系统性能的做法,怕不是就是靠性价比暴力抢份额。

  14. 农企选择把单个Naples内部做成4X是因为现在的市场趋势是2S系统占主流,而之前的Opteron都是4S,但两者都一样是8CPU系统。4S和8S非常稀少而且面对mainframe的压力,所以农企干脆选择不管这部分,只能说玩的一手好田忌赛马。
    话说昨天看马文说Naples倍杀E5V4还想骂你满嘴跑火车,不过今天就被农企官方打脸233 PPT里演示的benchmark可以看出来是个单纯吃内存带宽的项目,不过这是公平的,因为server本来就是I/O intensive

  15. 4个die胶水的啊,比较关注片上的互联和散热。成本而言感觉这会比e5低一截的……价格战可以大打出手了

  16. 目前看到的是最多双路,因为对位直接是E5

  17. 肯定会有的 目前给出的是32C,不可能只有高端

  18. 已经证实了。Naples用了4个Zeppelin die(SummitRidge 8C的die),每个195.2mm2
    共780mm2,192亿晶体管。

  19. 读到这里我突然想起一个问题,两家无论是xeon圣斗士系列(xeon铂金银铜)还是naples都属于高端服务器(xeon是六通道内存,naples是八通道),接下来在中低端服务器(或中高端工作站)明显缺位(实际上就是目前xeon e5 26xx系列的对位)。Intel那边目前没有对应产品(Skylake单路xeon/i7 hedt没有对应双路版本),amd这边的naples如果是两颗16c的胶水,那么是否存在一个四通道的opteron(类似当年opteron 4000系列),这样正好填补这个空位(intel暂时没有对应产品)。

  20. 还有,这玩意不知最高可以支持几路?当年Opteron 6000最高支持4路~

  21. 我被demo那裡搞到混淆了…居然插2400的內存跑1866,這數量的dimm e5v4應該可以全速跑吧?

  22. 我用的是最后的注释里面的 不是PPT。
    而且内存用的是2400

  23. 双路8个胶水太可怕了,我特么很好奇开盖怎么排布。。噗

  24. “而双路至强E5-2699v4在使用同样16GB DIMM的情况下,只能达到8通道 – 384GB DDR4 2400。”
    2400處應為1866,ppt上也寫了,希望我沒理解錯
    用ccx堆沒應該是沒跑,但一個插座裡的封裝有多少片晶片(膠水)才是現在不知道的

  25. http://www.bilibili.com/video/av9027323/ 看了一下AMD官方的Naples介绍视频
    PO主文章应该有些错误,是双路提供128条PCIE3.0,每颗Naples应该是64。
    这么说来应该不是4×8胶水了。
    我觉得两个16比较可能。。

  26. Naples是8+8+8+8还是16+16还是原生32啊?
    原生32基本不太可能,8核面积就195了,芯片面积基本600到头嘛。
    原生16有没有可能?但是反正不共享三缓好像做原生16意义不大?
    但是8+8+8+8会不会胶水多了些?虽说成本超低,性价比超级高。。。。
    PO主有没有啥消息?

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮