数码科技

Core i9-7980XE&Core i9-7960X评测 Part 1: 工作站性能【Anandtech】

本文地址:http://www.moepc.net/?post=3106

Skylake-X产品线

X299平台CPU非AVX加速频率

Intel vs AMD

QQ截图20170925155700.png

Intel vs Intel

QQ截图20170925155709.png

对于架构的详细介绍不再赘述,可在以下帖子找到

http://www.moepc.net/?post=2068

http://www.moepc.net/?post=2065

Skylake-S的缓存为inclusive包含式

inclusive_caches.png

Skylake-X的缓存架构将L2增大至1MB,L3削减至1.375MB/核心




同时将用了将近8年的环形总线换为Mesh网格结构

mode-x_2d_rep_575px.png

文章认为Intel采用的是MoDe-X设计,通过简化为核心和IO部分保留更多功耗空间。

目前为止对于Mesh结构的褒贬不一。Mesh结构的拓展性比环形总线高,但没有环形总线那样经过十年以上的优化。而且有些用户指出Mesh的运行频率(通常为2.4GHz)在他们的软件里造成了瓶颈,因为原来的环形总线频率更高速度更快。Intel在今后几代应该会继续Mesh结构,比较关注会怎样进行改进。

同时还有AVX-512的加入

AVX-512单元占了相当一部分面积(大约为Skylake-S核心的20%)

AVX-512与AVX/AVX2一样,都是把一堆数据打包,只用一条指令执行这些所有操作。

QQ截图20170925213722.png

打包数据为单条指令是很多密集计算任务的核心,且许多需要大量计算的专业用户和企业级软件都有为这些指令优化。目前大多数专业软件都能用到AVX或AVX2,对AVX-512的支持应该会在不久更新。

由于计算很密集,集中的能量消耗会很高(比正常核心逻辑要高)功耗也就很高 – 所以AVX512下运行频率通常会比较低。AVX-512本来是Intel至强的主打,但因为HEDT和企业至强用的是一个设计,如果软件支持,消费者也能占到AVX-512的优势。但运行简单任务、打打游戏之类不会带来任何提升,也就浪费了很大部分核心面积。

今天发布的这几款HCC处理器都支持双512bit FMA

1个是port 5的512bit FMA,1个是由port 0和port 1两个256bit FMA合并而来

Intel称6核及8核的LCC Skylake-X生产时就屏蔽了port 5,有少数报告称检测到port 5没被屏蔽。


解释Intel为何开始使用HCC晶片

Intel企业级至强CPU一般有3种设计:LCC、HCC(有时称为MCC)、XCC(有时称为HCC)

从LCC到XCC,核心数依次增加(有时增加的还有功能),采用3种设计比造单个大核心然后屏蔽更容易节省成本。LCC的大小比XCC小很多,所以平均下来良率会更好一些。

QQ截图20170926012123.png

在企业级领域,Intel的至强产品线用到了这3种设计,这代是从4核(LCC阉割)到28核(XCC)。企业级平台内存通道更多,支持ECC以及更高容量内存,支持多路,以及其他RAS功能。一般这些功能到了消费级平台都会屏蔽。

以前Intel只把LCC晶片拿来做HEDT,有以下理由:

1.成本:如果买家想要XCC就得花大价钱,Intel的高端销量不会下降

2.软件:企业级软件对多核有良好优化,系统也是针对性的打造。而专业消费级需要全平台都能用,多核优化也没有那么好

3.性能:核心越多频率通常越低,对于企业级环境很适合,但对于消费级来说需要更快的反应速度及更好的交互体验。

4.平台集成:更大的核心需要额外的设计规则,一般是功耗或者功能方面的。为了支持这些,专业消费级平台就需要额外的设计/成本,或者砍掉拓展性。

那么是什么让Intel把HCC带进了HEDT专业消费级平台?

很多人给出的回答指向了AMD。今年AMD发布了自己的HEDT平台Ryzen Threadripper,999刀的16核有些出人意料,而且当时在部分(如果不是全部)关键测试还击败了Intel顶级的HEDT处理器。消极人士可能提建议为了继续保持领先,让Intel转向HCC,即便定价是AMD的两倍。

当然,把企业级处理器转到消费级平台不是马上就能完成的,很多分析者称Intel已经考虑了很久:内部进行测试,然后看市场风向来决定是否实行。分析者还认为数月前Intel发布Skylake-X时,除了核心数没有公布其他规格是因为:如果原计划有这些处理器,按照Intel以前的惯例,在那个时间点规格应该已经确定下来了。很可能引入HCC原本就在进行中,只是把HCC转到零售的i9是后来的决定,为了对抗高端产品线突然出现的威胁。

现在的问题是上面那4条对HEDT用户是否都适用:

1.成本:把18核定到1999价位,对消费级处理器是史无前例的,可以观察消费者的接受程度。对Intel的专业级至强会有影响,因为同级的要卖到接近3500刀;但Intel阉割的刀数已经足够拉开价位:内存通道(4 vs 6)、多路处理器支持(1 vs 4),ECC/RDIMM支持(有 vs 无)。消费级平台得到的是超频能力。

2.软件:Intel自从上代HEDT引入了“超级多任务”的概念,让用户能在同时运行多个软件:视频编码、直播、内容创作、模拟器等等。现在的要点在于,即便软件不能完全用到所有核心,同时运行多个实例或者多个不同软件也不会影响速度。解决方法只是把问题重新定义了,其他的什么也没做。

3.性能:与企业级处理器不同,Intel在HCC SKL-X处理器上提升了频率。基础频率略低,但加速频率高出许多,还有对TBM3的支持。缺点在于功耗方面。

4.平台集成:Intel通过将9款处理器3种不同设计放在同一个消费级平台,“解决了”这个问题。KBL-X和SKL-X的供电方式不同,内存支持不同,PCIE/IO数量也不同。起初发布时就有很多认为这会使平台过于复杂,会让人搞错(在我们测试中就搞坏了颗CPU)。


观点:为什么把“平台”PCIe也算上(并用在宣传上)很荒谬

处理器的PCIe数量,在我的记忆里,一直都是直接从PCIe根控制器里出来的,提供完整带宽,延迟也最低。现代系统中指的是处理器自身,更早一点的时期是指北桥。按此标准,intel主流处理器有16条,Ryzen有16或20条,Intel HEDT处理器有28或44条,AMD Ryzen Threadripper有60条。

skl-x_pcie_lane_partitioning.png

Intel的文档里,清楚地列出了处理器PCIe根复合体出来的PCIe:上面是从2个16条以及1个12条PCIe的复合体里出来的44条PCIe通道。连到芯片组的是披着DMI3之名的PCIe 3.0 x4,但不包括在这44条里。

芯片组的PCIe则与此不同。芯片组是各种用途的PCIe交换:使用有限的上行带宽,为低带宽控制器(比如SATA/网络/USB)进行通信。AMD在这方面稍弱,为了提升竞争力重返市场,在纯CPU性能方面投入了更多精力,就把设计外包给了ASMedia。Intel近3代处理器以来就在增加芯片组支持的PCIe通道数,现在支持最多24条PCIe 3.0。虽然关于哪些通道支持哪种控制器有额外的说明,但总的来说还是算作24条。

由于共享PCIe 3.0 x4上行带宽,芯片组(AMD和Intel)的PCIe通道很容易就会瓶颈。绕道芯片组比直连延迟更高,也正因此重要硬件(显卡、RAID控制器、FPGA等)很少会连在芯片组上。

CPU和芯片组PCIe的区别导致平台功能和配置上的不同。比如X399平台CPU有60条PCIe,以下是推荐的配置组合:

QQ截图20170925155802.png

现在Intel和AMD都开始把CPU和芯片组的PCIe算在一起,在宣传时候数字显得大一些。这直接无视了不同PCIe之间的差异,为了宣传这两家也顾不了这么多。比如Intel就把新的Skylake-X处理器宣传成“68条平台PCIe通道”,在CoffeeLake里也宣传为“40条PCIe”。

8th-gen-intel-core-overview_04_575px.png

我想把这种现象扼杀在萌芽状态:说好听点是误导,说难听点就是欺骗,主要因为在过去这个参数都是指CPU PCIe(于是每个人都会忽略“平台”两字)。仅仅因为厂商想让数字看起来更好看,也不意味着他们有权利重新定义并误导消费者。

举个栗子:大概4-5年前,在智能手机领域,厂商开始把主处理器的所有东西都算作核心,加起来作为“总核心数”。GPU核心被称为“核心”,ISP等特殊IP模块变成了“核心”,安全IP模块也被称为“核心”。本来CPU部分只有4核 A7,却说SOC有15核是很荒谬的。当然关注手机业界的人注意到这类胡扯很快就消停了,什么都能称作“核心”,即便是虚假的并不存在的核心 – 如果再继续下去,“核心数”这个参数就不再具有意义。

如果“平台PCIe通道”的概念继续搞下去,同样的事情将会重演。

测试平台

QQ截图20170925155818.png

性能测试

SPECwpc V2.1

QQ截图20170925160136.png

QQ截图20170925160627.png

QQ截图20170925160638.png

QQ截图20170925160655.png

QQ截图20170925160857.png

QQ截图20170925160909.png

QQ截图20170925160924.png

QQ截图20170925160946.png

QQ截图20170925160958.png

PCMARK10

91529.png

91530.png

91531.png

91532.png

办公性能测试

Chromium编译

91542.png

PCMARK8

91527.png

91528.png

渲染性能测试

Corona

91511.png

Blender

91512.png

LuxMark

91513.png

POV-Ray

91515.png

CinebenchR15

91517.png

91516.png

CPU编码性能测试

7-ZIP

91520.png

91518.png

91519.png

WINRAR

91521.png

AES

91522.png

Handbrake H264/HEVC

91523.png

91524.png

91525.png

系统性能测试

Adobe Reader DC PDF测试

91505.png

FCAT处理

91506.png

海豚模拟器

91508.png

3DPM 2.1

91507.png

DigiCortex

91509.png

Agisoft Photoscan

91510.png

旧版测试程序

3DPM V1

91543.png

91544.png

CinebenchR11.5/R10

91547.png

91548.png

91549.png

91550.png

X264 HD 3.0

91545.png

91546.png

功耗

测试首批Skylake-X处理器时,很明显Intel开始模糊TDP和功耗的区别。技术上来说TDP是一个以瓦为单位的值,代表CPU散热要能够让这么多的热能扩散开:140W TDP的CPU需要搭配至少140W散热能力的散热器。通常TDP也是判断功耗的一个很好的标准。140W TDP的CPU一般情况下会消耗140W功耗(加上部分效率损失)。

在以前,特别是主流CPU,即便是最新的CoffeeLake,Intel通常会将功耗压到比TDP低很多。i5-7600K的TDP为95W,测得功耗~61W,其中53W来自CPU核心。意思是说过去Intel在TDP方面很保守。

随着Skylake-X的发布,事情有了变化。由于过高的全核频率,全新的mesh结构,AVX-512的加入,以及增加的核心数,导致功耗达到了TDP,甚至在部分情况下超过TDP。7900X的140W TDP,测得功耗149W,6.4%的差距。前代6950X也是140W,但满载功耗只有111W。Intel的功耗策略随着Skylake-X发布开始转变,在核心数增加后变得愈加明显。

今天测试的这两款处理器也印证了同样的情况。7980XE和7960X均为165W TDP。测试使用Prime95压力测试,数据从硬件用来管理供电和频率响应的内部功耗管理寄存器中取得。虽然这方法作为物理测量不大精确,但更加通用,不需要一个个用工具测量,而且硬件自身就是用这些值来决定性能的。

91497.png

满载情况下7960X的总封装功耗达到163W,几乎达到了165W的TDP。

然而7980XE远远超出这个值。满载全核3.4GHz,封装功耗达到190.36W。比TDP高了25W,相当于15.4%。我猜7980XE的实际TDP应该接近190W,保险一点应该是205W。不巧的是Intel起初设计Basin Falls平台时最高只到165W。为了提升频率和性能,Intel把预留的功耗冗余用光了,甚至还超出了不少。

我们的功耗测试软件测得这两款CPU满载时,IMC和mesh合起来功耗大概在42W。从满载功耗中刨去42W,7960X核心部分121W(每核7.5W),7980XE核心部分功耗140W(每核心7.8W)。

91499.png

核心和IMC部分功耗增长最快的时候,是在4线程负载时 – 7980XE在4线程满载时功耗超过100W。当7980XE处于轻度负载,睿频启用时,单个核心平均功耗能达到20W,而满载时会降低不少(7.8W)。Ryzen也是一样,单核功耗可以达到17W,满载只有6W。很明显无论SKL-X还是Ryzen,能效最高的点应该在6-8W,而不是15-20W。

性价比分析

Chromium编译 性价比

compile_ppd_575px.png

低端性价比异同寻常的高,Intel带HT的奔腾双核价格很低(实际价格并不低)。300刀以下市场Ryzen稍有优势,但在Ryzen 7 1700定位以上,Intel直到2000刀都有性价比优势。

Agisoft图像转换 性价比

agisoft_ppd_575px.png

由于算法基于单线程,性能并没有随着核心数增加线性增长。Ryzen5的性价比要高于i5,但大多是情况下Intel性价比还是有优势。

Blender 性价比

blender_ppd_575px.png

在这里AMD在任何价格段都有性价比优势。

CinebenchR15多线程 性价比

CinebenchR15更能反映大多数工作站负载的情况。

cinebench_ppd_575px.png

在每个价位AMD都能提供更多核心和线程数,AMD优势更大。

Corona 光线追踪 性价比

光线追踪能够利用到更多核心,更高频率和IPC,加速指令以及高速浮点输出。AMD拥有很好的基础浮点性能。

corona_ppd_575px.png

与前面几个表格意义,最高的性价比依然在低端奔腾 – 然而性能并不是最好的。在主流价位Ryzen 5 1600和1600X性价比最高。

500-800刀价位Intel和AMD基本持平,然而在999刀价位Threadripper再次领先i9。更高价位Intel提供更高性能,但性价比也更差。

结论

QQ截图20170926003733.png

功耗:测试里Intel的单核心功耗在7.5W-20W范围。全核满载时,加上mesh和IMC,7980XE的功耗达到190W,远超165W的TDP。对于把TDP当功耗的用户可能要当心了 – 想超频可能需要定制水冷。AMD Threadripper功耗大概177W,和180W TDP基本吻合。

平台:X299平台要兼容KabyLake-X,Skylake-X LCC和Skylake-X HCC。大部分主板对于高端的兼容都没什么问题,不过其他人测试建议供电可能需要主动散热。在CPU上投资1999刀,如果还想超频,就应该需要一块好的主板,而不是那些便宜的基本型号。有些买家可能会觉得AMD更好,Threadripper能直接同时为3块x16显卡 + 3块x4 NVME存储提供完整带宽,而不用降低3路带宽,SSD也不用绕道芯片组。

价格:1999刀是消费级处理器的新纪录。Intel敢卖这个价是因为它能 – 7980XE的确是工作站性能之王。性能足够高 – 想要这种级别性能的人基本不太在意性价比,特别是在软件授权就要10000刀的情况下。但对于其他人,除非你能用到TSX或者AVX-512,不然这价格就太高了,AMD在各个方面都更好。很难不考虑只需要一半价格的1950X。

?如果买家想要最好的工作站处理器,也不需要ECC支持,买Skylake-X

?如果买家需要ECC或者512GB内存,Xeon-W可能更好

?如果买家预算有限或者需要多卡计算,推荐Threadripper

本文地址:http://www.moepc.net/?post=3106

via:https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review

MOEPC.NET编译,转载请注明出处。

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮