Core i9-7980XE&Core i9-7960X评测 Part 1: 工作站性能【Anandtech】

剧毒术士马文2017-09-26最后更新: 2017-09-26

本文地址：http://www.moepc.net/?post=3106

Skylake-X产品线

X299平台CPU非AVX加速频率

Intel vs AMD

Intel vs Intel

对于架构的详细介绍不再赘述，可在以下帖子找到

http://www.moepc.net/?post=2068

http://www.moepc.net/?post=2065

Skylake-S的缓存为inclusive包含式

Skylake-X的缓存架构将L2增大至1MB，L3削减至1.375MB/核心

同时将用了将近8年的环形总线换为Mesh网格结构

文章认为Intel采用的是MoDe-X设计，通过简化为核心和IO部分保留更多功耗空间。

目前为止对于Mesh结构的褒贬不一。Mesh结构的拓展性比环形总线高，但没有环形总线那样经过十年以上的优化。而且有些用户指出Mesh的运行频率（通常为2.4GHz）在他们的软件里造成了瓶颈，因为原来的环形总线频率更高速度更快。Intel在今后几代应该会继续Mesh结构，比较关注会怎样进行改进。

同时还有AVX-512的加入

AVX-512单元占了相当一部分面积（大约为Skylake-S核心的20%）

AVX-512与AVX/AVX2一样，都是把一堆数据打包，只用一条指令执行这些所有操作。

打包数据为单条指令是很多密集计算任务的核心，且许多需要大量计算的专业用户和企业级软件都有为这些指令优化。目前大多数专业软件都能用到AVX或AVX2，对AVX-512的支持应该会在不久更新。

由于计算很密集，集中的能量消耗会很高（比正常核心逻辑要高）功耗也就很高 – 所以AVX512下运行频率通常会比较低。AVX-512本来是Intel至强的主打，但因为HEDT和企业至强用的是一个设计，如果软件支持，消费者也能占到AVX-512的优势。但运行简单任务、打打游戏之类不会带来任何提升，也就浪费了很大部分核心面积。

今天发布的这几款HCC处理器都支持双512bit FMA

1个是port 5的512bit FMA，1个是由port 0和port 1两个256bit FMA合并而来

Intel称6核及8核的LCC Skylake-X生产时就屏蔽了port 5，有少数报告称检测到port 5没被屏蔽。

解释Intel为何开始使用HCC晶片

Intel企业级至强CPU一般有3种设计：LCC、HCC（有时称为MCC）、XCC（有时称为HCC）

从LCC到XCC，核心数依次增加（有时增加的还有功能），采用3种设计比造单个大核心然后屏蔽更容易节省成本。LCC的大小比XCC小很多，所以平均下来良率会更好一些。

在企业级领域，Intel的至强产品线用到了这3种设计，这代是从4核（LCC阉割）到28核（XCC）。企业级平台内存通道更多，支持ECC以及更高容量内存，支持多路，以及其他RAS功能。一般这些功能到了消费级平台都会屏蔽。

以前Intel只把LCC晶片拿来做HEDT，有以下理由：

1.成本：如果买家想要XCC就得花大价钱，Intel的高端销量不会下降

2.软件：企业级软件对多核有良好优化，系统也是针对性的打造。而专业消费级需要全平台都能用，多核优化也没有那么好

3.性能：核心越多频率通常越低，对于企业级环境很适合，但对于消费级来说需要更快的反应速度及更好的交互体验。

4.平台集成：更大的核心需要额外的设计规则，一般是功耗或者功能方面的。为了支持这些，专业消费级平台就需要额外的设计/成本，或者砍掉拓展性。

那么是什么让Intel把HCC带进了HEDT专业消费级平台？

很多人给出的回答指向了AMD。今年AMD发布了自己的HEDT平台Ryzen Threadripper，999刀的16核有些出人意料，而且当时在部分（如果不是全部）关键测试还击败了Intel顶级的HEDT处理器。消极人士可能提建议为了继续保持领先，让Intel转向HCC，即便定价是AMD的两倍。

当然，把企业级处理器转到消费级平台不是马上就能完成的，很多分析者称Intel已经考虑了很久：内部进行测试，然后看市场风向来决定是否实行。分析者还认为数月前Intel发布Skylake-X时，除了核心数没有公布其他规格是因为：如果原计划有这些处理器，按照Intel以前的惯例，在那个时间点规格应该已经确定下来了。很可能引入HCC原本就在进行中，只是把HCC转到零售的i9是后来的决定，为了对抗高端产品线突然出现的威胁。

现在的问题是上面那4条对HEDT用户是否都适用：

1.成本：把18核定到1999价位，对消费级处理器是史无前例的，可以观察消费者的接受程度。对Intel的专业级至强会有影响，因为同级的要卖到接近3500刀；但Intel阉割的刀数已经足够拉开价位：内存通道（4 vs 6）、多路处理器支持（1 vs 4），ECC/RDIMM支持（有 vs 无）。消费级平台得到的是超频能力。

2.软件：Intel自从上代HEDT引入了“超级多任务”的概念，让用户能在同时运行多个软件：视频编码、直播、内容创作、模拟器等等。现在的要点在于，即便软件不能完全用到所有核心，同时运行多个实例或者多个不同软件也不会影响速度。解决方法只是把问题重新定义了，其他的什么也没做。

3.性能：与企业级处理器不同，Intel在HCC SKL-X处理器上提升了频率。基础频率略低，但加速频率高出许多，还有对TBM3的支持。缺点在于功耗方面。

4.平台集成：Intel通过将9款处理器3种不同设计放在同一个消费级平台，“解决了”这个问题。KBL-X和SKL-X的供电方式不同，内存支持不同，PCIE/IO数量也不同。起初发布时就有很多认为这会使平台过于复杂，会让人搞错（在我们测试中就搞坏了颗CPU）。

观点：为什么把“平台”PCIe也算上（并用在宣传上）很荒谬

处理器的PCIe数量，在我的记忆里，一直都是直接从PCIe根控制器里出来的，提供完整带宽，延迟也最低。现代系统中指的是处理器自身，更早一点的时期是指北桥。按此标准，intel主流处理器有16条，Ryzen有16或20条，Intel HEDT处理器有28或44条，AMD Ryzen Threadripper有60条。

Intel的文档里，清楚地列出了处理器PCIe根复合体出来的PCIe：上面是从2个16条以及1个12条PCIe的复合体里出来的44条PCIe通道。连到芯片组的是披着DMI3之名的PCIe 3.0 x4，但不包括在这44条里。

芯片组的PCIe则与此不同。芯片组是各种用途的PCIe交换：使用有限的上行带宽，为低带宽控制器（比如SATA/网络/USB）进行通信。AMD在这方面稍弱，为了提升竞争力重返市场，在纯CPU性能方面投入了更多精力，就把设计外包给了ASMedia。Intel近3代处理器以来就在增加芯片组支持的PCIe通道数，现在支持最多24条PCIe 3.0。虽然关于哪些通道支持哪种控制器有额外的说明，但总的来说还是算作24条。

由于共享PCIe 3.0 x4上行带宽，芯片组（AMD和Intel）的PCIe通道很容易就会瓶颈。绕道芯片组比直连延迟更高，也正因此重要硬件（显卡、RAID控制器、FPGA等）很少会连在芯片组上。

CPU和芯片组PCIe的区别导致平台功能和配置上的不同。比如X399平台CPU有60条PCIe，以下是推荐的配置组合：

现在Intel和AMD都开始把CPU和芯片组的PCIe算在一起，在宣传时候数字显得大一些。这直接无视了不同PCIe之间的差异，为了宣传这两家也顾不了这么多。比如Intel就把新的Skylake-X处理器宣传成“68条平台PCIe通道”，在CoffeeLake里也宣传为“40条PCIe”。

我想把这种现象扼杀在萌芽状态：说好听点是误导，说难听点就是欺骗，主要因为在过去这个参数都是指CPU PCIe（于是每个人都会忽略“平台”两字）。仅仅因为厂商想让数字看起来更好看，也不意味着他们有权利重新定义并误导消费者。

举个栗子：大概4-5年前，在智能手机领域，厂商开始把主处理器的所有东西都算作核心，加起来作为“总核心数”。GPU核心被称为“核心”，ISP等特殊IP模块变成了“核心”，安全IP模块也被称为“核心”。本来CPU部分只有4核 A7，却说SOC有15核是很荒谬的。当然关注手机业界的人注意到这类胡扯很快就消停了，什么都能称作“核心”，即便是虚假的并不存在的核心 – 如果再继续下去，“核心数”这个参数就不再具有意义。

如果“平台PCIe通道”的概念继续搞下去，同样的事情将会重演。

测试平台

性能测试

SPECwpc V2.1

PCMARK10

办公性能测试

Chromium编译

PCMARK8

渲染性能测试

Corona

Blender

LuxMark

POV-Ray

CinebenchR15

CPU编码性能测试

7-ZIP

WINRAR

AES

Handbrake H264/HEVC

系统性能测试

Adobe Reader DC PDF测试

FCAT处理

海豚模拟器

3DPM 2.1

DigiCortex

Agisoft Photoscan

旧版测试程序

3DPM V1

CinebenchR11.5/R10

X264 HD 3.0

功耗

测试首批Skylake-X处理器时，很明显Intel开始模糊TDP和功耗的区别。技术上来说TDP是一个以瓦为单位的值，代表CPU散热要能够让这么多的热能扩散开：140W TDP的CPU需要搭配至少140W散热能力的散热器。通常TDP也是判断功耗的一个很好的标准。140W TDP的CPU一般情况下会消耗140W功耗（加上部分效率损失）。

在以前，特别是主流CPU，即便是最新的CoffeeLake，Intel通常会将功耗压到比TDP低很多。i5-7600K的TDP为95W，测得功耗~61W，其中53W来自CPU核心。意思是说过去Intel在TDP方面很保守。

随着Skylake-X的发布，事情有了变化。由于过高的全核频率，全新的mesh结构，AVX-512的加入，以及增加的核心数，导致功耗达到了TDP，甚至在部分情况下超过TDP。7900X的140W TDP，测得功耗149W，6.4%的差距。前代6950X也是140W，但满载功耗只有111W。Intel的功耗策略随着Skylake-X发布开始转变，在核心数增加后变得愈加明显。

今天测试的这两款处理器也印证了同样的情况。7980XE和7960X均为165W TDP。测试使用Prime95压力测试，数据从硬件用来管理供电和频率响应的内部功耗管理寄存器中取得。虽然这方法作为物理测量不大精确，但更加通用，不需要一个个用工具测量，而且硬件自身就是用这些值来决定性能的。

满载情况下7960X的总封装功耗达到163W，几乎达到了165W的TDP。

然而7980XE远远超出这个值。满载全核3.4GHz，封装功耗达到190.36W。比TDP高了25W，相当于15.4%。我猜7980XE的实际TDP应该接近190W，保险一点应该是205W。不巧的是Intel起初设计Basin Falls平台时最高只到165W。为了提升频率和性能，Intel把预留的功耗冗余用光了，甚至还超出了不少。

我们的功耗测试软件测得这两款CPU满载时，IMC和mesh合起来功耗大概在42W。从满载功耗中刨去42W，7960X核心部分121W（每核7.5W），7980XE核心部分功耗140W（每核心7.8W）。

核心和IMC部分功耗增长最快的时候，是在4线程负载时 – 7980XE在4线程满载时功耗超过100W。当7980XE处于轻度负载，睿频启用时，单个核心平均功耗能达到20W，而满载时会降低不少（7.8W）。Ryzen也是一样，单核功耗可以达到17W，满载只有6W。很明显无论SKL-X还是Ryzen，能效最高的点应该在6-8W，而不是15-20W。

性价比分析

Chromium编译性价比

低端性价比异同寻常的高，Intel带HT的奔腾双核价格很低（实际价格并不低）。300刀以下市场Ryzen稍有优势，但在Ryzen 7 1700定位以上，Intel直到2000刀都有性价比优势。

Agisoft图像转换性价比

由于算法基于单线程，性能并没有随着核心数增加线性增长。Ryzen5的性价比要高于i5，但大多是情况下Intel性价比还是有优势。

Blender 性价比

在这里AMD在任何价格段都有性价比优势。

CinebenchR15多线程性价比

CinebenchR15更能反映大多数工作站负载的情况。

在每个价位AMD都能提供更多核心和线程数，AMD优势更大。

Corona 光线追踪性价比

光线追踪能够利用到更多核心，更高频率和IPC，加速指令以及高速浮点输出。AMD拥有很好的基础浮点性能。

与前面几个表格意义，最高的性价比依然在低端奔腾 – 然而性能并不是最好的。在主流价位Ryzen 5 1600和1600X性价比最高。

500-800刀价位Intel和AMD基本持平，然而在999刀价位Threadripper再次领先i9。更高价位Intel提供更高性能，但性价比也更差。

结论

功耗：测试里Intel的单核心功耗在7.5W-20W范围。全核满载时，加上mesh和IMC，7980XE的功耗达到190W，远超165W的TDP。对于把TDP当功耗的用户可能要当心了 – 想超频可能需要定制水冷。AMD Threadripper功耗大概177W，和180W TDP基本吻合。

平台：X299平台要兼容KabyLake-X，Skylake-X LCC和Skylake-X HCC。大部分主板对于高端的兼容都没什么问题，不过其他人测试建议供电可能需要主动散热。在CPU上投资1999刀，如果还想超频，就应该需要一块好的主板，而不是那些便宜的基本型号。有些买家可能会觉得AMD更好，Threadripper能直接同时为3块x16显卡 + 3块x4 NVME存储提供完整带宽，而不用降低3路带宽，SSD也不用绕道芯片组。

价格：1999刀是消费级处理器的新纪录。Intel敢卖这个价是因为它能 – 7980XE的确是工作站性能之王。性能足够高 – 想要这种级别性能的人基本不太在意性价比，特别是在软件授权就要10000刀的情况下。但对于其他人，除非你能用到TSX或者AVX-512，不然这价格就太高了，AMD在各个方面都更好。很难不考虑只需要一半价格的1950X。

?如果买家想要最好的工作站处理器，也不需要ECC支持，买Skylake-X

?如果买家需要ECC或者512GB内存，Xeon-W可能更好

?如果买家预算有限或者需要多卡计算，推荐Threadripper

本文地址：http://www.moepc.net/?post=3106

via：https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review

MOEPC.NET编译，转载请注明出处。

标签

剧毒术士马文2017-09-26最后更新: 2017-09-26

Core i9-7980XE&Core i9-7960X评测 Part 1: 工作站性能【Anandtech】

剧毒术士马文

发表回复取消回复

Playlist

Intel 22Q3 财报新信息

Intel 2021-2025展望 Part0：制程及封装

代号”Chagall”，AMD Threadripper 5000系列预计于8月份发布

Intel下代至强Sapphire Rapids 确认延期至2022Q2，性能定位相关

剧毒术士马文

Intel Core i9-7980XE/7960X测试: 18核的性能与价格，让一切都逊色【Computerbase】

Core i9-7980XE液氮超频至6.1GHz

相关文章

Intel 2021-2025展望 Part0：制程及封装

代号”Chagall”，AMD Threadripper 5000系列预计于8月份发布

SiFive发布P550/P270 RISC-V架构核，Intel 7nm制程平台2022年登场

Samsung Exynos Mobile Smartphone SoC SKU list

发表回复 取消回复

发表回复取消回复