Core i9-7980XE&Core i9-7960X评测 Part 1: 工作站性能【Anandtech】
本文地址:http://www.moepc.net/?post=3106
Skylake-X产品线
X299平台CPU非AVX加速频率
Intel vs AMD
Intel vs Intel
对于架构的详细介绍不再赘述,可在以下帖子找到
http://www.moepc.net/?post=2068
http://www.moepc.net/?post=2065
Skylake-S的缓存为inclusive包含式
Skylake-X的缓存架构将L2增大至1MB,L3削减至1.375MB/核心
同时将用了将近8年的环形总线换为Mesh网格结构
文章认为Intel采用的是MoDe-X设计,通过简化为核心和IO部分保留更多功耗空间。
目前为止对于Mesh结构的褒贬不一。Mesh结构的拓展性比环形总线高,但没有环形总线那样经过十年以上的优化。而且有些用户指出Mesh的运行频率(通常为2.4GHz)在他们的软件里造成了瓶颈,因为原来的环形总线频率更高速度更快。Intel在今后几代应该会继续Mesh结构,比较关注会怎样进行改进。
同时还有AVX-512的加入
AVX-512单元占了相当一部分面积(大约为Skylake-S核心的20%)
AVX-512与AVX/AVX2一样,都是把一堆数据打包,只用一条指令执行这些所有操作。
打包数据为单条指令是很多密集计算任务的核心,且许多需要大量计算的专业用户和企业级软件都有为这些指令优化。目前大多数专业软件都能用到AVX或AVX2,对AVX-512的支持应该会在不久更新。
由于计算很密集,集中的能量消耗会很高(比正常核心逻辑要高)功耗也就很高 – 所以AVX512下运行频率通常会比较低。AVX-512本来是Intel至强的主打,但因为HEDT和企业至强用的是一个设计,如果软件支持,消费者也能占到AVX-512的优势。但运行简单任务、打打游戏之类不会带来任何提升,也就浪费了很大部分核心面积。
今天发布的这几款HCC处理器都支持双512bit FMA
1个是port 5的512bit FMA,1个是由port 0和port 1两个256bit FMA合并而来
Intel称6核及8核的LCC Skylake-X生产时就屏蔽了port 5,有少数报告称检测到port 5没被屏蔽。
解释Intel为何开始使用HCC晶片
Intel企业级至强CPU一般有3种设计:LCC、HCC(有时称为MCC)、XCC(有时称为HCC)
从LCC到XCC,核心数依次增加(有时增加的还有功能),采用3种设计比造单个大核心然后屏蔽更容易节省成本。LCC的大小比XCC小很多,所以平均下来良率会更好一些。
在企业级领域,Intel的至强产品线用到了这3种设计,这代是从4核(LCC阉割)到28核(XCC)。企业级平台内存通道更多,支持ECC以及更高容量内存,支持多路,以及其他RAS功能。一般这些功能到了消费级平台都会屏蔽。
以前Intel只把LCC晶片拿来做HEDT,有以下理由:
1.成本:如果买家想要XCC就得花大价钱,Intel的高端销量不会下降
2.软件:企业级软件对多核有良好优化,系统也是针对性的打造。而专业消费级需要全平台都能用,多核优化也没有那么好
3.性能:核心越多频率通常越低,对于企业级环境很适合,但对于消费级来说需要更快的反应速度及更好的交互体验。
4.平台集成:更大的核心需要额外的设计规则,一般是功耗或者功能方面的。为了支持这些,专业消费级平台就需要额外的设计/成本,或者砍掉拓展性。
那么是什么让Intel把HCC带进了HEDT专业消费级平台?
很多人给出的回答指向了AMD。今年AMD发布了自己的HEDT平台Ryzen Threadripper,999刀的16核有些出人意料,而且当时在部分(如果不是全部)关键测试还击败了Intel顶级的HEDT处理器。消极人士可能提建议为了继续保持领先,让Intel转向HCC,即便定价是AMD的两倍。
当然,把企业级处理器转到消费级平台不是马上就能完成的,很多分析者称Intel已经考虑了很久:内部进行测试,然后看市场风向来决定是否实行。分析者还认为数月前Intel发布Skylake-X时,除了核心数没有公布其他规格是因为:如果原计划有这些处理器,按照Intel以前的惯例,在那个时间点规格应该已经确定下来了。很可能引入HCC原本就在进行中,只是把HCC转到零售的i9是后来的决定,为了对抗高端产品线突然出现的威胁。
现在的问题是上面那4条对HEDT用户是否都适用:
1.成本:把18核定到1999价位,对消费级处理器是史无前例的,可以观察消费者的接受程度。对Intel的专业级至强会有影响,因为同级的要卖到接近3500刀;但Intel阉割的刀数已经足够拉开价位:内存通道(4 vs 6)、多路处理器支持(1 vs 4),ECC/RDIMM支持(有 vs 无)。消费级平台得到的是超频能力。
2.软件:Intel自从上代HEDT引入了“超级多任务”的概念,让用户能在同时运行多个软件:视频编码、直播、内容创作、模拟器等等。现在的要点在于,即便软件不能完全用到所有核心,同时运行多个实例或者多个不同软件也不会影响速度。解决方法只是把问题重新定义了,其他的什么也没做。
3.性能:与企业级处理器不同,Intel在HCC SKL-X处理器上提升了频率。基础频率略低,但加速频率高出许多,还有对TBM3的支持。缺点在于功耗方面。
4.平台集成:Intel通过将9款处理器3种不同设计放在同一个消费级平台,“解决了”这个问题。KBL-X和SKL-X的供电方式不同,内存支持不同,PCIE/IO数量也不同。起初发布时就有很多认为这会使平台过于复杂,会让人搞错(在我们测试中就搞坏了颗CPU)。
观点:为什么把“平台”PCIe也算上(并用在宣传上)很荒谬
处理器的PCIe数量,在我的记忆里,一直都是直接从PCIe根控制器里出来的,提供完整带宽,延迟也最低。现代系统中指的是处理器自身,更早一点的时期是指北桥。按此标准,intel主流处理器有16条,Ryzen有16或20条,Intel HEDT处理器有28或44条,AMD Ryzen Threadripper有60条。
Intel的文档里,清楚地列出了处理器PCIe根复合体出来的PCIe:上面是从2个16条以及1个12条PCIe的复合体里出来的44条PCIe通道。连到芯片组的是披着DMI3之名的PCIe 3.0 x4,但不包括在这44条里。
芯片组的PCIe则与此不同。芯片组是各种用途的PCIe交换:使用有限的上行带宽,为低带宽控制器(比如SATA/网络/USB)进行通信。AMD在这方面稍弱,为了提升竞争力重返市场,在纯CPU性能方面投入了更多精力,就把设计外包给了ASMedia。Intel近3代处理器以来就在增加芯片组支持的PCIe通道数,现在支持最多24条PCIe 3.0。虽然关于哪些通道支持哪种控制器有额外的说明,但总的来说还是算作24条。
由于共享PCIe 3.0 x4上行带宽,芯片组(AMD和Intel)的PCIe通道很容易就会瓶颈。绕道芯片组比直连延迟更高,也正因此重要硬件(显卡、RAID控制器、FPGA等)很少会连在芯片组上。
CPU和芯片组PCIe的区别导致平台功能和配置上的不同。比如X399平台CPU有60条PCIe,以下是推荐的配置组合:
现在Intel和AMD都开始把CPU和芯片组的PCIe算在一起,在宣传时候数字显得大一些。这直接无视了不同PCIe之间的差异,为了宣传这两家也顾不了这么多。比如Intel就把新的Skylake-X处理器宣传成“68条平台PCIe通道”,在CoffeeLake里也宣传为“40条PCIe”。
我想把这种现象扼杀在萌芽状态:说好听点是误导,说难听点就是欺骗,主要因为在过去这个参数都是指CPU PCIe(于是每个人都会忽略“平台”两字)。仅仅因为厂商想让数字看起来更好看,也不意味着他们有权利重新定义并误导消费者。
举个栗子:大概4-5年前,在智能手机领域,厂商开始把主处理器的所有东西都算作核心,加起来作为“总核心数”。GPU核心被称为“核心”,ISP等特殊IP模块变成了“核心”,安全IP模块也被称为“核心”。本来CPU部分只有4核 A7,却说SOC有15核是很荒谬的。当然关注手机业界的人注意到这类胡扯很快就消停了,什么都能称作“核心”,即便是虚假的并不存在的核心 – 如果再继续下去,“核心数”这个参数就不再具有意义。
如果“平台PCIe通道”的概念继续搞下去,同样的事情将会重演。
测试平台
性能测试
SPECwpc V2.1
PCMARK10
办公性能测试
Chromium编译
PCMARK8
渲染性能测试
Corona
Blender
LuxMark
POV-Ray
CinebenchR15
CPU编码性能测试
7-ZIP
WINRAR
AES
Handbrake H264/HEVC
系统性能测试
Adobe Reader DC PDF测试
FCAT处理
海豚模拟器
3DPM 2.1
DigiCortex
Agisoft Photoscan
旧版测试程序
3DPM V1
CinebenchR11.5/R10
X264 HD 3.0
功耗
测试首批Skylake-X处理器时,很明显Intel开始模糊TDP和功耗的区别。技术上来说TDP是一个以瓦为单位的值,代表CPU散热要能够让这么多的热能扩散开:140W TDP的CPU需要搭配至少140W散热能力的散热器。通常TDP也是判断功耗的一个很好的标准。140W TDP的CPU一般情况下会消耗140W功耗(加上部分效率损失)。
在以前,特别是主流CPU,即便是最新的CoffeeLake,Intel通常会将功耗压到比TDP低很多。i5-7600K的TDP为95W,测得功耗~61W,其中53W来自CPU核心。意思是说过去Intel在TDP方面很保守。
随着Skylake-X的发布,事情有了变化。由于过高的全核频率,全新的mesh结构,AVX-512的加入,以及增加的核心数,导致功耗达到了TDP,甚至在部分情况下超过TDP。7900X的140W TDP,测得功耗149W,6.4%的差距。前代6950X也是140W,但满载功耗只有111W。Intel的功耗策略随着Skylake-X发布开始转变,在核心数增加后变得愈加明显。
今天测试的这两款处理器也印证了同样的情况。7980XE和7960X均为165W TDP。测试使用Prime95压力测试,数据从硬件用来管理供电和频率响应的内部功耗管理寄存器中取得。虽然这方法作为物理测量不大精确,但更加通用,不需要一个个用工具测量,而且硬件自身就是用这些值来决定性能的。
满载情况下7960X的总封装功耗达到163W,几乎达到了165W的TDP。
然而7980XE远远超出这个值。满载全核3.4GHz,封装功耗达到190.36W。比TDP高了25W,相当于15.4%。我猜7980XE的实际TDP应该接近190W,保险一点应该是205W。不巧的是Intel起初设计Basin Falls平台时最高只到165W。为了提升频率和性能,Intel把预留的功耗冗余用光了,甚至还超出了不少。
我们的功耗测试软件测得这两款CPU满载时,IMC和mesh合起来功耗大概在42W。从满载功耗中刨去42W,7960X核心部分121W(每核7.5W),7980XE核心部分功耗140W(每核心7.8W)。
核心和IMC部分功耗增长最快的时候,是在4线程负载时 – 7980XE在4线程满载时功耗超过100W。当7980XE处于轻度负载,睿频启用时,单个核心平均功耗能达到20W,而满载时会降低不少(7.8W)。Ryzen也是一样,单核功耗可以达到17W,满载只有6W。很明显无论SKL-X还是Ryzen,能效最高的点应该在6-8W,而不是15-20W。
性价比分析
Chromium编译 性价比
低端性价比异同寻常的高,Intel带HT的奔腾双核价格很低(实际价格并不低)。300刀以下市场Ryzen稍有优势,但在Ryzen 7 1700定位以上,Intel直到2000刀都有性价比优势。
Agisoft图像转换 性价比
由于算法基于单线程,性能并没有随着核心数增加线性增长。Ryzen5的性价比要高于i5,但大多是情况下Intel性价比还是有优势。
Blender 性价比
在这里AMD在任何价格段都有性价比优势。
CinebenchR15多线程 性价比
CinebenchR15更能反映大多数工作站负载的情况。
在每个价位AMD都能提供更多核心和线程数,AMD优势更大。
Corona 光线追踪 性价比
光线追踪能够利用到更多核心,更高频率和IPC,加速指令以及高速浮点输出。AMD拥有很好的基础浮点性能。
与前面几个表格意义,最高的性价比依然在低端奔腾 – 然而性能并不是最好的。在主流价位Ryzen 5 1600和1600X性价比最高。
500-800刀价位Intel和AMD基本持平,然而在999刀价位Threadripper再次领先i9。更高价位Intel提供更高性能,但性价比也更差。
结论
功耗:测试里Intel的单核心功耗在7.5W-20W范围。全核满载时,加上mesh和IMC,7980XE的功耗达到190W,远超165W的TDP。对于把TDP当功耗的用户可能要当心了 – 想超频可能需要定制水冷。AMD Threadripper功耗大概177W,和180W TDP基本吻合。
平台:X299平台要兼容KabyLake-X,Skylake-X LCC和Skylake-X HCC。大部分主板对于高端的兼容都没什么问题,不过其他人测试建议供电可能需要主动散热。在CPU上投资1999刀,如果还想超频,就应该需要一块好的主板,而不是那些便宜的基本型号。有些买家可能会觉得AMD更好,Threadripper能直接同时为3块x16显卡 + 3块x4 NVME存储提供完整带宽,而不用降低3路带宽,SSD也不用绕道芯片组。
价格:1999刀是消费级处理器的新纪录。Intel敢卖这个价是因为它能 – 7980XE的确是工作站性能之王。性能足够高 – 想要这种级别性能的人基本不太在意性价比,特别是在软件授权就要10000刀的情况下。但对于其他人,除非你能用到TSX或者AVX-512,不然这价格就太高了,AMD在各个方面都更好。很难不考虑只需要一半价格的1950X。
?如果买家想要最好的工作站处理器,也不需要ECC支持,买Skylake-X
?如果买家需要ECC或者512GB内存,Xeon-W可能更好
?如果买家预算有限或者需要多卡计算,推荐Threadripper
本文地址:http://www.moepc.net/?post=3106
via:https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review
MOEPC.NET编译,转载请注明出处。