目前最快的16核 服务器CPU:AMD EPYC 7371评测【STH】【更新1K价格】
本文地址:http://www.moepc.net/?post=5146
来源:https://www.servethehome.com/amd-epyc-7371-review-now-the-fastest-16-core-cpu/
作者:Patrick Kennedy
MOEPC.NET编译,转载请保留出处。
【18/12/07更新:STH称EPYC 7371的1K定价为$1550。比估计的低很多。
这样的话就在7401和7351之间
这定价不觉得有点太低了么】
图源:STH
=====18/12/05=====
【之前SC18上AMD发布的首颗高频 EPYC 7371的测试。AMD有说到后面Rome也会提供这样的低核心数高频SKU,在定位上比较有意思。
可能对于大多数人来说这是款并不起眼的产品,实际上意义很大。
很久没有做全文翻译了,这大概是最近比较值得看的文章。】
几周前STH报道了EPYC 7371的发布,由于当时是在SC18上发布的,我们就误以为它是颗针对HPC的产品。EPYC 7371或许会在HPC领域找到一席之地,不过它真正会给行业带来改变的则是单核性能。最好的例子大概要算Windows Server 这个群体了。Windows Server 2019 Standard 和 Datacenter的标准授权都是16核心的,非常符合EPYC 7371。它还有比Intel Xeon 更高的内存容量和更多的PCIe。这将改写 整个行业对AMD EPYC vs Intel Xeon 的看法。
EPYC 7371 预计2019Q1开售,售价未知。EPYC 7371是可以双路的,不过我们将集中在单路配置上,因为测试数据表明,EPYC 7371将给整个格局带来很大变化。
EPYC 7371 解决了AMD最大的弱点:频率。此前Intel 都占据着频率优势,而AMD占据着核心数优势。而全核Turbo 3.6Ghz,8核 Turbo 达到3.8GHz的EPYC 7371 则达到或者超过了目前公开的所有Intel Xeon。
EPYC 7371的数据:16C/32T, 3.1GHz基础频率,全核加速3.6GHz,8核加速频率达到 3.8GHz。缓存为64MB,每核心4MB。TDP达到200W,是目前TDP最高的EPYC 7001系列CPU。
单路Lscpu:
很长时间以来Intel 都推出过低核心数高缓存容量的产品,比如Xeon Gold 6134/6144 这种高频八核有着8MB L2 + 24.25MB L3,单路32.25MB,双路一同64.5MB。
而EPYC 7371 每路都有8MB L2 + 64MB L3。Intel 一般会拿高缓存容量当做高频SKU的卖点,不过现在变成了AMD明显优势。
测试配置:
- CPU: AMD EPYC 7371
- Server Barebones: Tyan Transport SX TN70A-B8026 (B8026T70AE24HR)
- RAM: 8x 16GB 128GB DDR4-2666 RDIMMs (Samsung)
- SSD: 1x Intel DC S3710 400GB SATA SSD, Intel Optane 905p 480GB
- NIC: 1x Mellanox ConnectX-3 Pro
Tyan Transport SX B8026T70AE24HR
这套系统不需要PLX桥接芯片就能直接支持24块NVMe U.2 SSD,从CPU里直接连出的96条PCIe 3.0。
Tyan Transport SX B8026T70AE24HR
AMD和Tyan原建议使用三星SSD,STH为了保持结果一致性用了Intel DC S3710 400GB。
AMD EPYC In Tyan 24 Bay NVMe 2U
这套系统在过去的几个季度里工作的很好。如果你现在有套Intel Xeon E5 V1-V4的系统,可能一套单路AMD EPYC 7000就能替代前几代的双路或者多路系统。已经有公司把四套双路Intel Xeon E5-2620 V1直接整合进一套AMD EPYC 7000系列服务器,在各方面都有很大节省。
测试成绩
Python Linux 4.4.2内核编译
内核编译测试不光看多核性能,单核性能以及内存带宽都会有影响。
在这里AMD EPYC 7371不仅大幅超过Xeon Gold 6130【同为16核】,甚至达到了AMD EPYC 24核的水平,体现了频率的重要性。
cray 1.1
EPYC 7371 和7351P拉开了较大差距。cray对核心数、主频和缓存都很敏感,STH不推荐用它对比不同厂商不同架构的性能。当时AMD展示“Rome”的时候用的就是cray,和这里的情形类似,AMD在架构上有着优势。
7-zip 压缩
STH一直用解压性能来排序,这代更倾向于AMD EPYC。
表格说明EPYC 7371 是款高频16核单路SKU。Intel的Xeon Gold 6134和6144 频率已经很高了。如果你每台机器有16核的限制,那你肯定会用双路Xeon Gold 6134。单路Xeon Gold 6130则落后很多,显然对于EPYC 7371,最大的对手实际上可能是Intel的双路高频8核。
看到这里那你肯定要停下来想想。Intel的双路8核Xeon 相当于AMD的单路16核 EPYC 7371?那么四路Intel 8核Xeon不就相当于双路AMD EPYC 7371?此前这些问题我们连想都不用想,因为Intel有高频SKU,而AMD在这方面缺失很多。现在AMD则通过提供高频优化且性能很不错的CPU,迫使企业们开始思考这些问题。
NAMD
我们需要把NAMD和GROMACS的结果放在一起看,GROMACS支持Intel Skylake的AVX-512和AMD Zen的AVX2,上面的是没用AVX2/512的结果。
下面我们将会看到GROMACS AVX2/512的性能,在分子模拟上有很大影响。
只看纯计算性能的话,EPYC 7371能够大幅领先Intel的Xeon Gold 6130。双路Xeon Gold 6134的高主频在性能上很有竞争力。不过再说,这是在拿Intel的高频双路打AMD的高频单路。
Sysbench CPU【单线程】
你可以说AMD在这里明显强于Intel。这么想可不太对。这是为数不多的情形之一:AMD在这里拥有架构优势,导致成绩明显高于Intel。
EPYC 7371在单线程频率上明显高于其他AMD EPYC SKU。
同时Intel的Xeon Gold 6100系列,一般最高到3.7GHz,其余的Xeon Gold 5100和Xeon Silver在单线程上都更低。
EPYC 7371并不只是强在单核性能。实际上它的主要优势是能在吃满多核的同时依然保持高频率。
OpenSSL性能
在16核CPU中,EPYC 7371拔得头筹。手上没有Intel的Gold 6142,它比6130的基础频率高500MHz,睿频一样。用它的话Intel大概能勉强打赢EPYC 7371。
UnixBench Dhrystone2 & Whetstone
EPYC 7371和双路Xeon 6134性能非常接近。在单线程dhrystone2测试中,成绩可以说在伯仲之间。
可能有人不明白为何Gold 6130 vs 双路 Gold 6134的情况,虽然最大睿频相当,但6134的基础频率和全核Turbo都要更高。EPYC 7371也是同理,全核比7351/P高700MHz。
GROMACS STH Small AVX2/AVX-512
Gold 6130有俩AVX-512单元,因此Intel的Xeon Gold 6100、Platinum 8100产品线在这个测试里的性能堪称怪兽级别。
不过如果你用Xeon Gold 6100以下的产品线做比较,EPYC 7371还是无敌手的。
Chess
在这里再次发现EPYC 7371位于之前16核 EPYC和24核 EPYC之间,把Intel的16核 Xeon 6130抛在后面。
STH Web Hosting Stack Beta Test
从STH的一台负载生成节点连到测试节点,用的是100GbE。
结果很可观。EPYC 7371与Gold 6130拉开了较大差距。软件上可能还需要优化,不过这是用我们STH主站改了下直接拿来测的,属于实际应用。说明我们可以直接把7351换成7371,立马就会有效果。
EPYC 7351 压力测试
挖门罗币的压力测试,16核全核负载下3.1GHz,EPYC 7371挖矿性能要高20%。
cray压力测试
性能提升19-24%,系统依然很稳定。
Linux内核编译压力测试
7371比7351快19.5%。以前E5时代新的Refresh顶多加个100MHz,多个3-5%性能,AMD这次直接给了20%。
SPECrate2017_int_base
EPYC 7371比7351快19%。
官方的性能数字可能会在96 +/- 8%范围内,已经比Xeon Gold 6142/6142M的85-90要高不少,成为目前市场上最快的16核【服务器】CPU。
功耗
待机:83W
70%负载:246W
100%负载:321W
峰值:374W
还拿技嘉的H261-Z60测了一下单路和双路。技嘉官方没说能在2U4N的配置下支持200W TDP的CPU,实际上能够维持3.1Ghz的基础频率的同时保证温度。
EPYC 7371的定位
EPYC 7371 vs Intel Xeon
性能方面,媲美单路Gold 6130或双路Gold 6134。Gold 6142和EPYC 7371会差不多。
7351定价$1250,7371定价会更高。就算AMD给它定价$2600一块,还能和Intel打个来回。
Gold 6130的话,EPYC 7371一般都能打过。
Gold 6142或者双路Gold 6134的话大概和EPYC 7371相当.
不光是频率的问题。基础频率和全核turbo变的更重要。下面是简化过的版本
这正是双路Gold 6134比单路Gold 6130快那么多的原因。基础频率高很多,全核turbo更是高出32%。
也正因此,EPYC 7371能够凭借接近的双路6134频率,达到类似的单线程和多线程性能,用单路。
Intel也有一些类似Gold 6144和Planitum 8156这种,通过把核心数砍到极致,来提升频率和每核心缓存。论单路性能,EPYC 7371改变了主流高频服务器SKU的局面。之前Intel统治着这个市场,现在AMD拿出了极有力的武器。EPYC 7371核心更多,内存容量更多,PCIe也更多,单核性能还和Intel的主流高频SKU不相上下。
AMD EPYC 7371 vs AMD EPYC
打Intel的情况比较复杂,自家人对比就相对简单了。如果你的授权是按照核心数收费,需要高频;或者只是想要程序跑得更快一点,买EPYC 7371。如果想要更多核心,AMD也有24核和32核的型号。想要便宜的单路方案,可以选后缀带P的型号,这些便宜很多。
EPYC 7371这款CPU在整个服务器SKU中占据了独特的位置。
对于有个领域来讲,这可能很有吸引力:开发者工作站。AMD 的Threadripper 1950X/2950X都很棒,比EPYC更适合工作站。
与此同时,如果你需要128条PCIe,或者想要更多内存容量和RDIMM支持,AMD EPYC 7001系列的主频有点太低,而且Windows上用4个NUMA Node不大理想。EPYC 7371则是首个达到桌面水平的EPYC ?? 八核频率3.8GHz,也能拿来当工作站。
某些情况下Threadripper会更好,更少的NUMA 节点是个优势。7371是完全可以用于桌面的,而其他的一代EPYC我就不这么建议了。
随着EPYC 7371的频率达到桌面水平,Windows Server2019,VMware和Citrix管理员们在选择数据中心里新的VDI处理器的时候,也会多出一个选择。
结语
毫无疑问,AMD EPYC 7371是款很重要的产品。它将成为AMD首款公开的高频【服务器】SKU。AMD并没有捏Intel 的低端软柿子,而是拿出了极具竞争力的一款产品,Intel还没法直接还手。
这将改变人们对AMD EPYC的看法,不能把它简单地看成专为多核多线程性能的设计。
与此相反,AMD EPYC 7371 可以和Intel的Xeon Skylake-SP 在竞争中正面对抗,并取得胜利。
本文地址:http://www.moepc.net/?post=5146
MOEPC.NET编译,转载请保留出处。
上一篇文章的推土机还是有点意思的
win7用户还在 这部分用户算个小问题
放弃又不好 专门改东西支持win7也划不来
明年如果还有专供OEM装win7的推土机改大概也不会是什么怪事
@sakura:建议把下面的名字倒着念一遍看看啥意思
马文竟然把注册的新商标发出来了
@wangbaisen1990:一个商标不多做解读
@剧毒术士马文:知道,不过各路“媒体”已经开始了全新解读
低能媒体已经开始吹3000系了
@PeratX:这几天还有的满地的“RX 3000”呢
我宁可相信改回HD,也不会相信下一代AMD GPU叫RX 3XXX
@桜道月:阴谋论一波,这是某些公关公司做的PPT,强力捧杀→没达到预期→辣鸡AMD,果然是PPT大厂,XXX,XXX
@莫扎特破轮:日常操作
嗨马文,这是我didik,请检查你的收件箱或电报。
谢谢,
Didik
几个问题,虽然很多都是关于原网站的问题。
1.测试关闭AVX系列SIMD的项目目的是什么,既然都支持AVX为什么不在那个环境下跑……
2.SPEC2017的FP项目为什么没有进行测试。
3.SPEC2017项目使用的什么编译器跑分?子项目具体分数是什么样?
很多支持AVX FMA的程序跑起来的情况下是比整数快不少的,如果现实主义测试,应该是要考虑上最大化应用这些指令集的部分,而技术角度测试IPC等技术指标,更应该放出X64、SSE、AVX、AVX2等不同指令集应用下的跑分进行分析呀……
所以我个人觉得原网站测试还是有点片面,参考价值一般,欢迎进一步探讨,不撕逼。
@镜君:这又不是测IPC的测试,这是实际环境下服务器应用的测试。
@镜君:看好名字:Servethehome。
人家就是做服务器应用测试的,服务器又不用你说的那些玩意,你说的都是浮点。
@Hindy:服务器有云存储服务器也有云计算服务器,云计算服务器是很多情况都能用到浮点的。
如果是服务器测评,应该要包含云计算服务器吧?
当然,很多浮点任务都可以用GPU完成,但也有不支持GPU加速的部分。
SPEC2017里的int也分多实例speed和rate,而且不同编译器优化下不同的处理器有不同的性能表现,作为实用测试,这里应该使用对AMD最优化的编译器(AMD官方的编译器AOCC)下跑AMD成绩对抗Intel最优化编译器(ICC)成绩,但是他并没有说是在什么平台(各种平台下都能跑SPEC,需要编译后跑),也没说是什么编译器,这是很不负责任的。
@镜君:做相似类型测试的还有Phoronix,他也不是做纯理论性能测试的。
@轮子妈:这个测试也并不是足够详细,很多方面应用都没有涉及啊……
厉害了!!!AMD
坐等三年后的大船靠岸
说实话有点担心是不是ES版
有没兴趣看看8cx?
题外话
请问下背景的图片哪有原图,官网找不到……
@cloudpopo:这个是AMD新加坡的活动
图片都不是官方的
都是自己P的
@Hindy:原来如此……
外媒开始搞所谓rx3080等于2070等于1080
rx3070等于2060等于1070
rx3060等于2050等于580等于1060了
@wangbaisen1990:太假了,amd不至于碰这种磁
@wangbaisen1990:人家明明说的是RX3080=Vega 64 + 15%=$259,RX3070=Vega 56=$199,RX3060=RX580=$129
@horeaper:我看的是贴吧的转载,你懂得
emmm。。。。
victim cache的容量相对而言没有那么重要吧
这型号来得太晚了。
按我实际使用的负载来评价的话,EPYC 7401P算超值,EPYC 7371就没有对手了。
@轮子妈:这只是开头
等Rome出高频SKU
@剧毒术士马文:届时全球各地的数据中心都发出了农企临时工翻身的声音(手动滑稽)
另农企临时工发现了消化库存A10-9700的方法(大雾)
嘤嘤嘤:我要装Win7!
农企临时工:Bristol Ridge可以mua?
轮子妈:你想拿A10-9700瓜菜代i7-9700K的伎俩是不会得逞的!
@轮子妈:A10-9700能装Win7了?
@轮子妈:A10-9700能装Win7了?
不晓得是如何实现的
16c高频 其他阉割核没有产生热量? 感觉有些技术也可以用于GPU
@NiceMing:如果屏蔽还产生热量的话等于本末倒置
集中供电
降低发热密度
http://www.moepc.net/?post=5144
这条新闻下面居然不给评论,我在此发表下感想:
如果这条信息属实,那么绝对是爆炸性新闻。8核及以下集成iGPU,8核以上全部是纯CPU。Ryzen,逆天了!!
@ayu:真实性很低。最底下那两个挖掘机核心产品就非常假了,要知道X470 B450都不支持挖掘机了
@potato:Duron也不太可能跳出来了。Sempron还没用过呢
@ayu:假的,哪有核心数越多频率越高的道理。
@ayu:那个马上就进入某些科技媒体,变成3000系列5.0ghz了
@wangbaisen1990:低能网已经开始了
@莫扎特破轮:低能网日常
@ayu:我怀疑是在钓鱼
@LV3的萝莉控:嘘…
嗯,这个型号本身还是不错的。主要问题在于推出时间,2019Q1时Rome家族应该已经开始出货了,这也和APU的痛点一样,不能一直保持同步的工艺进度,AMD如果能实现和友商相当的谱系进步,竞争力会大很多
@在amd看大门:成本问题
很好,腾讯和阿里的的计算型云服有新选择了 ^_^
@horeaper:代理商那里问了下,7371这个SKU单买价格比较贵。。。
其他常规SKU都能打折。
@轮子妈:过段时间淘宝上就出现了莫名其妙的便宜的7371了
和当年神奇便宜的7501p一样
@wangbaisen1990:我看现在淘宝EPYC 7601 9000,7551 8000,,7451 7200,7351P 3300…价格好像还行
@阿伦:是的,所以说淘宝万岁23333
@阿伦:这么便宜了?
吓得农企临时工都翻身了.jpg
@阿伦:???
我一个月前买的7551还要11000
难道海光的大船来了???
@阿伦:@sakura: 有家淘宝店卖得特别便宜,觉得不是正常渠道价格。
总代那里部分型号能打折但远远做不到这个价格的。
@轮子妈:那些巨便宜的卖的老板都说来路不正,当年帮人组NAS时候还去问过
@wangbaisen1990:楼上更新了7371价格……
我这里正常渠道7371价格都跟7451差不多了。还是7401P香。
@轮子妈:7401p只能单路啊 epyc双路一直比单路贵啊
@wangbaisen1990:我只需要双路级别的PCI-E,而并不需要双路
@轮子妈:单路epyc非常适合你
@轮子妈:你需要的只是单路级别的PCI-E而不是Intel那半路级别的PCI-E(笑