AMD Raven Ridge CPU/GPU 架构性能解析【IPC、超频】
本文地址:http://www.moepc.net/?post=4372
Raven Ridge【下称RR】的IPC 和Zeppelin 相比,差距在-4.8% – +2.8%之间。平均领先Zeppelin ~1.5%。性能变化的原因可能是对L2和L3的改动导致的,对Zen核没有改动。
Zeppelin的解析详见:AMD Ryzen: 严谨技术解析 http://www.moepc.net/?post=1406
Raven Ridge架构解析详见:AMD发布Ryzen Mobile移动版APU:Vega集显,更新的Zen架构 http://www.moepc.net/?post=3397
之前的传闻是正确的,RR 的L2延迟比Zeppelin要低很多。RR的L2延迟为12个周期,Zeppelin为17周期。17周期的L2延迟对Zeppelin的频率没有表现出任何限制,而且RR的L3又砍半,所以提升一下L2的速度算是聪明且有效的举措。
很难说砍半的L3缓存对性能有多大冲击,因为同时L2也有显著的提升。一般情况下,砍半的L3对性能的影响很小,可忽略不计。
对>L1缓存压力大的负载,比如Bullet Physics library,RR(L3 4M)的性能和Zeppelin(L3 8M)差距在5%以内。考虑到Bullet在整套测试里属于对RR最不利的测试,可以说总体上L3容量的削减对性能的影响极小。
【Vega 11,1个几何引擎,2个像素引擎】
同频下Vega 8(8CU/2RB)集显与Vega 11 (11CU/2RB)的差距很小,视内存频率不同,差距通常在8-11%之间。默认状态下Vega 8运行在1100MHz;而Vega 11运行在1240MHz(名义上是1251MHz)。一般能超到1600MHz以上,1.200V SoC电压。
由于内存带宽上的限制,超频到接近极限后Vega 8 和 Vega 11的性能会基本持平。
在超集显之前,要先考虑好功耗问题。主流AM4 主板给了2相VRM 供VDDCR_SoC voltage rail(VRM和散热水平参差不齐),在RR 上不仅要给SoC供电,还得给集显供电。
默认状态的Vega 11功耗大约36W,超频至1600MHz 会达到55-60W。 60W看起来不高,对于2相VRM(25A一相)已经有点压力山大了。
和Zeppelin 一样,RR也有”超频模式(OC-Mode)”, 有两种触发“超频模式”启动的方式:提升CPU频率,或者提升集显频率。动了其中一个就会关掉所有的功耗、电流、负载限制器和自动电压控制器,类似Zeppelin ,当加速/XFR仍然激活的时候,电压就会猛增。CPU进入”超频模式”后会自动关闭加速和XFR,频率和电压都会相对正常。
进入“超频模式”后也会立即关闭集显核心的dLDO。默认状态下VDDCR_SoC voltage rail 会经过dLDO,电压通常会降低250mV。一旦“超频模式”启动,dLDO 就被放置为旁路模式,集显核心电压直接就是源电压,没有任何降低。
很明显RR 的IMC 做了改动,只是改的地方很少,对IMC固件的影响要大于对实际硬件IP的影响。同样设置下平均内存延迟降低了约3%,带宽同时也稍有降低。能达成的最高内存频率也和Zeppelin差不多,3400-3533MHz,取决于IMC、主板和内存体质。幸运的是,至少默认内存频率和稳定性有很大改善。
RR CPU超频余地很少,这也和Zeppelin类似。通常实用的最高频率在3.85-3.95GHz,取决于体质。
RV-B0/RTL-Fmax-Vmin表格
高于这个频率的也不是上不了,只是需要大幅提升电压,牺牲了能效,芯片寿命也会缩短。从3.9GHz往后,每提升100MHz频率,功耗很容易增加25%以上。
测试样品给1.550V电压都达不到4.1GHz,4.0GHz在1.375V就稳了。1.375V不算低,不过能日常用。
RR 和Zeppelin不同,在核心和顶盖间换用了传统的TIM。TIM并不是影响RR 散热的唯一因素。因为RR的核心非常薄,所以AM4 APU的顶盖是重新设计过的 – 通常CPU的顶盖内表面是很平的,RR的顶盖内部则有片0.5mm的凸起和核心接触。要是没这个凸起,顶盖就只能碰到核心旁边的SMD贴片,这些贴片比核心要高。增加的凸起也就增加了厚度,以及顶盖的热阻。【AMD已证实定位更高的Pinnacle Ridge – Ryzen 2000 CPU会用钎焊】
虽然RR的核心比Zeppelin略大,排出同样热量,使用同样散热的情况下,温度仍然要高许多。就算只有65W TDP,核心依然能达到70度以上。
对2400G用户严重推荐再买个好点的散热,特别是想超频的。默认的2400G已经有点受到65W TDP的限制了,超频到日常使用极限后能轻松达到120W TDP。
以及测试的3D Mark分数
相较默认状态的Vega 11,RX 550要快22%,RX 560 快68%。
超频到1600MHz + DDR4 3400,性能和RX 550 默认性能几乎完全一致。
– 2400G 默认: 1240MHz 核心 DDR4 2933MHz (3236 3DMark Fire Strike)
– 2400G OC: 1600MHz 核心, 3400MHz DRAM (3960 3DMark Fire Strike)
– RX 550 默认: 1210MHz 核心, 7000MHz (QDR) DRAM (3955 3DMark Fire Strike)
– RX 560 默认: 1210MHz 核心, 7000MHz (QDR) DRAM (5430 3DMark Fire Strike)
至于开盖结果,把2400G开盖后给顶盖和核心表面换上Liquid Ultra液金,Prime95温度降低了大概12度(4.0GHz/1.375V)。
然而温度降了还是没办法达到更高频率,4.0/1.375依然是最高的稳定频率。
【Ryzen 2000G系列支持最多3个显示器,取决于主板支持情况;支持Freesync2技术
目前Ryzen 2000G并不支持Dual Graphics混交,以后支持的可能性不大。
定位本来就是换下Ryzen 3 1200和Ryzen 5 1400的。这两个已经被取代了。
Raven Ridge是支持ECC的,桌面版的RR需要PRO版本才能够支持
第一代300系AM4主板是可以支持HDMI 2.0的,只是需要等更新
RR集成的VCN1.0 硬解能力
Vega 11 没有HBCC。因为没有HBM。
Raven Ridge一共有24条PCIe 3.0,和桌面版Ryzen CPU一样。
刨去8条给Vega集显的,剩下16条:8条给PCIe拓展槽 + 4条通用PCIe 3.0 + 4条给芯片组
PCIe 3.0 x8对于目前所有显卡没有明显性能瓶颈。
有些人可能不禁要问:Vega和CCX之间不是用了IF吗?为什么是PCIe?其实…IF也要占PCIe的。
有两种IF,Scalable Data Fabric(SDF)和Scalable Control Fabric(SCF) SDF传数据,SCF统一控制不同模块。 Zeppelin上大概是这样的, Scalable Data Fabric连着两个CCX、IO和IMC,这个SDF是Ryzen/TR/EPYC都用的,on-die的SDF。
还有每个Zeppelin芯片上都集成了的SDF,TR/EPYC封装的几个die之间就是靠这个通信,每个die集成4条,EPYC只用了3条与其他3个die连接,这样就是6条双向的SDF,这个用的是xGMI PHY。
Zeppelin集成的I/O是另外算的,每个die有俩PCIe 3.0 x16 PHY,一共32条,Ryzen由于某种原因只给了24条。 如果拿来双路,每个EPYC的128条PCIe里会有64条分出去与另一个处理器相连,这个是off-die的SDF,基于PCIe PHY。
Raven Ridge的详细信息AMD没有提供,只知道Raven Ridge用的SDF和Ryzen的并不同,的确用了IF连接CCX、Vega和IO、IMC。IF并不是实际物理层的名字,顶多算协议,个人推测实际还是8条PCIe PHY,所以会用掉8条PCIe。(上面的推测已经被AMD证实)。】
本文地址:http://www.moepc.net/?post=4372
via:forums.anandtech.com
原作者:The Stilt
补充来自:reddit/AMD QA
MOEPC.NET编译,转载请保留出处。
UP主,问你个问题哈,8代APU是不是不再走异构计算的路线了,这代APU还有统一寻址这些特性吗?
我看AMD官网的8代APU实际上是并没有归在A系列处理器下,看了一下架构图,看不是太懂。
RR 的L2延迟降低很有可能是因为不需要在两个CCX之间跑缓存一致性协议导致的。
感谢作者的分享。
在Raven Ridge SOC中,连接CCX和VEGA的IF用掉了8条PCIE;
那么请问在Raven Ridge SOC中,连接CCX和on die IO之间的IF是不是也用掉了几条额外的PCIE呢?
@mephistoxp:不会。ISSCC上AMD有给出详细的信息。
IO Complex和SDF之间是另外的连接,IO Master/Slave。
Raven Ridge一共有【20】条PCIe 3.0:8条给Vega集显 + 8条给PCIe拓展槽 + 4条给NVMe + 4条给芯片组
大概打错字了
@LuluEhh:改了,是24条,8+8+4+4没写错,只是小学加法没学好
实际上你能用到的就16条,8+4+4
完整是不是Vega12 768SP?
@kenobi:那是低能网造的谣。被打脸后还不承认
我一直都说是704。已经是完整版。
@剧毒术士马文:国内造谣网太多了,前几天2700x的数据被说成是2700,还一堆转载的,mdzz
看开点 看开点 就当买1200送rx550就行了 699要啥自行车 8100都涨价了 2400g的话。。。。说不出嘴
@股民:r5-2400g=买1400送rx550(笑),不过现在挖矿挖的,rx550也挺贵的~
给2200G上了Vega64,无论GPUZ还是HWInfo给出的Vega64的PCIE通道都是16个,加负载也显示3.0 x16
@台湾佬:难道是上了独显会直接吧分配给核显的X8释放出来?
@wangbaisen1990:我1800X + 双路Vega 64
GPU-Z读出来双卡都是PCI Express 3.0 x16
驱动里的当前总线设置,两张卡都是PCI Express 3.0 x16
@台湾佬:应该是识别问题
AMD已经发布了Ryzen v1000和EPYC 3000型SoC
Summit Ridge和Raven Ridge都有
马文也会赶紧更新的吧
感觉可以来个那个hbm2内存开个高端apu路线。反正那个内存应该不存在功耗问题。贵点没所谓,只要性能能干到一票所谓的游戏本,这apu本相对只会轻薄得不行。不知存在什么实际问题吧,可能在工艺和构架更进一步带好内存才能在功耗内带来更加合格的性能。
@游客:IA两家合体的8809g可以认为是高端ipu(是I社的,所以叫ipu),amd这边据说还没有很好的总线把cpu部分和高端gpu互联(其实就是低成本办法,友商那个成本a家做不了)~
砍掉L3很失望,希望Pinnacle Ridge没砍,挖XMR依赖L3,砍掉一半接受不能。。。
@阿牛:失望?为了集显砍掉点L3很正常,前几代压根没有L3。
而且测试显示对性能没有影响。
本来会去挖XMR的人就不会买它。
zen apu一代盖棺论定,不负众望,意料之中,intel集显干爆一堆GT_20的卡,这下GT550以下都一片哀鸿了,等ZEN+出来看看你A新工艺性能到底如何
AMD牙膏论或成事实(笑)
@HudenJear:目前台式机gt1030及以下彻底玩完了,笔记本方面mx150遇到强劲对手(一票家庭影音本最喜欢八代低压u+940mx/mx150)
我有个奇思妙想,有没有可能像加一片傲腾提高磁盘性能一样,出一个可选择加装的HBM2芯片之类的,以提高内存读写速度
@NiceMing:NEIN NEIN NEIN NEIN NEIN NEIN NEIN NEIN NEIN NEIN NEIN NEIN
@剧毒术士马文:延迟?
@剧毒术士马文:抛去产能和设计组装的困难,我觉得很可行啊。。。为什么要nope
@永之:你怎么做一个可以随便插拔的interposer?
@NiceMing:那还不如像牙膏厂那样搞块SRAM。
成本太高了。
@轮子妈:所以我说了“可选择”啊 而且我的意思并不是只提高核显带宽 而是作为一个类似傲疼的地位 提高内存带宽 辅以hbcc
我就想知道这个pcie通道的核显能不能虚拟机直通。
不过十有八九不行,之前的核显显示pcie通道也是不能直通。
单条高频8g,再弄个ITX机箱,可以当个4K电视盒子,畅玩VR是不可能了…客厅VR可以看看隔壁英特尔的骷髅头盒子
@炼金术士:集显VR
可能想多了
钱没加到位
@剧毒术士马文:PSVR那个清晰度…全低大概可以,vive或者CV1肯定没戏
@炼金术士:那样的体验会完全毁掉一个人对VR的印象
然后再也不会去尝试VR
@剧毒术士马文:Vr 全高也不怎么样啊……
分辨率毕竟跟不上
Htc vive 按帧数看貌似就2K左右
还是有问题的
哇,硅脂很失望啊,本来打算支持一波ZEN 2+NAVI的APU的,现在只能等ZEN 2的CPU了,不知今后还会不会出95W的钎焊APU
@THz:目前在用Intel Core i7-4790处理器,日常使用AIDA64核心温度高的离谱。坐等AMD Zen 3 纯CPU,硅脂U不是我的菜。
@ayu:大奶机i7-3770S同等ZEN 3,二奶机Core 2 Duo实在战不动了,想等meltdown、specture底层免疫的ZEN 2钎焊APU,如果没有就只能CPU+亮机卡
@THz:AMD CPU压根不受Meltdown影响。
而且Meltdown又出了新变种。
@剧毒术士马文:zen并不能完全免疫spectre,amd已经收到多次起诉了
arm也一并被拉下水了
只能说现在牙膏的问题是最严重的
@mhbzhy:被起诉不代表不能免疫。可能太过相信美国的这群人了。
https://semiaccurate.com/2018/02/06/amd-hit-two-baseless-class-actions-spectremeltdown/
起诉的人中绝大多数并不清楚到底发生了什么,起诉的理由也都是无稽之谈,目前所有spectre v2攻击都没有成功的报告。
问下A320 是不能OC ?有部分淘宝商品贴图说可以超内存
@5256qpqp1:有部分A320 BIOS更新后有部分调整选项,具体的没有测试
但问题不是这个,A320的VRM都非常感人。
@5256qpqp1:MSI有一款a320我玩过,掉压严重到我感觉这是一个华强北出品的山寨货,能oc内存和频率,在败家眼的B350f上1600 3.8G稳定运行,这个板子上就超了200M就已经当机了。至于稳定?跑个分装逼都难,还想稳定用?
说起来不如550除了ddr4性能以外
还有1eu的问题吧
@wangbaisen1990:RX 550是2SE+2RB 8CU
这个是1SE+2RB 11CU
SE影响并不大,主要就是内存带宽瓶颈。
@剧毒术士马文:这样啊
@wangbaisen1990:其实RX550给那么多带宽有点浪费,和560都差不多了
放在Vega 11上,双通道DDR4这点带宽真的不够吃,超频之后更瓶颈..
@剧毒术士马文:amd一直这样,很多低一级的卡和高一级的卡的带宽和eu等都一样
就是cu不一样
@剧毒术士马文:所以说集成个hbm会好很多(哪怕1代带宽都有128g/s,相当于rx560级别),但这样成本很高,这或许也是amd为何没有集成1024sp的原因(目前704sp带宽都不够,更何况1024sp)
@wangbaisen1990:重新设计是要钱的,直接砍CU多简单
硅脂也要看用的是啥硅脂嘛。
一大圈硅脂用下来觉得还是莱德相变硅脂实用。
隔壁的硅脂重设计顶盖了么?
我怎么记得2系到3系顶盖没区别呢
“RR 和Zeppelin不同,在核心和顶盖间换用了传统的TIM。”
AMD是不想干了,直接砸了自己的招牌。要知道Ryzen APU可是AMD的翻身利器,这下玩完了。
@ayu:你在说什么
很明显这是为了成本做出的选择,本来就是定位低端的产品
而且默认TDP只有65W,AMD的APU以前都是硅脂,除了部分95W的。
温度对超频也没任何影响。
如果说换个TIM就玩完了,隔壁有话说。
@剧毒术士马文:姐,RR Die核心面积比8C/16T Zen处理器的都大,后者尚且用铟焊料,前者居然用TIM硅脂。如果你扯上Intel,那么我也没话说了。毕竟Intel是躺床上拉屎,不想好了!
@ayu:姐还行
原来马文是妹子啊
@Wryyyyyy:什么?我自己都不知道
@ayu:这个和die size没有直接关联
RR die size大,TDP要低许多。
隔壁不光die size大,TDP 165-205的XCC/HCC都还用TIM
GPU更没有用钎焊的。
@ayu:Intel 至尊X笑而不语
@ayu:玩完倒不至于,但是apu用钎焊实在是很遗憾
这下想超频要投资额外的钱在散热上了
@theLastWish:就算钎焊,你用默认散热温度也不好看,但并不是不能用
2200G 4G+1500MHz 默认散热70-80。
硅脂是真的……
感觉也许a320 板子会比较吃力
@Wryyyyyy:tdp 65w,a320本来就是给这个tdp设计的,还好吧,现在手头没有a320,不然测一测。