AMD发布Ryzen Mobile移动版APU:Vega集显,更新的Zen架构
本文地址:http://www.moepc.net/?post=3397
AMD回归高性能计算领域的最后一块拼图是笔记本。Ryzen、Threadripper和EPYC使用由2个CCX组成的8核Zeppelin模块这一基本单元,而移动端方面则把1个CCX + Vega集显集成进一块芯片,提供最多4核心、10个Vega CU,TDP仅为15W,CPU性能相比前代提升200%,GPU性能提升128%。惠普、联想和宏?在今天(或者近日)会发布基于Ryzen Mobile的笔记本,更多厂商应该会在一月的CES带来他们的产品。
Ryzen 7 2700U、Ryzen 5 2500U都是15W TDP,使用和Intel相同的-U后缀。这两款15W产品瞄准了当前由Intel统治的超极本市场,同时Vega集显将会成为游戏、专业软件加速的一大卖点。
两款APU都有4个Zen核心+SMT,提供8个线程。基础频率都在2.0-2.2GHz,但全核加速要高很多。2700U的最高加速频率为3.8GHz,2500U为3.6GHz,对于15W处理器来说很高,但AMD称这样的频率在设计上更接近能效Sweet Spot。与Intel一样,AMD也提供可配置TDP,范围9-25W。cTDP应该不会改变频率,但会对加速配置稍有影响。
Raven Ridge晶片
Zeppelin晶片
4个Zen核心组成单个CCX,也就没有了桌面版2个CCX之间通信延迟的问题。相比桌面版,移动版的CCX L3缓存削减至4MB,每核心1MB。Zen核心的L3为victim cache,所以大部分应用影响很小;但L3的频率会很重要,因为它和集显有关联。
Raven Ridge芯片设计上有11个Vega CU,Ryzen 7 2700U启用了其中的10个,称为“Vega 10”;Ryzen 5 2500U则是只有8个CU的“Vega 8”。AMD没有提供集显的基础频率,最大频率为1300MHz、1100MHz。AMD强调的要点之一就是能够在CPU和GPU之间转移电源,来一直保持最大性能的能力。
内存支持方面,两款APU都支持DDR4-2400,但AMD说是否标配双通道内存全取决于厂商。有的厂商会理解成“能够”升级到双通道,出厂时就标配单通道,留下一根空插槽。Ryzen Mobile APU采用IF连接CPU和GPU,AMD称IF的带宽和延迟均优于PCIe。
Ryzen移动版笔记本即将上市
PPT上有3款惠普Envy X360,宏?Swift3和联想Ideapad 720S。
15.6寸的惠普Envy是最大的,Ryzen 7 2700U / Ryzen 5 2500U,1080P IPS屏幕,双通道DDR4-2400,重量2.15KG,11月上市,售价699刀起。
13.3寸的联想Ideapad 720S更小一些,Ryzen 7 2700U/ Ryzen 5 2500U处理器,可选1080P IPS / 4K IPS屏幕。机身使用与同型号Intel机型一样的设计。【蛋疼的是】只支持单通道DDR4 2133且无法升级。重量1.14KG。
本文地址:http://www.moepc.net/?post=3397
Swift3则稍有不同 – 它的cTDP为25W,说明加速时间更长,性能也会比其他两款更好。配备15寸1080p屏幕,支持双通道DDR4 2133,没有提到升级方面。
AMD选择了性能
注:所有测试结果均来自于AMD的PPT,是否准确还需要实测证明。
AMD称Ryzen Mobile各方面都超越了既定目标。相对前代产品,Ryzen Mobile提供+200%的CPU性能,+128%的GPU性能,功耗却降低了58%。
此前AMD Analyst day上的PPT只有50%、40%、50%;
200%的CPU提升来自于双倍的核心/线程数(+100%)和IPC提升(+52%),说明当时50%的数据很不准确,可能是算错了。
PPT尾注称提升用CB R15多核计算 – 2700U为719cb,9800P为240cb,正好3倍;
GPU方面,从8个GCN3 CU升级至10个Vega CU,这已经是25%的基本规格提升;最大频率也从758MHz提升至1300MHz,这也有70%的增加,一共112%的性能增长,再加上架构改良,差不多128%。尾注称这是根据TimeSpy分数的计算结果。
至于功耗,58%的功耗降低使用CinebenchR15多核运行过程中的整机功耗计算。Ryzen 7 2700U消耗1594焦耳,而FX-9800P为3782焦耳,1594/3782=42% – 降低58%。
整体性能
AMD称程序启动速度提升了20-40%,启动速度不仅和CPU性能有关,存储和内存性能也有很大影响。
AMD也给了POVRAY、PCMARK10、TRUECRYPT和PASSMARK的测试数据;AMD也列出了8250U的数据,但没有放进表里:
有意思的是i5比i7分数更高。i7是宏?Spin5,i5则是Spin3搭载的。可能Spin3散热更好,但i5在每个测试都比i7高是事实,也比Ryzen 5要高(除了TrueCrypt)。让人不禁联想为何AMD没把i5的数据放在上面。
四核对四核,AMD想宣传Ryzen Mobile有更好的性能,尤其是计算密集型应用。我本以为Ryzen Mobile会在PCMark 10里表现出色 – 需要CPU和OpenCL,Zen + Vega的组合并没有达到我的预期。
在这里AMD的15W四核Ryzen移动版性能击败了91W的Intel CPU – 7600K,CB R15高了8%。
游戏性能
测试使用惠普Envy x360,搭载Ryzen 7 2700U,双通道内存
英雄联盟 1080P中效:59FPS
DOTA 2 1080P/最快+:49FPS
守望先锋 720P/低/79%渲染:66FPS
CSGO 1080P中效:49FPS
雷神之锤 冠军 720P 高特效:43FPS
本文地址:http://www.moepc.net/?post=3397
初看结果并不惊艳 – 成绩都是平均帧,60FPS感觉有点艰难。但AMD还给出了第二个买点:Vega 10和Vega 8都支持FreeSync 2面板,主要是30-60Hz范围的面板。鼓励OEM采用几乎不花额外成本的FreeSync面板,搭配Vega集显的性能,打造游戏笔记本。这是个很好的策略;就看是否能成功了。
更好的加速模式
桌面版Ryzen发布时,SenseMI技术下包含了5项技术:
Pure Power
Precision Boost
Extreme Frequency Range
Neural Net Prediction
Smart Prefetch
Ryzen Mobile则采用更新的SenseMI
Precision Boost 2
大多数CPU加速算法都通过侦测多少核心和线程有负载,判断CPU是否有足够的电源/散热空间,然后应用电压。这也是大多数X86 CPU厂商在过去会给出基于核心数量的加速频率,散热/电源条件允许的情况下,满载核心数量不同频率也就不同。
AMD给了Ryzen Mobile新的加速模型。当系统处于P0(峰值)加速状态,会使用新的机会加速算法,它由CPU温度、电流和负载控制,而不是根据满载的核心数量。算法也考虑到了外界环境,比如表面温度传感器和续航,会尽可能提供最适合的加速频率(不管是单核还是全核负载的情况下)。
Precision Boost 2也提供25MHz粒度(与一代相同),第二代的改善点大意是:如果有许多CPU核心空闲,后台程序在进行轻度负载(比如更新)时,就不会因为更多核心开始活动而降频500-800MHz,而会继续保持高频率。
AMD称这对实际体验有很大作用,特别是游戏之类线程负载变化较大的程序。
桌面版Ryzen的Precision Boost和XFR
询问Precision Boost 2是否也会在下代桌面版Ryzen用到,回答称八九不离十。
移动版XFR(mXFR)
移动端通常要受到散热、功耗、续航和续航方面的诸多限制,不少厂商并不愿意提供“额外的”加速频率。因此大多数Ryzen Mobile笔电都不会有mXFR – 除非厂商肯下功夫设计好的散热,AMD才会同意给该机型开启mXFR。【不觉得这是个坏事】
本文地址:http://www.moepc.net/?post=3397
mXFR在Precision Boost 2基础上再上一层,同时cTDP也应该会更高。宏?的Ryzen Mobile笔记本开启了mXFR,因为机身散热设计是25W。Ryzen Mobile的cTDP上限刚好也是25W。
视频编码/解码能力
Ryzen Mobile拥有Vega的完整编解码能力。Ryzen Mobile可以硬解VP9这一油管最爱的编码,算是一大利好。
电源管理
设计处理器时,供电与微架构同样重要。供电有很多种方式,通常设计者会选择在设计难度、芯片面积、能效和复杂程度之间进行权衡。
最好想个简单的设计。全部CPU核心共用1个Power rail,电压也相同,再给集显1个,内存控制器1个。让主板管理输入电压,每个部分也容易管理。
【Power rail / Voltage rail 电源轨:电源提供的某个电压值的输出】
也可以给每个核心设置不同电压,独立管理。设计上更复杂,需要更多的控制,但最终可以降低不少功耗 – 单核满载时没必要把所有核心都提到4.0GHz。缺点是可能需要给每个核心单独1个Power rail,主板设计将会更复杂,成本更高,效率也不一定高。
最后也可以只给处理器 1个Power rail,在CPU内部用稳压器设置不同电压。听起来这样的芯片设计会很复杂,因为事实就是如此,但带来的回报也最高。AMD选择了最后这种方案。
这种设计最大的好处在于,只把电力输送到所需的地方,同时保证低损耗和高效率。全部难关都在设计阶段解决,实战时表现更好。这张PPT里AMD展示了具体方法:在3DMark图形测试里让1个核心跑在半速,内核发送指令并进行基本的物理计算时,另1个核心缓慢提频;当进入真正的物理测试,GPU降频,CPU频率同时提升。配合细粒度控制,只要反应够快,就能达成高能效。
AMD称上面这部分为“Synergistic Power Rail Sharing”,意味着单个Power rail。Intel在Broadwell和现在高端Skylake-X上也这么做过。Intel以前用过FIVR的地方,AMD用了分离VDD封装rail,每个CPU核心和CU – voltage island都有自己的LDO。每个Voltage island都有根据自身用途所优化的LDO,当该部分闲置时LDO就会作为Power gate – 功率门限关闭它。
AMD的设计能够降低主板成本和复杂度,对处理器的控制也更好,代价是控制电路会更多。
Intel首次采用FIVR时说发现大电感比线性LDO效率更高,因为LDO在低功耗下效率较低。我们向Sam Naffziger – AMD电源专家请教,他说是的,闲置时能耗比可能会比预想的低几个点 – 但对比满载的核心,闲置核心的功耗就微不足道了。Sam说如果LDO完全处于power gating状态,相当于关闭,无论实际效率如何,剩下的功耗都已经非常低。Sam说他们为了把LDO做的能效更高并确保正常工作,付出了很多努力。总的来看,总体电流需求降低了36%,降低了主板上的供电需求,散热设计也能做的更小更紧凑。
AMD称Intel第八代Kaby Lake-R的电流更高,特别是达到PL2电源状态时会达到第七代的两倍以上。
单Power rail设计的缺点,在我来看,CPU和GPU分别管理电源会更难。
本文地址:http://www.moepc.net/?post=3397
有了对单独核心的电压控制,基于外部传感器、电流和冗余电源,AMD可以给每个核心和GPU调教动态电压/频率算法。只要线程不在核心间移动,就能识别负载最高的核心,直接对其供电。
睡眠竞赛
过去有过待机竞赛 – 相比静态(定频)和动态(on demand),只在有负载时提升功耗,总体功耗更低。现在则是睡眠竞赛:比赛谁能让芯片在睡眠状态间更快地切换。如果芯片某部分每50ms接受一次请求,25ms处理,就有25ms的睡眠窗口 – 如果无法在10ms内完成进入并切出睡眠,就没必要关掉它了。
厂家在睡眠竞赛中通常用各种睡眠状态互相竞争,新的睡眠状态能够更快地切换,功耗也更低。归功于LDO的使用,Ryzen Mobile新增了睡眠模式。
每个核心都有了自己的LDO,位于各自的voltage island,也就能够各自独立地进入睡眠状态。AMD CC6状态下,把核心大部分关闭,只留下L3以便其他核心使用 – 进出CC6状态只需要100ms。全部核心处于CC6状态时,LDO也会关闭L3,此时称为CPUOFF状态,功耗降低更多,进出延迟只有1.5ms【这时整个处理器几乎关闭,需要更快的反应速度】
对于集显也一样:LDO可以门控掉GPU的95%,包括CU、编解码固定单元和显示管线中的部分。Uncore部分依然激活,以防GPU其他部分用到它。满足特定条件后集显也能进入GFXOFF状态,节省大部分电力。
当CPUOFF和GFXOFF同时开启,系统可以完全开启VDDOFF,把整个处理器的大部关闭。听起来好像是关机了,但留下来的显示管线依然能够保持开机状态。AMD称 Windows待机、屏幕静止、后台也无程序占用时,处理器99%的时间会处于VDDOFF状态。
功率门限控制的一部分来源于InfinityFabric,IF有SDF和SCF两部分。为了维持系统开机状态,即便是VDDOFF模式下处理器的某些部分也要保持激活,AMD用IF把处理器分为两块:
A块:显示刷新中仍能保持关闭的部分
B块:显示刷新在需要短暂激活的部分
60Hz面板每16.6ms会刷新一次,处理器的某些模块依然要保证帧缓存。显然如果帧缓存经常需要更新,处理器也就经常被唤醒,这种做法更关注显示静态图片时的节能,更接近手机和平板SOC。
B块越少,能够节省的电力也就越多。AMD用状态机控制帧缓存和不同块,PPT上显示只有IMC、显示控制器和多媒体集线器属于B块,显示器刷新时需要激活,其余部分都能关闭。
这样就能降低更多功耗。下面是AMD给出的静态时的续航。
本文地址:http://www.moepc.net/?post=3397
AMD称续航会有很大提升。VP9回放时间提升一倍(GPU能硬解VP9了),1080P H264回放提升15%。听起来不多,但在关键时刻能救急。
Ryzen Mobile:Zen 1.5
短会上有媒体问到为何新APU编号是2000系列而不是1000,AMD客户业务部副总裁Kevin Lensing解释说,有太多想法没来得及放进Ryzen桌面版,最后放进了Ryzen Mobile,比如Precision Boost 2。尽管微架构上没有改动,依然是Zen,但Ryzen Mobile上的Zen架构更接近于AMD的预想。他没有对下代桌面版命名作出评论,不知道是2000还是直接到3000系。
本文地址:http://www.moepc.net/?post=3397
每个人都想问Zen核这样的高性能高功耗核心如何做到这么低的功耗:旁边还有个大号的集显。在我们的桌面Ryzen测试中,单核功耗最低为8W,Vega也不是省油的灯 – 把4核+Vega集显做到15W似乎比登天还难。AMD通过新的手段成功做到了这一点。AMD也和3家OEM紧密合作,今天发布了3款系统。
性能方面,Ryzen Mobile有4核8线程,频率最高3.8GHz,CPU性能足矣。GPU性能也提升了,AMD还准备给Ryzen Mobile配上FreeSync面板。高负载任务功耗降低显著,每瓦性能达到原来的270%。更令人惊艳的是平衡CPU和GPU的方法:手段复杂,功耗表现更好,续航提升15-30%。
今天发布AMD与惠普、宏?和联想合作带来了3款笔电,没有一款是高端的旗舰,都是600-1000刀的中端笔电。
AMD仍有不少困难要克服。首先是重新培训大型电商的销售队伍,他们只认为AMD等同于低价选择。如果这些人把Ryzen Mobile也一视同仁,就不会推荐AMD笔记本。
第二,需要向大众宣传 – 多年负面用户体验带来的恶性循环之后,AMD必须能让用户信服:可以考虑AMD笔记本了。可以通过评测做到这一点。
第三,在营销上AMD还落后Intel:Intel试图向用户定义硬件新的用法,而AMD一直在传达“还有我,我和他一样好”的信息。【男默女泪】之前我们发现大部分Intel用户并不知道自己用的是什么处理器 – 对这些人说“我也一样好”的话,可能会引起“那么之前出了什么差错”的疑问。AMD需要一轮XPS13或者Zenbook这种旗舰来吸引消费者的目光。
我们向这三家OEM询问情况,只有1家即时答复。看起来现在测试样品还不大可能,保持关注吧。
本文地址:http://www.moepc.net/?post=3397
via:https://www.anandtech.com/show/11964/ryzen-mobile-is-launched-amd-apus-for-laptops-with-vega-and-updated-zen
原作者:Ian Cutress
MOEPC.NET编译,转载请保留出处。
任何内容修订均只在本原贴更新。
intel的10nm要跳票到2018年下半年,看来明年上半年是ryzen apu爆发的黄金窗口期~
不知道桌面版apu能否规格翻倍呀 8c 20cu什么的 这样就值得入手了
@易内道德:不会
同一个Die 4C/8T 11CU
频率更高 维持时间更长
前有SUMMIT RIDGE一个DIE通杀8 6 4核,两个互联就是撕裂者,四个互联就是EPYC。
今有RAVEN RIDGE一个DIE,TDP标定9~25W那就是超薄本轻薄本,TDP标定35~45W,那就是主流本,TDP标定45~65W,那就是桌面级,还特么能酌情开启屏蔽的一组NCU……
两个DIE完成所有市场的布局,真是省了一大笔研发流片费用……看下intel,前几代酷睿加上XEON每代都至少有七八个DIE吧,这对比简直了……
@LuluEhh:因为
没钱
@剧毒术士马文:但是感觉很合理啊~感觉这种路子很好啊。
@LuluEhh:对于AMD来说,综合各个方面算是最好的设计,但也会有缺点,在测试里也看得到
Intel当然还是那个Intel…实力层级不一样(没有指技术方面,两家公司都有很多顶尖水平的工程师)
@LuluEhh:最大好处就是省钱了,然后很多东西做起来都便宜,当然性能稍微低一些也不是不能接受
@wangbaisen1990:其实最主要是因为gf当不了大佬,所以就用这么暴力的办法。不过能这么搞主要也是因为有if。
坐等笔记本上市了 换掉用了3年的4200U
明年会有更多5000-6000的RYZEN APU的超极本么
@wangbaisen1990:明年就有更多厂家跟进了
价格也能做的更便宜
采购成本肯定要比现在8代+独显要低…
@剧毒术士马文:其实以前u结尾的iu体验不好也是我一直不想买轻薄本的原因,3代的u结尾的u简直是狗屎……
mac会上吗。
@cc:看苹果的了
成本肯定便宜,设计更简单,能效还高,MBA绝配
什么时候可以在国内买到ryzen的笔记本啊?
@huotusora:11月惠普那款上市
@剧毒术士马文:ACER的什么时候上市?
问个题外话,5系RX有ITX版的吗..弄个MINI机箱发现配不到显卡….
马文,你应该单独开辟一个APU版块,把APU内容放进去。
@ayu:如果下拉的话你会看到Ryzen Mobile
请问c有关于hsa的文章可以推荐看看么?
好像现在也不说hsa,统一内存和以前的apu思路了,现在发展得怎么样?
@nyanyan:HSA….现在已经没人提了,AMD自己也不提
@剧毒术士马文:怎么会这样的 我还寄予很深的期望呢
@易内道德:RR发布压根没提到HSA
应该说近几年都没提了…
然而我的1600x现在都更fall了依然没见到过动态调频。。。都是24小时p0
@appleache:BIOS, 系统
@剧毒术士马文:更过了都1.0.0.6a了
@appleache:那应该是系统问题
@剧毒术士马文:其实也没啥用,按我自己的实验和网上反应。ry’zen(至少b350上)实际只有3个pstats,满载,空闲和休眠。而intel那边都差不多无级变速了,不知道移动功耗上要怎么竞争。现在桌面上sensemi没见的有多大用处。