数码科技

AMD发布Ryzen Mobile移动版APU:Vega集显,更新的Zen架构

本文地址:http://www.moepc.net/?post=3397

AMD回归高性能计算领域的最后一块拼图是笔记本。Ryzen、Threadripper和EPYC使用由2个CCX组成的8核Zeppelin模块这一基本单元,而移动端方面则把1个CCX + Vega集显集成进一块芯片,提供最多4核心、10个Vega CU,TDP仅为15W,CPU性能相比前代提升200%,GPU性能提升128%。惠普、联想和宏?在今天(或者近日)会发布基于Ryzen Mobile的笔记本,更多厂商应该会在一月的CES带来他们的产品。

点击查看原图

Ryzen 7 2700U、Ryzen 5 2500U都是15W TDP,使用和Intel相同的-U后缀。这两款15W产品瞄准了当前由Intel统治的超极本市场,同时Vega集显将会成为游戏、专业软件加速的一大卖点。

QQ截图20171105183733.png

两款APU都有4个Zen核心+SMT,提供8个线程。基础频率都在2.0-2.2GHz,但全核加速要高很多。2700U的最高加速频率为3.8GHz,2500U为3.6GHz,对于15W处理器来说很高,但AMD称这样的频率在设计上更接近能效Sweet Spot。与Intel一样,AMD也提供可配置TDP,范围9-25W。cTDP应该不会改变频率,但会对加速配置稍有影响。

点击查看原图

点击查看原图

Raven Ridge晶片

Zeppelin晶片


QQ截图20171028174931.png

4个Zen核心组成单个CCX,也就没有了桌面版2个CCX之间通信延迟的问题。相比桌面版,移动版的CCX L3缓存削减至4MB,每核心1MB。Zen核心的L3为victim cache,所以大部分应用影响很小;但L3的频率会很重要,因为它和集显有关联。

Raven Ridge芯片设计上有11个Vega CU,Ryzen 7 2700U启用了其中的10个,称为“Vega 10”;Ryzen 5 2500U则是只有8个CU的“Vega 8”。AMD没有提供集显的基础频率,最大频率为1300MHz、1100MHz。AMD强调的要点之一就是能够在CPU和GPU之间转移电源,来一直保持最大性能的能力。

点击查看原图

内存支持方面,两款APU都支持DDR4-2400,但AMD说是否标配双通道内存全取决于厂商。有的厂商会理解成“能够”升级到双通道,出厂时就标配单通道,留下一根空插槽。Ryzen Mobile APU采用IF连接CPU和GPU,AMD称IF的带宽和延迟均优于PCIe。

Ryzen移动版笔记本即将上市

PPT上有3款惠普Envy X360,宏?Swift3和联想Ideapad 720S。

点击查看原图

点击查看原图

15.6寸的惠普Envy是最大的,Ryzen 7 2700U / Ryzen 5 2500U,1080P IPS屏幕,双通道DDR4-2400,重量2.15KG,11月上市,售价699刀起。

点击查看原图

点击查看原图

13.3寸的联想Ideapad 720S更小一些,Ryzen 7 2700U/ Ryzen 5 2500U处理器,可选1080P IPS / 4K IPS屏幕。机身使用与同型号Intel机型一样的设计。【蛋疼的是】只支持单通道DDR4 2133且无法升级。重量1.14KG。

1 (41).png

img024.png

本文地址:http://www.moepc.net/?post=3397

Swift3则稍有不同 – 它的cTDP为25W,说明加速时间更长,性能也会比其他两款更好。配备15寸1080p屏幕,支持双通道DDR4 2133,没有提到升级方面。

AMD选择了性能

注:所有测试结果均来自于AMD的PPT,是否准确还需要实测证明。

AMD称Ryzen Mobile各方面都超越了既定目标。相对前代产品,Ryzen Mobile提供+200%的CPU性能,+128%的GPU性能,功耗却降低了58%。

此前AMD Analyst day上的PPT只有50%、40%、50%;

点击查看原图

点击查看原图

200%的CPU提升来自于双倍的核心/线程数(+100%)和IPC提升(+52%),说明当时50%的数据很不准确,可能是算错了。

PPT尾注称提升用CB R15多核计算 – 2700U为719cb,9800P为240cb,正好3倍;

GPU方面,从8个GCN3 CU升级至10个Vega CU,这已经是25%的基本规格提升;最大频率也从758MHz提升至1300MHz,这也有70%的增加,一共112%的性能增长,再加上架构改良,差不多128%。尾注称这是根据TimeSpy分数的计算结果。

至于功耗,58%的功耗降低使用CinebenchR15多核运行过程中的整机功耗计算。Ryzen 7 2700U消耗1594焦耳,而FX-9800P为3782焦耳,1594/3782=42% – 降低58%。

整体性能

点击查看原图

AMD称程序启动速度提升了20-40%,启动速度不仅和CPU性能有关,存储和内存性能也有很大影响。

点击查看原图

AMD也给了POVRAY、PCMARK10、TRUECRYPT和PASSMARK的测试数据;AMD也列出了8250U的数据,但没有放进表里:

QQ截图20171026235613.png

有意思的是i5比i7分数更高。i7是宏?Spin5,i5则是Spin3搭载的。可能Spin3散热更好,但i5在每个测试都比i7高是事实,也比Ryzen 5要高(除了TrueCrypt)。让人不禁联想为何AMD没把i5的数据放在上面。

四核对四核,AMD想宣传Ryzen Mobile有更好的性能,尤其是计算密集型应用。我本以为Ryzen Mobile会在PCMark 10里表现出色 – 需要CPU和OpenCL,Zen + Vega的组合并没有达到我的预期。

点击查看原图

在这里AMD的15W四核Ryzen移动版性能击败了91W的Intel CPU – 7600K,CB R15高了8%。

游戏性能

测试使用惠普Envy x360,搭载Ryzen 7 2700U,双通道内存

英雄联盟 1080P中效:59FPS
DOTA 2 1080P/最快+:49FPS
守望先锋 720P/低/79%渲染:66FPS
CSGO 1080P中效:49FPS
雷神之锤 冠军 720P 高特效:43FPS


点击查看原图

点击查看原图

本文地址:http://www.moepc.net/?post=3397

初看结果并不惊艳 – 成绩都是平均帧,60FPS感觉有点艰难。但AMD还给出了第二个买点:Vega 10和Vega 8都支持FreeSync 2面板,主要是30-60Hz范围的面板。鼓励OEM采用几乎不花额外成本的FreeSync面板,搭配Vega集显的性能,打造游戏笔记本。这是个很好的策略;就看是否能成功了。

更好的加速模式

桌面版Ryzen发布时,SenseMI技术下包含了5项技术:

Pure Power
Precision Boost
Extreme Frequency Range
Neural Net Prediction
Smart Prefetch

点击查看原图

Ryzen Mobile则采用更新的SenseMI

Precision Boost 2


大多数CPU加速算法都通过侦测多少核心和线程有负载,判断CPU是否有足够的电源/散热空间,然后应用电压。这也是大多数X86 CPU厂商在过去会给出基于核心数量的加速频率,散热/电源条件允许的情况下,满载核心数量不同频率也就不同。

点击查看原图

AMD给了Ryzen Mobile新的加速模型。当系统处于P0(峰值)加速状态,会使用新的机会加速算法,它由CPU温度、电流和负载控制,而不是根据满载的核心数量。算法也考虑到了外界环境,比如表面温度传感器和续航,会尽可能提供最适合的加速频率(不管是单核还是全核负载的情况下)。

点击查看原图

Precision Boost 2也提供25MHz粒度(与一代相同),第二代的改善点大意是:如果有许多CPU核心空闲,后台程序在进行轻度负载(比如更新)时,就不会因为更多核心开始活动而降频500-800MHz,而会继续保持高频率。

AMD称这对实际体验有很大作用,特别是游戏之类线程负载变化较大的程序。

点击查看原图

桌面版Ryzen的Precision Boost和XFR

询问Precision Boost 2是否也会在下代桌面版Ryzen用到,回答称八九不离十。

移动版XFR(mXFR)

移动端通常要受到散热、功耗、续航和续航方面的诸多限制,不少厂商并不愿意提供“额外的”加速频率。因此大多数Ryzen Mobile笔电都不会有mXFR – 除非厂商肯下功夫设计好的散热,AMD才会同意给该机型开启mXFR。【不觉得这是个坏事】

点击查看原图

本文地址:http://www.moepc.net/?post=3397

mXFR在Precision Boost 2基础上再上一层,同时cTDP也应该会更高。宏?的Ryzen Mobile笔记本开启了mXFR,因为机身散热设计是25W。Ryzen Mobile的cTDP上限刚好也是25W。

视频编码/解码能力

Ryzen Mobile拥有Vega的完整编解码能力。Ryzen Mobile可以硬解VP9这一油管最爱的编码,算是一大利好。

点击查看原图

点击查看原图

电源管理

设计处理器时,供电与微架构同样重要。供电有很多种方式,通常设计者会选择在设计难度、芯片面积、能效和复杂程度之间进行权衡。

最好想个简单的设计。全部CPU核心共用1个Power rail,电压也相同,再给集显1个,内存控制器1个。让主板管理输入电压,每个部分也容易管理。

【Power rail / Voltage rail 电源轨:电源提供的某个电压值的输出】

也可以给每个核心设置不同电压,独立管理。设计上更复杂,需要更多的控制,但最终可以降低不少功耗 – 单核满载时没必要把所有核心都提到4.0GHz。缺点是可能需要给每个核心单独1个Power rail,主板设计将会更复杂,成本更高,效率也不一定高。

最后也可以只给处理器 1个Power rail,在CPU内部用稳压器设置不同电压。听起来这样的芯片设计会很复杂,因为事实就是如此,但带来的回报也最高。AMD选择了最后这种方案。

点击查看原图

这种设计最大的好处在于,只把电力输送到所需的地方,同时保证低损耗和高效率。全部难关都在设计阶段解决,实战时表现更好。这张PPT里AMD展示了具体方法:在3DMark图形测试里让1个核心跑在半速,内核发送指令并进行基本的物理计算时,另1个核心缓慢提频;当进入真正的物理测试,GPU降频,CPU频率同时提升。配合细粒度控制,只要反应够快,就能达成高能效。

点击查看原图

点击查看原图

AMD称上面这部分为“Synergistic Power Rail Sharing”,意味着单个Power rail。Intel在Broadwell和现在高端Skylake-X上也这么做过。Intel以前用过FIVR的地方,AMD用了分离VDD封装rail,每个CPU核心和CU – voltage island都有自己的LDO。每个Voltage island都有根据自身用途所优化的LDO,当该部分闲置时LDO就会作为Power gate – 功率门限关闭它。

AMD的设计能够降低主板成本和复杂度,对处理器的控制也更好,代价是控制电路会更多。

Intel首次采用FIVR时说发现大电感比线性LDO效率更高,因为LDO在低功耗下效率较低。我们向Sam Naffziger – AMD电源专家请教,他说是的,闲置时能耗比可能会比预想的低几个点 – 但对比满载的核心,闲置核心的功耗就微不足道了。Sam说如果LDO完全处于power gating状态,相当于关闭,无论实际效率如何,剩下的功耗都已经非常低。Sam说他们为了把LDO做的能效更高并确保正常工作,付出了很多努力。总的来看,总体电流需求降低了36%,降低了主板上的供电需求,散热设计也能做的更小更紧凑。

点击查看原图

AMD称Intel第八代Kaby Lake-R的电流更高,特别是达到PL2电源状态时会达到第七代的两倍以上。

单Power rail设计的缺点,在我来看,CPU和GPU分别管理电源会更难。

点击查看原图点击查看原图

本文地址:http://www.moepc.net/?post=3397

有了对单独核心的电压控制,基于外部传感器、电流和冗余电源,AMD可以给每个核心和GPU调教动态电压/频率算法。只要线程不在核心间移动,就能识别负载最高的核心,直接对其供电。

睡眠竞赛

过去有过待机竞赛 – 相比静态(定频)和动态(on demand),只在有负载时提升功耗,总体功耗更低。现在则是睡眠竞赛:比赛谁能让芯片在睡眠状态间更快地切换。如果芯片某部分每50ms接受一次请求,25ms处理,就有25ms的睡眠窗口 – 如果无法在10ms内完成进入并切出睡眠,就没必要关掉它了。

厂家在睡眠竞赛中通常用各种睡眠状态互相竞争,新的睡眠状态能够更快地切换,功耗也更低。归功于LDO的使用,Ryzen Mobile新增了睡眠模式。

点击查看原图

点击查看原图

每个核心都有了自己的LDO,位于各自的voltage island,也就能够各自独立地进入睡眠状态。AMD CC6状态下,把核心大部分关闭,只留下L3以便其他核心使用 – 进出CC6状态只需要100ms。全部核心处于CC6状态时,LDO也会关闭L3,此时称为CPUOFF状态,功耗降低更多,进出延迟只有1.5ms【这时整个处理器几乎关闭,需要更快的反应速度

对于集显也一样:LDO可以门控掉GPU的95%,包括CU、编解码固定单元和显示管线中的部分。Uncore部分依然激活,以防GPU其他部分用到它。满足特定条件后集显也能进入GFXOFF状态,节省大部分电力。

当CPUOFF和GFXOFF同时开启,系统可以完全开启VDDOFF,把整个处理器的大部关闭。听起来好像是关机了,但留下来的显示管线依然能够保持开机状态。AMD称 Windows待机、屏幕静止、后台也无程序占用时,处理器99%的时间会处于VDDOFF状态。

点击查看原图点击查看原图

功率门限控制的一部分来源于InfinityFabric,IF有SDF和SCF两部分。为了维持系统开机状态,即便是VDDOFF模式下处理器的某些部分也要保持激活,AMD用IF把处理器分为两块:

A块:显示刷新中仍能保持关闭的部分

B块:显示刷新在需要短暂激活的部分

60Hz面板每16.6ms会刷新一次,处理器的某些模块依然要保证帧缓存。显然如果帧缓存经常需要更新,处理器也就经常被唤醒,这种做法更关注显示静态图片时的节能,更接近手机和平板SOC。

点击查看原图

点击查看原图

B块越少,能够节省的电力也就越多。AMD用状态机控制帧缓存和不同块,PPT上显示只有IMC、显示控制器和多媒体集线器属于B块,显示器刷新时需要激活,其余部分都能关闭。

这样就能降低更多功耗。下面是AMD给出的静态时的续航。

点击查看原图

本文地址:http://www.moepc.net/?post=3397

AMD称续航会有很大提升。VP9回放时间提升一倍(GPU能硬解VP9了),1080P H264回放提升15%。听起来不多,但在关键时刻能救急。

Ryzen Mobile:Zen 1.5


短会上有媒体问到为何新APU编号是2000系列而不是1000,AMD客户业务部副总裁Kevin Lensing解释说,有太多想法没来得及放进Ryzen桌面版,最后放进了Ryzen Mobile,比如Precision Boost 2。尽管微架构上没有改动,依然是Zen,但Ryzen Mobile上的Zen架构更接近于AMD的预想。他没有对下代桌面版命名作出评论,不知道是2000还是直接到3000系。

点击查看原图

本文地址:http://www.moepc.net/?post=3397

每个人都想问Zen核这样的高性能高功耗核心如何做到这么低的功耗:旁边还有个大号的集显。在我们的桌面Ryzen测试中,单核功耗最低为8W,Vega也不是省油的灯 – 把4核+Vega集显做到15W似乎比登天还难。AMD通过新的手段成功做到了这一点。AMD也和3家OEM紧密合作,今天发布了3款系统。

点击查看原图

性能方面,Ryzen Mobile有4核8线程,频率最高3.8GHz,CPU性能足矣。GPU性能也提升了,AMD还准备给Ryzen Mobile配上FreeSync面板。高负载任务功耗降低显著,每瓦性能达到原来的270%。更令人惊艳的是平衡CPU和GPU的方法:手段复杂,功耗表现更好,续航提升15-30%。

今天发布AMD与惠普、宏?和联想合作带来了3款笔电,没有一款是高端的旗舰,都是600-1000刀的中端笔电。

AMD仍有不少困难要克服。首先是重新培训大型电商的销售队伍,他们只认为AMD等同于低价选择。如果这些人把Ryzen Mobile也一视同仁,就不会推荐AMD笔记本。

第二,需要向大众宣传 – 多年负面用户体验带来的恶性循环之后,AMD必须能让用户信服:可以考虑AMD笔记本了。可以通过评测做到这一点。

第三,在营销上AMD还落后Intel:Intel试图向用户定义硬件新的用法,而AMD一直在传达“还有我,我和他一样好”的信息。【男默女泪】之前我们发现大部分Intel用户并不知道自己用的是什么处理器 – 对这些人说“我也一样好”的话,可能会引起“那么之前出了什么差错”的疑问。AMD需要一轮XPS13或者Zenbook这种旗舰来吸引消费者的目光。

我们向这三家OEM询问情况,只有1家即时答复。看起来现在测试样品还不大可能,保持关注吧。

本文地址:http://www.moepc.net/?post=3397

via:https://www.anandtech.com/show/11964/ryzen-mobile-is-launched-amd-apus-for-laptops-with-vega-and-updated-zen

原作者:Ian Cutress

MOEPC.NET编译,转载请保留出处。

任何内容修订均只在本原贴更新。

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

29 评论

  1. intel的10nm要跳票到2018年下半年,看来明年上半年是ryzen apu爆发的黄金窗口期~

  2. 不知道桌面版apu能否规格翻倍呀 8c 20cu什么的 这样就值得入手了

    1. @易内道德:不会
      同一个Die 4C/8T 11CU
      频率更高 维持时间更长

  3. 前有SUMMIT RIDGE一个DIE通杀8 6 4核,两个互联就是撕裂者,四个互联就是EPYC。
    今有RAVEN RIDGE一个DIE,TDP标定9~25W那就是超薄本轻薄本,TDP标定35~45W,那就是主流本,TDP标定45~65W,那就是桌面级,还特么能酌情开启屏蔽的一组NCU……
    两个DIE完成所有市场的布局,真是省了一大笔研发流片费用……看下intel,前几代酷睿加上XEON每代都至少有七八个DIE吧,这对比简直了……

      1. @剧毒术士马文:但是感觉很合理啊~感觉这种路子很好啊。

        1. @LuluEhh:对于AMD来说,综合各个方面算是最好的设计,但也会有缺点,在测试里也看得到
          Intel当然还是那个Intel…实力层级不一样(没有指技术方面,两家公司都有很多顶尖水平的工程师)

        2. @LuluEhh:最大好处就是省钱了,然后很多东西做起来都便宜,当然性能稍微低一些也不是不能接受

          1. @wangbaisen1990:其实最主要是因为gf当不了大佬,所以就用这么暴力的办法。不过能这么搞主要也是因为有if。

    1. @wangbaisen1990:明年就有更多厂家跟进了
      价格也能做的更便宜
      采购成本肯定要比现在8代+独显要低…

      1. @剧毒术士马文:其实以前u结尾的iu体验不好也是我一直不想买轻薄本的原因,3代的u结尾的u简直是狗屎……

    1. @cc:看苹果的了
      成本肯定便宜,设计更简单,能效还高,MBA绝配

      1. @剧毒术士马文:ACER的什么时候上市?
        问个题外话,5系RX有ITX版的吗..弄个MINI机箱发现配不到显卡….

  4. 马文,你应该单独开辟一个APU版块,把APU内容放进去。

  5. 请问c有关于hsa的文章可以推荐看看么?
    好像现在也不说hsa,统一内存和以前的apu思路了,现在发展得怎么样?

    1. @nyanyan:HSA….现在已经没人提了,AMD自己也不提

      1. @剧毒术士马文:怎么会这样的 我还寄予很深的期望呢

        1. @易内道德:RR发布压根没提到HSA
          应该说近几年都没提了…

  6. 然而我的1600x现在都更fall了依然没见到过动态调频。。。都是24小时p0

          1. @剧毒术士马文:其实也没啥用,按我自己的实验和网上反应。ry’zen(至少b350上)实际只有3个pstats,满载,空闲和休眠。而intel那边都差不多无级变速了,不知道移动功耗上要怎么竞争。现在桌面上sensemi没见的有多大用处。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮