数码科技

【揭秘】带你走近开核U的前世今生

本文写于14年初,转载请注明出处。

首先,我们来了解一下CPU的生产过程。

img015.jpg

一块完整的晶圆上有很多小小的核心,也就是die,但生产过程中难免有瑕疵
这样就不能卖了么?不。
为了坑钱厂商们有两种策略

就是Reparing structuresHarvesting策略

以下来自ATI官方架构师的文档 The RV770 Story: Documenting ATI’s Road to Success

比如说一颗非常大的GPU(GK110那样的),良品率可能只有30%,即
对一片晶圆而言,每100个GPU只有30%是功能完好,可以零售的。制造如此复杂的电路成本是非常昂贵的,那些fab的设备造价很容易就达到数十亿美金。所以不能让如此多的晶圆被浪费。谢天谢地有技术可以让30%可用变成90%可用。

img016.jpg


第一种技术称之为可修复性(repairablility)其思想非常简单:设计冗余单元。如果芯片某个功能单元包含10个流处理器,实际上要设计11个流处理器。如果有瑕疵出现那么我们可以启用那个备用的流处理器。这种技术通常也用在片上内存(on-die memory)的设计上。这样当某一部分出现问题时,不会导致整个功能单元不能用。但是这个地方通常有个折中,如果你设计了太多的冗余单元,那么你就面临着芯片面积太大的风险,并且这些增大的面积对实际性能毫无贡献。但是如果你设计的冗余单元不够,那么你的良品率就不足(就是加备胎,前面的挂了就换上,但是没挂的时候备胎不能拿来用)


第二种技术称之为Harversting,所有人肯定都很熟悉。其思想是:假设一片晶圆上功能完好的芯片只有很少一部分,但是我们并不丢掉那些有瑕疵的芯片,我们关闭某些功能单元,然后把他们当做低端芯片卖。
例如,如果老黄设计某个核弹,包含了2880个流处理器(GK110),预期只有30%的产品是2880个流处理器都可用,50%的产品可用其中的2688个。那么你可以把2688个流处理器可用的芯片当做稍微低端的GTX TITAN卖。因此这种方法使得一片晶圆上80%的芯片都可用,如果可能的话,你还可以屏蔽更多的流处理器单元,把2304sp的当做GTX780卖之类。使得接近100%的芯片都可用。

良率会随着时间改善,如果你一直依赖于Harversting,那么这种方法最终会损害你的财务表现。在上面的例子中,随着良率的改善,越来越多的芯片2880流处理器可用,但是你还是只能当成2688流处理器卖。某种意义上说,值一块钱的东西你卖八毛钱。当然你也可以设计2688流处理器的新版本,但是这会耗费额外的时间、金钱和工程师资源。

GT200系列就是采用Harvesting技术的典型。GeForce GTX 260就是GTX280的Harvesting版本。随着良率的改善,NV推出了GeForce GTX 260 Core 216。但是要注意并没有为GT200系列设计任何的冗余单元。因此GT200系列的芯片上最多有240个流处理器,如果240个流处理器不能用的话,那么就当成GTX260或者core 216卖。

与之形成鲜明对比的是RV770系列,两个版本的RV770功能单元的规格都是一致的,所不同的只有频率和功耗的不同。

上面的两种策略都是针对一块晶圆来说,而不是单独的核心。

如果一整块晶圆决定拿来生产TITAN,那么30%的完整核心也会被拿来当做Titan卖。

所以后来会有新的优化版本,也就是新步进。

与GPU相同,CPU也是一样。不过它不像显卡那样有很多的流处理器簇可以屏蔽,只有核心和L2,L3可以阉割

出厂前所有的处理器都会检测,分级成为不同等级的产品,比如i7 975,965之类


我们的开核U就是完整核心屏蔽而来的产物


对于开核U,问题大概有这几个部位

①核心部位有瑕疵,就必须把该核心关闭,几个核心有瑕疵就关几个
②L2有瑕疵,由于核心和L2是一体的,也必须关闭核心 
③L3部分瑕疵,就必须阉割或者关闭L3
④内存控制器有瑕疵,无法稳定运行在标称频率,只能降频,不行就屏蔽


首先来理顺历史
我们知道,最火的开核U速龙5000
CPUZ里显示为
AMD Athlon(tm) 5000 Dual-Core Processor

QQ截图20170417204100.png
首先不要把它和65nm Brisbane核心,AM2的Athlon 64 x2 5000+搞混了,5000+是原生K8架构双核

有人打开了主板上的ACC功能后发现它变成了四核FX5000
QQ截图20170417204003.png


介绍一下何为ACC


高级时钟校准功能,又叫ACC(Advanced Clock Calibration),AMD在SB750/SB710南桥芯片中新加入的辅助超频功能,还具有破解CPU核心的额外作用。

ACC原本的作用是提高CPU超频的幅度和稳定性。然而这项技术却是打开处理器被屏蔽核心的关键所在,ACC时钟校验技术,我们并不陌生,因为它在去年(2008年)下半年才与AMD新的芯片组产品一同问世。为了提升AMD Phenom处理器的超频能力,在AMD SB750南桥芯片中加入了ACC时钟校验技术。

Advanced Clock Calibration是AMD的一项CPU时钟校准技术,可以让Phenom处理器的超频能力得到提升。

ACC时钟校验通过特殊的6pin接口与AM2+处理器接口相互连接,形成信号通道,从而对CPU的时钟频率及运算误差进行校正,其实ACC时钟校验功能就是允许CPU在工作的过程中出错,但不会导致系统挂起或瘫痪。因此无论是否在高频率下运行,只要在BIOS里打开ACC时钟校验,并设置容差值,CPU的运算工作机制出错的几率就会增加,因此在允许CPU有大幅计算误差的情况下,不达标准的核心,有可能就会变成“特定容差”下的达标核心,解放出来了。这就是三核变四核的奥秘,而现如今,不仅是SB750的南桥中带有ACC,SB710也加入了ACC,不少AMD 770主板由SB700升级到了SB710,也具有破解CPU核心的功能。


此后SB710就成为了开核神器。

开核后双核5000变为了从未见过的型号 Phenom(tm) FX-5000 Quad-Core Processor,原生的45nm和6ML3与K10 Phenom 完全不同,这是为什么呢?


根据网上的评测,这批5000的最大特点是,在破解后普遍都能上2.8G左右,一些不能超的5000,破解后只要换了内存,都能维持在2.66-2.8G,(实际上有不少只能开核不能艹的)也就是说,这批5000的实际体质一般是2.8G,至于3G-3.3G,也有不少。不过这批5000在破解超频后,内存一般只能跑400或者533这两档,能跑667或者800的几乎是没有。如果不超频,这批2.2G的AMD 5000却一点问题都没有,400,533,667,800都是非常稳定
结论是:这批AMD 5000的内存控制器有着严重缺陷

网上有人用100颗速龙5000做了测试,将100颗破解的速龙5000在ACC选项中选择手动,所有的核心,容错值都选择-2%(比正常的0%更严苛)。如果能够通过测试,那么说明核心是完好的,仅仅是因为内存控制器瑕疵而遭到屏蔽,如果不能通过测试, 那么说明核心或者L1,L2,L3有瑕疵

开启ACC并且选择-2%后,有8颗CPU在开机后辨识为Phenom FX-5000,无法正常启动,在BIOS下面只能识别3个核心。31颗CPU能够进入系统,但频频出错。34颗CPU能进入系统,并且运行测试软件(AMD OVER DRIVE,3DMARK VANTAGE)但在运行过程中会出现贴图错误或者花屏,部分CPU无法通过AMD OVER DRIVE 1小时测试。其余27颗CPU在-2%状态下运作良好,通过测试,均可超频至3G。但在3G状态下,有16颗CPU无法通过测试,我们可以认为是CPU体质问题,核心仍然是完美无瑕疵的。但需要提醒的是,这些完美核心的CPU,内存控制器仍有瑕疵。

这说明了良品率大概在30%左右,属于比较低的数字。据此可以判断这应该是45nm初期工艺不成熟的产物

我们知道原生PhenomⅡ的Deneb是原生四核心,6M三级缓存
而开核后的FX5000与此规格几乎相同,只是接口为原生AM2+,说明它是比PhenomⅡ更加早期的高端产品,只是内存控制器瑕疵,迫不得已阉割了三级缓存和大部分完好的核心,做成低端的速龙5000卖

至于这种推断是否有据可查,看下面

Phenom刚刚发布时,曾经不断有传言将推出针对Intel Skulltrail的高端双路桌面处理器Phenom FX,即更高频率的K10架构的Phenom,原生65nm,2ML3。

经过几番沉浮后,Phenom FX仍没有出现,早先有传言AMD已经放弃了这一计划。

此后AMD也声明: 针对高端DIY玩家的羿龙FX(Phenom FX)也将流产。FX系列处理器代表着AMD桌面处理器的最高技术水平,对AMD的产品品牌形象和重视用户至关重要。但由于A MD面临频率无法提升的困境,所以不得不取消Phenom FX-80 及Phenom FX-90 两款羿龙FX处理器的上市计划,短期内不会将其纳入产品蓝图。不过,AMD未来FX系列的45纳米处理器Deneb FX将暂时保留,目前DIY玩家可以购买AMD的黑盒产品。

而根据一家英国网站的最新消息,Phenom FX确实存在,而且就是45nm Deneb核心的顶级型号。且原先计划中的65nm PhenomFX的型号PhenomFX80等将继续沿用到45nmDeneb核心的PhenomFX上

此后爆出了更多关于45nm的新闻
面对Intel Core微架构甚至是即将到来的Nehalem Core i7,AMD的65nm K10 Phenom处理器只能依靠高性价比来竞争中低端市场,而让Intel在250美元以上的高端桌面处理器市场一家独霸。45nm Deneb自然成了AMD期望打一场翻身仗的王牌。借助制程的进步,45nm Deneb处理器将大大降低四核Phenom的功耗,同时提高超频空间。
另一方面,去年Phenom刚刚发布时,曾经不断有传言将推出针对Intel Skulltrail的高端双路桌面处理器Phenom FX。经过几番沉浮后,Phenom FX仍没有出现,早先有传言AMD已经放弃了这一计划。而根据一家英国网站的最新消息,Phenom FX确实存在,而且就是45nm Deneb核心的顶级型号,将保持FX系列的优良传统,作为比BE黑盒版更高端的产品线存在,但并没有提及是否支持双路平台。

更惊人的来了,据称45nm Deneb的最高倍频从16x大幅提高到25x,即在不需要提高外频的情况下,Deneb的最高频率可达200×25=5.0GHz。另外,据称2.3GHz Deneb功耗仅为57.3W,高频提升空间非常充裕。而Phenom FX将充分利用这些提升优势,两款产品Phenom FX 80和Phenom FX 82的默认频率将达到惊人的4GHz和4.4GHz!

据称,4GHz标准频率下的Phenom FX 80性能已经超越5GHz频率下的Intel Kentsfield,虽然这里没有提及同更新款Yorkfield甚至Nehalem的性能比较,但这样的高频率再加上超越Kentsfield的性能/频率比,Phenom FX已经相当令人期待。

这是PhenonFX的存在证据

img001.jpg
富士康飞机场主板的宣传


以及农企官方文档,高端45nmDeneb核心PhenomFX80/82,中端是65nm Agena核心的PhenomX4,以及Kuma的Phenomx3,低端Athlonx2(x2 7750之流)
img002.jpg

img003.jpg
其实镇楼图也很好的说明了PhenomFX的存在

然而此后很长时间,PhenomFX都没有粗线…
全靠65nmPhenom硬抗,当然只有被Penryn和Nehalem凌辱的份

为何FX系列没有出现?
由上面的测试可以得出原因:45nm工艺不成熟,良品率不足(30%),而且全部内存控制器有瑕疵

所以PhenomFX流产,屏蔽为速龙5000之类

然后PhenomFX成了炮灰,试水品。
此后Deneb核心回炉重造,改良内存控制器,就成了Phenom II x4 920/940(AM2+版本)

img004.jpg

Deneb是K10.5的最早的die,原生4核,每核心512KB L2,6ML3

img030.jpg

然后Phenom II 全线铺开

继速龙5000后
出现了以下屏蔽型号:Athlon II x2 210/220之类(512Kx2 L2,由Debeb核心屏蔽L3和两个核心而来,可以开核心和L3)
部分早期速龙四核(可以开L3)

PhenomII x2/x3 双核/三核(可以开四核)


img023.jpg

然后AMD又推出了第二种die,原生AthlonII x2速龙双核,1MBX2=2MB L2的Regor核心

img012.jpg

img022.jpg

为了和Intel的奔腾双核对抗

架构为改进版Stars架构,相对PhenomII,每核心L2从512K翻倍为1MB

闪龙140即为这种核心,能开双核

以及第三种die,原生AthlonII x4速龙四核Propus,无L3

img014.jpg

img021.jpg

和Lynnfield/Clarkdale对抗,其余部分和PhenomII保持一致

由于L3的缺失,同频性能在PhenomII的90%左右

img020.jpg


最后是第四种die,最后上场对付Nehalem的六核Thuban,6M L3

img025.jpg

img005.jpg

img026.jpg

为支持Turbo Core的Thuban六核出现,尾数带T的(960T)之类,可以开六核,出现了1405T,1605T之类的奇葩型号

PhenomII、Phenom、Nehalem i7、Penryn四核对比

img027.jpg

PhenomIIX4、AthlonIIx4、AthlonIIx2、Penryn四核对比

img019.jpg

K10.5、K8各代双核对比

img013.jpg

接下来还是谈一谈各种型号的开核U吧

开核元老当然是K10.5架构,Deneb核心的速龙双核5000/5200,开核后变为FX5000/FX5200,2.2/2.3Ghz四核,6ML3,开核不稳定因素较多。

另:5000不支持D3【没有D3控制器】, 5200支持D3


QQ截图20170417204100.pngQQ截图20170417204003.png

此后Athlon II x2系列的早期低端都是Deneb核心屏蔽而来,由于内存控制器改良过,稳定性和开核成功率比速龙5000强很多
Athlon II x2 210/215/220/210e/220e,开核后成为Phenom II x4 910/915/920/910e/920e,e为45W低功耗版本

img002.png

与x2系列相同,Athlon II x3系列也有开核神器,主要代表为x3 400e/405e/415e/420e/425/435/440/445/450/455
开核后变为Phenom II x4 6400e/B05e/B15e/B20e/B25/B35/B40/B45/B50/B55

注:e系列节能版由于采用与后期速龙四核相同的Propus核心,原生无L3,所以开核后无L3,所有开核的e系都一样

Athlon II  x4系列早期为Deneb核心屏蔽L3而来,所以部分x4 620/630/640可以开L3变为Phenom II x4 920/930/940
再往后出现了原生无L3的速龙四核,就不能开了

不过等到六核出现后,走六核Phenom II 屏蔽而来的640可以开六核开L3变成Phenom II x6 1405T

E0步进的640都可以试试


Athlon II X4 Thuban.pngp5bhbv.png

再说说PhenomII系列
Phenom II x2/x3系列都可以开核,且成功率较高,最著名的就是x3 710了


Phenom II  X2 545/B53/B55/B59/550/555/560
开核变为x4 B45/B53/B55/B50/B55/B59/B60


Phenom II x3 700e/705e/710/720/B73/B75/B77
开核变为Phenom II x4 8700e/8700e/x10/x20/973/975/977


QQ截图20170417204841.png23ijpt.png

dw5kyz.pngimg002.png

img003.pngimg001.png



近年卷土重来的开核风就是由Phenom II x2 B55/B59引领(C3步进B系列几乎个个都能开)

Phenom II x4可能没什么好说的
能开的就是840T,970T,960T了,960T开核成为1605T


iSA4b.png

cpuz.pngQQ截图20170417205259.png

另外,最低端的单核闪龙也可以开双核
闪龙140/145开核后变为x2 4400e/4450e,1Mx2L2
而且能艹,性价比很高


1.pngQQ截图20170417205456.png


全文完

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮