数码科技

【RV870背后的故事 – HD 5000如何诞生并一战成名】The RV870 Story: AMD Showing up to the Fight

source:http://www.anandtech.com/show/2937

翻译来自网络,具体来源找不到了,修改了因翻译问题可能难以理解的地方。

2017.7.2 调整了很多地方的翻译。原文翻译的实在有点…

2017/7/25调整完毕


前文:【RV770背后的故事 – ATI小核心成功之路】The RV770 Story: Documenting ATI’s Road to Success


It’s a story all about guessing, conflicting, betting and balancing.

前言

不管你是AMD,英特尔或者NVIDIA的粉丝,你必须向对手致敬。过去几年的时间,为我们展示了AMD图形部门戏剧性的转变,从RV670,770和870上扎实的执行力,ATI的转变值得我们赞许。

电话

      我们都知道,RV870将要在09年底的某个时候发布,我们通常在得到新产品硬件的前1个月进行新产品的简报。那时谣言说,这次发布已经被推迟,但就像钟表准时一样,我在去年6、7月间接到AMD电话。这是我的老朋友,AMD PR:Chris Hook。 

img009.jpg

这一次,他希望我去参加在加利福尼亚海岸边一艘航母上举行的发布会(叹气……)。

      这并不是说我对航空母舰本身有任何意见,当时我脑中所关心只有期待已久的RV770继任者。RV770毫不含糊地恢复了我对ATI图形芯片的信心,当时其它媒体人也有类似的感觉。但我当时觉得在航母上发布新产品并非正式。但是, AMD公司向相关单位和其合作伙伴承诺,他们将邀请大量全重要媒体参加发布会。我们也从AMD那里获得了保证,即可以和相关技术工程师交流,获得有用的信息。

img010.jpg
美国海军大黄蜂航母, HD 5800 GPU就在那里


晚宴 – 2009年9月

      我不得不早些离开。华硕董事长施崇棠在我离开奥克兰之前,恰巧有机会和我见面。每当我们恰好是在同一个城市,我们会尽最大努力满足我们见面的需求,我是不会让他失望。同样,史蒂夫乔布斯是成功的,因为他是一个心里装满产品的家伙,运行着以最好的产品著称的公司。施崇棠是心里装满工程的家伙,他开办着在工程方面卓越知名的公司-Asus。这不只是又一次例会,这是一次见面会,见面的2个人有着相同的热忱。施崇棠的重点不是赚钱,是工程,这是一个难得的享受。

      我的车在外面等我,我关闭我的笔记本电脑,确保我已经保存了晚餐上记录13页内容。之后我就和下面这个人握手:

img011.jpg

      在我离开之前,他要求我做一件事。他说:“尽量不要把我加入故事当中。大量工程师勤奋工作才让这款芯片真正问世。”和Jonney一样,Carrell Killebrew有他自己的特点,使他在这个行业成为完全独一无二的家伙,伟人都是这样。他们都在自己的历史,把他们带到的他们现今工作的公司,他们今天的工作,他们的人格特质加以组合,让以他们有自己独特的气质。对于Carrell Killebrew来说,他集智慧,务实,热情和谦恭于一身,这是非常罕见的。他也是一个真正的好人。

      Carrell Killebrew并没有参与研发RV870,但他是帮助RV870取得成功的关键人物。下面是RV870故事的一小部分。尽管这篇文章超过8000字,我还是将其称作是一小部分,因为数百名工程师研发RV870多年,其中的故事无法在此一一讲述。RV870和业内其它所有GPU产品一样,都是业内最优秀工程师毕生心血的作品。他们是我们行业的英雄,我希望能公平公正地讲述他们的故事。

      为了展示RV870的研发历程,我们必须从几年前讲起,一个全新的GPU从研发到上市可以花费2至4年时间。因此,要了解这款Radeon HD 5800系列(RV870)产品,我们要从2005年开始回顾。


命名花絮

      AMD在上代GPU上,就希望摆脱传统的命名方式。据AMD称,不存在所谓的RV870 GPU,尽管在过去几年当中, Carrell Killebrew、Eric Demers等无数人提到它。如同大多数的变化,我们通常需要一段时间来适应,因此,尽管RV870并不存在,我们这些人还是习惯性地称呼Cypress(Radeon HD 5800系列)为RV870。

img012.jpg

      为什么AMD要改变命名规则呢?因为让一个GPU家族的每个成员都有一个单独的名称,这样可以让竞争对手产生混淆。我们可以很容易地知道,RV870是RV770的接班人,但是,我们很难描述Cypress到底是个什么东西。

下面的图表给出了AMD 40纳米DX11 GPU的全部阵容及其研发代号:

img013.jpg


PRS清单
 
      由于我们还没有从我们的词汇当中将RVxxx除名,所以我将坚持在本文当中采用RV870。整个AMD DX11 GPU家族研发代号为EverGreen(长青),AMD下一代DX11 GPU家族研发代号为Northern Islands(北方群岛)。

      ATI手上有一个文件名为产品需求规格的清单,简称PRS,是用Word写的一份很大的文本文件。

      该清单的目的是为正在设计的GPU收集所有必须加入的功能,并尝试加以排序。这个文件当中有一系列第一优先的功能,通常情况下,第一优先的功能很少会被废止。清单当中接下来的是第2优先,第3优先,第4优先等功能。数字越高,加入到GPU当中的可能性越低。

      当Carrell Killebrew首次加入ATI,他当时的老板Dave Orton就让他负责修改PRS。Dave Orton要求Carrell仔细修订这份清单,它是ATI图形芯片未来希望的一份清单。PRS清单结合了市场需求和研发能力,Dave Orton希望让市场部和研发部所有人为其买账,并按照清单规定的内容办事。

    Carrell于2003年加入ATI,但ATI制定PRS清单的方式在2005年之前一直没有变化。直到2005年。


R5xx如何改变ATI

      在ATI R5xx的同一时期(2005年),ATI从根本上改变其设计理念,即ATI由市场时间表来驱动。

img014.jpg
 
ATI 延期上市的R520

      市场通常会有旺季,企业最好可以驾驭这些增长点,比如每年第四季度的圣诞节假期,或DirectX 和Windows新版本的发布,这些都是市场重要的增长点。OEM笔记本电脑设计周期也很重要,产品必须和其保持一致。企业必须在这些增长点拿出点什么。 ATI的Eric Demers(现为AMD图形部门的首席技术官)对以上现象有所总结:如果你不出现在战斗当中,默认情况下,你就输掉了战斗。

      ATI转向由市场时间表来驱动,意味着PRS必须处于掌控之中。这意味着Carrell在处理PRS清单时需要做的很出色。

      这些转变的结果就是所谓的“80%规则”,即对于写进PRS清单上的功能,工程师至少要有80%的把握能及时完成。每个人,每个高级工程师都参与其中。市场营销和产品经理们有机会提出要求,但除非工程师认为可行且不会影响进度,要求才可能被采纳。

这种规则改变了很多东西。

      首先,它增加了工程团队信心水平。“80%规则”有人性的一面。丧失信心和执行力是最差的,但如果向着切合实际的目标努力,士气和信心就会大涨。还会带来副作用:充满激情的工程师还会试着超越既定目标。

      第二个变化是,PRS清单上列出的功能更容易被废弃。PRS清单当中通常会列出200多项预期功能,但在R5xx之后,PRS清单上的功能下降到了80项左右。

      在过去,ATI都会想办法满足新功能和客户的新要求。但R5XX之后做出的改变意味着会影响进度的功能不会放到芯片里去。最近,Intel也改变了设计政策,指出加入芯片当中的功能必须以1%的功耗增加换取2%的性能提升。ATI现在的设计哲学是任何功能均不能阻碍发布时间安排。


打造一款巨大的RV870

      虽然Radeon HD 5800系列在去年9月发布,ATI早在2006年就开始讨论RV870的架构和制造。

      到2007年,ATI已经拿出EverGreen家族产品的粗略轮廓。 ATI那时对DirectX 11和微软Windows 7发布时间安排已经心知肚明,只是不知道具体发售日期,但ATI知道什么时候开始为DX11和Win7作准备。这将是另一次市场的增长点,ATI必须为此做好准备。EverGreen家族必须在2009年第四季度发布,但是EverGreen家族应做成什么样子呢?

      Carrell希望RV870是另一个RV770。他对自己之前的设计充满信心。他想要成本更低的小芯片。

      但销售部门不喜欢这个主意。媒体对R600都是负面评价,ATI压力很大。AMD刚收购ATI,不景气的CPU业务导致雪上加霜。做销售的不想连续两代拿不到性能王冠。

     PR通常很不喜欢被媒体追问为什么产品性能不是最强这类话题,特别是在性能为王的市场当中。ATI市场部不想要RV770二代,他们希望NVIDIA杀手出现。当时没有人知道RV770将是NVIDIA的杀手,他们以为只需要打造大芯片就行。 

img015.jpg
AMD新GPU战略,但只适用于RV770。

      2007年8月到11月间,Carrell Killebrew很想撒手不干。因为NVIDIA要造一个大芯片,所以ATI也该造个大块头RV870的争论的确激怒了他。因为这正是一年前研发RV770时他强烈反对过的。伟大领袖的标志之一,就是真正相信自己。Carrell相信他的RV770策略是正确的。而在RV770问世之前,其他所有人都试图让他承认自己是错的。

     即便是曾在RV770上支持过Carrell的Rick Bergman也同意,应该在RV870上采取更激进一点的策略。用RV670、RV770小核心打NV一个出其不意,然后造个RV870大芯片。

     今天我们已经知道小芯片战略的确有用。但当时ATI不制造另一个RV770也合情合理。如果已经冒过一次巨大风险,何必再冒第二次险?还是说两边下注?前者被认为是不明智的,而后者更加稳健。

     Carrell不买账。但他别无选择。他要不走人,要不就只能闭嘴听天由命。

img016.jpg
芯片尺寸规模比较

      最终结果是Carrell的变相妥协 – 最终PRS清单并没有给出芯片尺寸规格。Carrell同意让RV870达到至少2倍于RV770的预期性能。我把这种妥协称为“变相妥协”的原因是,那时工程团队把此看作是为建造大芯片开了绿灯,他们准备兴建边长至少20mm的芯片,新功能加入后还可能提升到22mm。


调整轨迹 并延后发售

      Carrell这时候已经不相信大芯片策略。并不是说大芯片难以研发制造,问题在于将高端的$600大芯片缩减到$200的主流产品太花时间。AMD认为,最重要的市场是更大(出货量和营收两方面)的主流市场。

      Carrell没有先把主流市场放在一边,而是决定首先向200~300美元主流市场推出新产品新技术,再将尺寸扩大或者缩减,解决高端和低端市场。

img002.jpg

      RV770 的风险是架构和显存技术。而RV870的风险在于架构和工艺,后者完全超出AMD的控制范围。

      早期Carrell认为,台积电40纳米工艺不够成熟,其成本将大大高于预期。他没有进一步说明,但告诉我当时很多消息显示台积电40纳米工艺成本低,实则不然。我会在文章后面谈到这个问题。

      Carrell勉强赞同400+mm2 RV870的计划,因为他相信当工程师清醒过来并认识到成本不会便宜,就要另做讨论。

      2008年初,即将进入2月份的时候,台积电开始放风,暗示ATI对40纳米工艺成本不要过于乐观。

      工程师从台积电回来后说RV870的成本将会很高,建议再审视一下RV870的架构。

      这正是他们后来所做的。该小组和Rick Bergman会面,但是被后者的妥协难住了:Rick Bergman坚持RV870的性能必须至少2倍于RV770,但必须砍芯片面积。 ATI最终在2008年3月改变了Cypress(高端,单GPU RV870)的规格。

      这正是改变后的ATI出彩的地方:一、不要拖延既定时间表,二、停止设计最大尺寸的GPU。然而为了保证第二条就得牺牲第一条。

      要知道,在产品发布前一年半去改芯片配置,这意味着搞砸了一切。 RV770发布的时候,RV870的设计应该尘埃落定。就算提前一年,任何修改都会导致时间安排的变动。但现在ATI却必须回去重做RV870的Floorplan和配置,这至少需要几个星期,甚至数月时间,会影响到RV870的时间安排 – ATI不得不付诸巨大努力,尽量减少对发售时间的影响。HD5870因为这次改动推迟了30-45天。

      还记得ATI定下的无论如何不能影响时间安排的规矩?工程团队和Rick Bergman拿出很大勇气才能接受重新设计RV870所花费的时间。如果你不上场战斗,那么就已经输了。这正是ATI同意重新设计Cypress所承担的风险。

      同样,NVIDIA也清楚DX11/Windows 7的发售时间,NVIDIA非常清楚Fermi需要的功能,因此决定让Fermi延后,而不是和微软同步。AMD冒着延后的风险缩小RV870的尺寸,而NVIDIA则是延后以便制造大芯片。在这点上,两家公司大相径庭。

 

img017.jpg
RV870的实际架构

      此时,ATI工程师挠头不已,因为RV870尺寸在大幅度缩小的同时提供2倍于RV770的计算能力。必须砍功能了。


Carrell失去了他的“珍爱”:不得不向Sideport说再见

      老实说,与Eric Demers和Carrell Killebrew共进晚餐,是我和ATI合作以来的最佳体验。

      Eric Demers在晚餐当中,向我详述了他们如何把RV870尺寸从400平方毫米削减到334平方毫米,来获得美妙的最终产品。我打断了他,我让他们举个例子,他们是如何对某项功能痛割爱的。通常来说,PR是不会向外人透露他们割舍的功能,他们喜欢谈论产品保留下的功能,让一切听起来和剧本一致。幸运的是PR的人没能参加我的晚宴。

     Eric Demers转向对Carrell说:“我知道一个特点,我们可以谈谈。”

     “Sideport”。

      Carrell回答说:“天哪,这完全不公平。” (注意Carrell这话不是少女腔,而是工程师的语气)

      当ATI第一次和我讨论Radeon HD 4870 X2,他们告诉我们一个叫做Sideport的功能。每个RV770 GPU都可以借此进行GPU-GPU之间的通讯。

img018.jpg
Sideport工作示意图

      ATICrossFire交火技术在交替帧渲染模式(AFR)当中,两个GPU无需交互通讯,但是如果你想要让它们腾出精力进行交互通讯,CrossFire交火性能就会严重降低,因此,ATI设计出Sideport来缓解交火性能的损失。

      不幸的是,由于功耗等原因,4870×2显卡从未使用过Sideport功能。 ATI公版设计已经屏蔽Sideport,并且所有的AIB厂商均遵循ATI的公版设计。

      Sideport是Carrell Killebrew最喜欢的功能,现在他不得不放弃Sideport。

      2008年初,ATI认识到他们不得不将边长20~22mm的RV870削减为边长18mm的芯片,每个人都不得不放弃一些东西,Carrell是小尺寸RV870的极力倡导者。

      我与Carrell在Sideport上的部分谈话,应要求没有记录下来。Sideport对RV870应该有好处,但不幸被放弃了。不过,Carrell也告诉我,如果我在某个时候看到Sideport重出江湖,也不要感到惊讶。 Carrell不会轻易放弃Sideport。【后来的集显上有用到Sideport】


如何做到在6个月时间内发布4款产品

      经过艰苦的工作和牺牲,ATI将RV870尺寸削减到18x18mm。问题是,RV770芯片边长16mm左右,RV870的尺寸仍然过大。

      Carrell要求进行更多的削减,但是有两件事改变了他的主意。首先,为了按照RV770尺寸建造RV870所做的功能牺牲超过Carrell的预计,并且将牺牲部分SP。

      另外,为了让GDDR5显存数据传输率达到既定目标,他们必须增加RV870芯片上的模拟物理层面积,如果RV870侧边还维持在16mm,他们将不得不缩减显存带宽或者牺牲SP单元面积,这样我们只能得到性能降低的产品。

      我问Carrell:“16mm边长是否可以让RV870发售价格降低100美元,向便宜的RV770看齐”。而他的回答是不能,我一直到后来才知道为什么不能。

      虽然ATI没有牺牲性能来满足16x16mm芯片尺寸的目标,但最终说服Carrell顺应更大芯片的是,要在不到6个月内发布4款不同的40纳米DirectX 11 GPU – 此处应有给ATI的掌声。


img001.jpg

     Carrell一直宣导的理念,即制造最大尺寸GPU将让主流用户等待太久。看看NVIDIA花费了多长时间来推出G80或GT200的主流产品?谁知道什么时候可以看到150美元的费米GF100衍生产品。【GF104】

img019.jpg

      但ATI工程团队承诺了两件事。第一,Evergreen中端Juniper将在同一时间为发布做好准备。第二,Cypress发布之后,ATI还会发布另外2款GP,整个Evergreen家族将在6个月内全面展开。 ATI 2008年在3个月内发布了3款GPU,而HD4000系列的第四个成员直到2009年4月才发布。

      这不是不可能。ATI在印度、中国都有并行设计队伍和很多工程技术人员。如果中途没有bug产生,ATI完全可以让Juniper团队和Cypress团队并行研发同一款硬件,提升效率(Cypress架构砍掉一半就是Juniper)。

      不过在Carrell看来,这种举措的巨大风险让他不安。他认为,并行设计同一家族的两款产品是有风险的。如果一切顺利,你会在同一时间得到两款产品;如果设计不顺,两个团队将陷在同代产品开发上,相当于ATI的“Fermi”。

      但当工程团队告诉Carrell认为一切会顺利,Carrell给了他们充分的信赖。在Carrell紧张地签字同意工程团队的计划之后,Evergreen家族就诞生了。 


img001.jpg

      最终,Cypress和Juniper几乎在同一时间问世。事实上,Juniper准备得更早一些,在发布5000系列几个月之前,ATI就将Juniper样品交付给相关开发者了。Cedar和Redwood也在随后顺利发布,更遑论双Cypress,即Radeon HD 5970。而这一切都在不到6个月内完成发布。(芯片本身都在4个月内准备完毕)。

      当硝烟散尽,ATI在400美元、300美元、200美元、150美元、100美元和60美元的价格点上都有了DX11新产品,很好地契合了Windows 7/DirectX 11市场增长点。


迈入40纳米的代价

      这部分内容几乎可以独立成章,但它对Cypress和整个Evergreen家族产品有直接影响,值得在这里说一说。

      你现在可能已经知道台积电40nm工艺有过问题。这些现在已经解决的问题使得之前产能上不去,良率过低:导致Cypress缺货,也同样导致NVIDIA推迟Fermi/GF100。我下面想谈谈迈入40纳米工艺的事情,以及40纳米工艺为什么那么困难。

      对无晶圆厂的半导体公司来说,最大的问题是,在新产品研发上,你必须对付一打供应商,比如显存厂商、元件制造商和知识产权厂商,你还必须处理与代工芯片制造商的关系。更糟的是,每一年左右,你的代工合作伙伴就会启用一个全新的进程让你使用。

      代工厂商总是以相同的论调来说服你使用他们的新工艺,比如芯片尺寸更小,运行速度更快,能耗更低。你的代工合作伙伴总是希望你尽快购买其最新最贵的制程和工艺。他们要你在工艺准备好之前就买他们的工艺。

      但是,通常的情况是在你付钱之后,你的代工厂商会提出设计规则和提示清单给你,如果你遵循所有的准则,代工厂商就保证他们能够制造你的芯片。换句话说,做我们告诉你去做的东西,你的芯片就会量产。

img020.jpg
Global Foundries 2010年至2011年芯片工艺路线图


      问题是如果你遵循这些设计规则,你的芯片的新工艺版本并不会比老工艺更快,良率差不多,但成本会更高,因为你在设计芯片的时候轻信了代工厂商的“暗示”,让芯片面积膨胀。

      一般工艺节点之间的晶圆大小不会改变。之前200毫米晶圆使用了很长时间,现在才进化到300mm晶圆。缩小的是晶体管尺寸,因此理论上讲,每代新工艺晶圆可以容纳更多的芯片。

      任何新的制程都存在晶圆成本上升问题,这是由新制程复杂程度决定的。如果晶圆成本高出50%,那么你需要在每片晶圆当中至少多放入50%的芯片,才能让成本和旧制程持平。现实中需要放入超过50%的芯片,因为还有良率问题。如果遵循代工厂商制定的保证良率的导向,你几乎不可能收回成本。

      最终的结果是你从新制程当中的获益为零。任何利用摩尔定律来获利的半导体企业都不会这么做,更不用说GPU制造商。

      这种问题的解决之道:在你的公司里雇用一些非常聪明的人,他们可以把代工厂商的这些设计规则和暗示归纳分析,并找出哪些可以忽略,另外的该如何解决。在这个领域当中,ATI和NVIDIA的做法有很大不同。


工艺与架构:ATI与NVIDIA的不同


      从NV30(GeForce FX)开始,NVIDIA就没有率先采用新工艺和新制程的先例。NVIDIA选择在芯片架构设计上投入更大的资源,而不是让大量工程师来对付新工艺和新制程。ATI则相反,他们不害怕更新的工艺,将更多的工程资源来应付制造方面的问题。这两种方法都是正确的,他们都有自己的权衡。

      NVIDIA的方法意味着他们在成熟的制程上会极为成功。但在重大制程之间的转换当中(如55纳米到40纳米),NV的竞争力会略差,所有NV需要花更多的时间来调整架构,使其更具竞争力。只动架构也能提升很多。ATI之前把主要精力放在RV770的架构上,提升想必你已经知道。

      NVIDIA历来认为应让ATI承担转移到新工艺的所有风险。直到新工艺成熟,NVIDIA才会用它。这对NVIDIA有好处,但这也意味着在工艺转换方面,ATI拥有比NVIDIA更多的经验。因为ATI需要比对手更早采用不成熟未经证实的新工艺,ATI要投入更多的工程师来处理新制程方面的问题以降低风险。

      在和我谈话当中,Carrell毫不迟疑地指出,升级制程并不是所谓的“过渡”,因为,过渡意味着从一种技术平滑地渐变到另一种技术。但是在任何重大制程节点之间转移(如55nm到45nm,不是90nm到80nm)更像是“跳跃”,而非过渡。你准备跳起之前,通常尽量准备跳到你希望的地方,但一旦你的脚离开地面,就没有什么可以控制了。

      任何制程节点之间的“跳跃”风险都很大。作为一家半导体制造商的窍门是如何减少这种风险。

      在某些时候,制造商们必须换新的工艺制造芯片,否则往往会面临被市场淘汰的危险。比竞争对手落后多代制程,意味着你已经game over了。现在问题来了,如何判断什么芯片应该采用新制程,什么芯片不应该采用新制程?

      对于这个问题,分成了两派:大“跳跃”或小幅升级。差别在于你在工艺升级当中选择的芯片大小。

      小幅升级的支持者们认为,在新制程当中,缺陷密度(晶圆每单位面积的缺陷数量)会比较差。晶圆当中将分布大量的缺陷。为了尽量减少高缺陷密度的影响,芯片尺寸应该尽可能小。

      如果我们有片晶圆,可以容纳1000个芯片,其表面有100个缺陷,那么单颗晶片出现1处缺陷的可能为10%。

img021.jpg

 假设晶圆有7处缺陷,芯片采用小尺寸设计,那么每颗芯片受缺陷影响的比例就不大

    大“跳跃”自然是相反的。你在新工艺上使用大芯片设计。现在,不是1000颗芯片分享100处缺陷,而是可能只有200颗芯片分享100处缺陷。即便缺陷均匀分布(实际上不可能),缺陷芯片的可能性也暴增到50%。

 

img022.jpg

假设晶圆有7处缺陷,芯片采用大尺寸设计

      单从良率上看,没有采用大“跳跃”的理由,但是大“跳跃”也可能会带来好处。

      理由很明显,如果你能造出大芯片(比如干掉对手旗舰),净利润会比小芯片更高。

      作大“跳跃”更重要的原因,居然是人们不喜欢大“跳跃”的理由。因为大芯片更容易有瑕疵,更可能暴露新制程中隐藏的问题。失败的机会越多,就能越早了解新工艺中存在的不足。

      这对产品来说很冒险,但也给了你吸取经验教训的机会,可以用来在同制程下制造以后的产品。


回报:RV740如何挽救Cypress

      作为第一款40nm GPU,ATI选择了其路线图上可以承受的最大尺寸的芯片,这就是RV740(Radeon HD 4770):

img023.jpg
2009年4月发布的第一款40nm产品-ATI Radeon HD 4770

      然而NVIDIA却选择了更小的芯片。RV740面积是137平方毫米, 而NVIDIA的第一批40纳米产品 – G210和GT220面积分别是57平方毫米和100平方毫米。G210和GT220在问世最初几个月只向OEM厂商出货,估计G210居多。直到GeForce GT 240发布,NVIDIA 40纳米芯片的大小才等于RV740芯片的大小。GT240在2009年11月发布,而Radeon HD 4770(RV740)在2009年4月就已经发布,比GT240提前了7个月。

img001.jpg
NVIDIA第一款40纳米GPU在2009年7月出货

      当ATI和NVIDIA将高性能GPU制造工艺迁移到40nm的时候,ATI有更多的经验,在大尺寸芯片工艺上和台积电有更多接触和经验。

      ATI当时的图形工程VP – David Wang,在RV740设计过程当中,打电话给Carrell表达对台积电40纳米工艺的担心。他担心制造过程中的金属处理可能导致芯片的Via质量问题。所谓Via,是指芯片不同金属层之间的微小连接。他认为台积电40nm的Via失效率高到足以影响良率。即使Via不完全失效,也会降低通过的信号质量。

      David Wang对于台积电40nm工艺担忧的第二个原因是晶体管的尺寸变化。半导体设计当中有成千上万的尺寸需要考虑。无论采用何种制程和工艺,不同芯片在尺寸上会有许多差异,David Wang尤其担心新工艺晶体管沟道长度的制造变差。他担心台积电无法达到提供给ATI的标准。 

img002.jpg
1个标准的CMOS晶体管,其尺寸误差程度有相当严格的要求

      台积电当时试图说服ATI,沟道长度的制造变差会比较小。Carrell和工程团队对此感到不安,但对此无能为力。

      Via的问题好解决(但代价很高)。David Wang决定将RV740芯片当中的Via数量翻倍。在设计中的任何连接两个金属层的地方都有两个Via,导致RV740的尺寸增加,但总比芯片不工作要好。沟道长度制造变差的问题依然无法马上解决 – 当时他们很担心,但这担心也可能是多余的。

      台积电进行了RV740初步流片。当芯片样品回到ATI,发现RV740发热超出预期,并且它们的漏电问题也超过预期。

      工程团队立即着手解决问题,一个个分析芯片样品,没多久就发现晶体管沟道的变差超出了最初规定的限度。如果晶体管沟道变差到达一定程度,那么生产出来的部分芯片工作频率低于预期,其它芯片的漏电则更严重。

      工程团队终于想出解决的办法,通过在RV740设计上做出改动,修复大多数的漏电问题。不过性能仍然是一个问题,ATI花费大量时间在如何解决各种制造问题上,RV740作为一款产品是失败的。但是RV740对ATI来说意义非凡,它为Cypress和其它Evergreen家族产品的成功铺平了道路。

      至于NVIDIA的情况,目前无法得知。传闻似乎都显示,NVIDIA在40纳米上的经验根本无法和ATI相提并论。去年12月,NVIDIA公开对台积电表视不满,并且要求台积电在Via上做到接近零缺陷。

      Fermi的谣言也印证了ATI RV740遇到的同样问题,即产量之低,发热量之高,工作频率之低都超过预期。我们现在还没有看到任何GF100出货的迹象。

      当我问N为什么Fermi/GF100会延期到如此之晚,NVIDIA指出问题出在架构,而不是在芯片制造。当然,当时和我交谈的是一位架构师。如果Fermi/GF100延期的确是NVIDIA在台积电40纳米工艺交的学费,估计下代的推出就会更顺利吧。

      并不是说台积电不知道如何运行它的代工工厂,但也许该公司在40纳米跳跃得有点过头:

img003.jpg


还记得Cypress的讨论中Carrell坚信台积电40nm不会便宜吗?然而当时无论是ATI还是NV,几乎没人相信这一点。我问Carrell为什么会有这种情况,为什么他可以知道很多人不知道的内情。

      Carrell将其归结于他的经验,讲述了一堆我不能在这里发表的内容。不用说,他对台积电40纳米工艺持更加怀疑的态度。一个团队当中有怀疑者并非坏事。 


AMD防止间谍:Eyefinity项目完成的过程
 
      Carrell Killebrew对RV870的成功还有一项贡献,即他一手负责将Eyefinity技术带入整个Evergreen产品线。

      开始是这样的。所有GPU厂商都会去拜访客户(OEM),问需要在产品当中加入什么功能。于是笔记本电脑厂商想让单GPU支持6个显示输出,虽然同一时间内只需要有两个工作。两条输出可用于液晶显示屏,两条输出可以用在外部输出(VGA+DVI / HDMI),另外两个输出可以连接拓展坞。

      Carrell认为如果这些输出不能同时工作,那就是一种耻辱。于是他心中有了一个计划:任何Evergreen显卡至少要能同时驱动3台显示设备,高端Evergreen显卡甚至可以同时驱动6台显示设备。

      他这种想法并非单纯出自于疯狂,Carrell心中一直有一个目标:在六年内,他希望ATI可以拿出第一代holodeck(全像图形显示)业务。第一代holodeck将由一个180度半球形显示器和精确相位声音系统组成。当然我们还需要像素来使这一切看起来栩栩如生。这需要至少1亿像素才能实现,700万像素在你的正前方显示,9300万像素显示场景中其它部位。像素数量是一台30英寸显示器的25倍。

img004.jpg

      我们还没有到达2016年,所以他不得先从其它地方着手。而这个地方碰巧就是使得所有Evergreen家族成员单卡支持最低3个最多6个显示设备的Eyefinity。今天,我们知道这项技术的正式名称是Eyefinity,但内部Carrell称之为Sunspot(太阳黑子)。

      Carrell 不希望任何人知道“太阳黑子”这个研发代号,所以他一直没有把太阳黑子放入PRS清单当中。通过一些非常聪明的手法,他设法让“太阳黑子”隐身于探测之外,即便Cypress工程师已经将PRS清单翻烂。Carrell甚至成功让太阳黑子在后来缩小芯片的时候不被砍掉。他知道,如果有人知道了“太阳黑子”这个功能,工程团队在缩小芯片的过程中会把它阉割掉。更糟的是,如果亲信之外的其它人知道这个东西,NVIDIA可能就有时间仿照然后放进产品。当时Carrell的首要目标就是尽可能保守“太阳黑子”这个秘密。

      一切从一份名单开始。在这个名单上列出了需要了解太阳黑子的人名,如果你的名字不在名单上,不但你不知道“太阳黑子”,而且知道“太阳黑子”工程的人也不能在你身边谈论这个项目。当时,ATI有一个内部网站,上面列出了需要了解太阳黑子的名单。


     不光有名单,还有规定。

      正如我刚才所说的,在名单上的人都严禁在不知道“太阳黑子”的人面前谈论“太阳黑子”项目。如果你想要在名单当中添加新人,必须得到ATI批准,并且最终由Carrell说了算。

      太阳黑子项目的工程师立即开始研发,只有在绝对必要的时候才让其他人加入。该小组每次增加1个人,最后人数稳定下来。Cypress团队当中的软件工程师直到最后一分钟才知道太阳黑子项目存在。 Carrell只给他们足够的时间来启用太阳黑子(写程序),他们没有预先得到信息。

      Carrell这时候去找David Glenn  – ATI软件工程部头头,问他如果想开发太阳黑子的配套软件,最晚能到什么时候。David Glenn给了他一个日期,Carrell问哪些人必须知道,David Glenn给了他三个人名。那天,太阳黑子团队找来这3人,并说“我们需要告诉你一件事”。不用说,没有人对Carrell的保密感到高兴。那时,一些ATI高层知道Carrell找了一帮人进行一个项目,但是他们对具体内容一无所知。

 

img005.jpg
这就是最终让Eyefinity成功运作的软件

      在他自己的地盘上,Carrell总是用代号代指太阳黑子。他将太阳黑子称作“功能A”。Carrell有充分的理由这样偏执,坐在Carrell办公室另一边的某位人士,在“太阳黑子”项目开始几个月之后就跳槽到NVIDIA工作。太阳黑子项目研发过程当中,ATI共有3人离开并跳槽到NVIDIA工作。Carrell相信,NVIDIA公司当时对“太阳黑子”项目一无所知。

      当时,Carrell对“太阳黑子”的保密的确遇到了棘手问题,为了让Eyefinity工作,他需要从外部公司获得支持。如果你还记得,Radeon HD 5800系列发布同时,三星电子宣布超薄边框显示器将以1,3或6个面板的配置专门为Eyefinity出货。当时和诸如三星电子等OEM厂商洽谈的时候,根本没有办法把“太阳黑子”项目保密。ATI内部可能会有人泄露“太阳黑子”给NVIDIA,而接触ATI和NV两方的OEM员工向NV泄密的可能性基本是100%。

      在GPU研发过程当中,“太阳黑子”这样的保密程度几乎闻所未闻。 Carrell甚至开发了一个评级系统。“金”代表产品发布。如果直到发布“太阳黑子”仍然保密,就是“金”评级。“银”代表从台积电拿到芯片为止能保密;“铜”代表直到最终流片能保密,这样NVIDIA公司在“太阳黑子”项目上将落后AMD一个完整的产品周期。

      最后,AMD公司图形部门负责人Rick Bergman向Carrell承诺,至少会在“铜”,也就是直到流片“太阳黑子”依然能够保密。但是他告诉Carrell,当拿到流片的时候要对这方面有一次严肃认真的谈话。

      随着时间的推移,“太阳黑子”项目的进展,Carrell和研发人员成功到达“铜”阶段。RV870已经流片,没有人知道Carrell的宝贝项目。Rick Bergman这时候同Carrell进行了会谈,他要求Carnell让三个能使ATI真正受益的客户知道“太阳黑子”项目,这也有助于提升ATI的竞争力。

      Carrell不想冒险让对手知道“太阳黑子”,但他知道要取得成功,他需要OEM厂商的支持。解决办法很简单,把OEM也加到可以知道“太阳黑子”计划的名单中,同样的规则也适用于他们,让他们和AMD签署一个单独的保密协议。AMD法律专家将“太阳黑子”订为AMD专有的IP(智慧财产权),如果OEM厂商那里有其它人需要了解“太阳黑子”,他们需要先得到AMD的批准,这样确保任何泄漏将有迹可寻,可追溯。Carrell为“太阳黑子”分别起了3个不同的名称分发给需要知道“太阳黑子”项目的OEM厂商。

      在Cypress发布前几个星期,某家OEM的CEO看到Eyefinity,想要展示给别人。即使是CEO,都需要先经过AMD的同意。令人惊讶的是,三个OEM厂商都严格遵守了他们和AMD签署的NDA协议。??据Carrell所知,“太阳黑子”技术从未泄漏出去过。

 

img006.jpg
NVIDIA的环绕显示技术需要两张显示卡


      尽管NVIDIA展示在今年的国际消费电子展当中,展示了自己的三重显示技术,但它纯粹是一个软件解决方案,每个GPU仍然只限于两个显示输出。我问Carrell他对NVIDIA公司做法的看法,他一如既往地诚实。

 

img007.jpg
Eyefinity允许从单一GPU输出三组显示信号

      ATI之前也曾经考虑过软件方案,但最终出于两个原因否决了软件方案。在纯软件解决方案当中,你需要有一个多GPU系统。这意味着更昂贵的主板,更高功耗的电源,更麻烦的配置和可能发生的性能问题。

      一种情况是,如果明显不对称,比如一张显卡驱动一台显示器,另外一张显卡驱动两台显示器,这可能会导致一些奇怪的问题。另一个情况是,你用一张显示卡驱动三个显示器,在交替帧渲染模式下,你可通过PCI-E或一个CF / SLI连接器从一张显示卡把数据传输到另外一个显示卡。但是,Carrell担心6台显示器同时驱动的情况下,不会有足够的带宽来满足数据传输的需求。

      而游戏的兼容性问题也使得ATI最终放弃了软件解决方案。虽然现在Eyefinity在很多游戏里有明显的视场和宽高比问题,但这已经比ATI预想的好了很多,并且远胜于软件解决方案。

      不要小看ATI软件工程师在这里所作的努力。虽然Carrell 是最初“太阳黑子”三人小组当中的一员,但他不是将“太阳黑子”发扬光大的人士。他坦诚,最重要贡献来自于ATI的软件工程小组。“太阳黑子”的软件功能超过硬件功能。ATI的软件团队,尽管没有被纳入到硬件研发当中,但最终还是他们让“太阳黑子”变成Eyefinity!

      至于围绕着“太阳黑子”项目的惊人保密,并不是Carrell的娱乐项目。AMD已经开始学习他的保密方法。可能他能做到苹果那样的保密程度吧。


总结

      不同于产品评测文章,我在本文总结部分的文字非常少。没有什么购买建议,没有性能总结。即使作为分析文章,对我来说也没有多少可以总结的东西。当我在写RV770故事,我确信,ATI已经拿出新的,重新调整的图形设计方法,现在他们几乎倾囊而出,将其中的经验教训全部用在RV870上。

      RV870的继任者-Northern Islands(北方群岛)GPU,将在今年晚些时候发布。Northern Islands(北方群岛)GPU在RV870胜负未定之前就已经完成设计。更不知道Fermi/GF100会延期到这么晚。

img008.jpg

      不知道RV770到RV870的研发历史能告诉我们Northern Islands(北方群岛)GPU的什么。虽然我们不能断言ATI未来的产品,但我相信我已经充分了解到AMD图形部门的工作方式。

      Carrell告诉我,做一个产品的过程不是一个合乎逻辑的过程。产品当中的确有逻辑,但产品开发不是一个逻辑的过程。它是一个充满争论的过程。这过程当中冲突并不可怕,可怕的是还没有数据的时候要先建立起数据。当AMD和NVIDIA公司做一个产品的时候,工程师们并不知道所有的答案,而且他们的知识不是数据,而是可能性,权衡和猜测。有时猜测是正确的,有时猜测是错误的。只能做到根据每个人的经验,一起想出最好的猜测然后执行。多年来,似乎ATI已经学会了如何组织团队所有成员的力量去构建他们的产品。

      图形团队的奉献和在新工艺技术的“跳跃”经验,在这一代GPU上已见成效。从由台积电代工转到由Global Foundries代工,他们必将再次面临挑战,这不只是工艺技术上的问题。这个团队的计划和执行的能力正是AMD急需的。

      Carrell Killebrew帮助ATI从评价不好的传统GPU公司蜕变为以执行著称的公司。过去3代产品已经执行得非常好。不管你是AMD,英特尔或者NVIDIA的粉丝,你必须向对手致敬。过去几年的时间为我们展示了AMD图形部门戏剧性的转变。从R500、R600的摇摆不定到RV670,770和870扎实的执行力,ATI的转变值得我们赞许。我想知道是否AMD CPU队伍可以从中学到点什么。我希望随着ATI的收购也能带来互相学习所需的开明。

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮