数码科技

难以忽视的真相:Intel Larrabee的背后故事【Part2】

Part1地址:http://www.moepc.net/?post=2183

“GPU已死”,与NVIDIA的战争


去年春天,部分Intel员工宣称“GPU已死”,这句话后来又被Intel主管Pat Gelsinger在08年春召开的上海IDF上重述了一遍。Pat掌管Larrabee架构并确信它将是Intel的未来。我们100%同意Pat的这句话,只是Larrabee作为CPU和GPU的整合,不仅是Intel的未来,也是AMD的未来。这同样适用于NV,但那属于别的话题。


img001.jpg

臭名昭著的IDF China keynote一年后,Intel前VP Pat Gelsinger正展示Larrabee晶圆


唯一的问题是,Intel在手上连能正常工作*1的芯片都没有的情况下就和NV开战了。这是一个大错。当黄仁勋看到Intel工程师的评论和后来Intel主管在IDF2008的声明后,他对Intel“嘲讽全开”。Intel这次比较走运的是,这时候老黄手里也没有GT300芯片,但GT200已经兵临城下*2

随着Intel开始向OEM宣称NV没有权利为Nehalem和Lynnfield*3开发芯片组,两家紧张的关系瞬间转入战争状态。应某人请求,一份Intel和NV之间的交叉授权协议被放在了我们面前。我不会透露是哪边给我看的,因为从技术上来说 ? 这个人做了不被允许的事情。


就我这个外行人的理解能力来看,原文件的措辞并没有禁止NV制造Intel芯片组, 即便Intel弃用前端总线FSB之后也不会禁止,因为不管两边说辞如何,QPI和DMI都算“处理器互连”。


Intel一纸诉状将NV告上Delaware法庭,宣称NV对集成内存控制器的CPU没有授权。NV也丝毫不让, 进行了反诉,这次NV想废止交叉授权协议, 禁止Intel出货使用了NVIDIA专利的产品。


至于为什么这份交叉授权协议对Larrabee至关重要,理由很简单:没有NV的专利,就没有Larrabee。也不会有集成芯片组,同样会侵犯NV的专利。Larrabee架构与业界所有显示芯片一样,都使用了部分来自ATI和NV的专利。开发芯片不可避免的会侵犯其他公司专利,所以一切按民事程序来 ? 通过协议。我听到的具体数字大概有几十份专利,从Larrabee的帧缓存创建方式,一直到内存控制器等深层次。一旦闹到法庭上,就意味着你犯下了大错,或者是对手和你过不去。如果判决站在NV这边,Larrabee便无法上市,这时候就该说 ? “休士顿,我们有麻烦了。(Houston, we have a problem.)”

Intel运气好,正好碰上AMD收购ATI – 和AMD签署的交叉授权协议能让他们互相交换技术 – Intel拿到Yamhill (AMD64)授权,得以在自家CPU架构中使用64bit拓展; 用ATI的专利也应该没事(ATI和Intel已经有过协议)。个人赌5毛Intel为了交叉专利授权可能会把X86授权给NV,但事态究竟会发展成什么样,只有时间能够证明。(现在我们知道了)   前Intel法律总顾问,在业界数一数二的Bruce Sewell,在”退休”e-mail两天后又出现在苹果也是有原因的。I/N两家打起来后给工程师们增添了更多压力,他们必须一次次检查Larrabee的所有边边角角,导致计划进一步推迟。我完全理解他们 – 这些芯片是他们的心头肉。但法律上的压力迫使部分人离开。司空见惯的事 – 这样的大项目,铁打的营盘流水的兵。


不过Larrabee还是要上场,在无法正常工作的情况下。

B计划: Intel不断增持Imagination


如果关注过去一年半里的金融交易,你会观察到有趣的趋势: 苹果和Intel都开始增持Imagination Technologies的股票。苹果方面意料之中,他家的当红炸子鸡 iPhone iPad都用的PowerVR GPU。但至于Intel,一家在X86 GPU项目上砸了巨额资金的公司,却继续增持Imagination的股票并转移人手 ? 看起来有点奇怪。可能Intel是真的不想让苹果接手Imagination或者得到更多投票权,不过这也只是我们的推测罢了。

本世纪初与VIA爆发全面战争前,Intel并没有增持VIA的股票。当然Intel也绝对不会去买NV的股票。如果Intel对Larrabee胸有成竹,那为何还会去增持未来对手的股份呢?

有人可能会说这是为了阻止ARM使出Cortex CPU + PowerVR SGX GPU的致命组合拳,但如果你是Intel ? 作为行业老大的自信去哪了?是不是畏惧了PowerVR 5系的能效和性能?更不用说明年就登场的PowerVR 6系。

Sandy Bridge,45nm tick节点Nehalem和32nm tock Westmere的继任者将使用iGFX, 一款采用相同技术的显示子系统*4。比如Intel的Atom平台就是阿童木CPU+945GMC芯片组,内置PowerVR SGX 535显示核心。

本文地址:http://www.moepc.net/?post=2866

Intel IDF Larrabee演示


在数周前举行的IDF 2009秋季展会上,Intel首次向人们展示了能正常运行的Larrabee。2009年初我们见过Patrick P.Gelsinger手里的Larrabee晶圆, 但当时没有能运行的芯片。到了秋天的旧金山IDF 2009,演示系统已经能在Larrabee上运行《深入敌后:雷神战争》了。只是keynote技术部分的主持不再是Pat。


larrabeedemo_guetzli.jpg

INTC_Larrabee_PCB_Board_675_guetzli.jpg

【演示及演示平台

但有个大问题 ? 演示用的《深入敌后:雷神战争》不是能在外面买到的标准版,而是光线追踪版。去年Intel演示16核Tigerton系统时正是用的这个版本。光线追踪版的《深入敌后:雷神战争》是由Daniel Pohl*5和Intel Santa Clara的团队带来的作品。  “宝贝儿Larrabee” – 正如Intel工程师赋予它的爱称一样,在演示过程中蹒跚学步:Larrabee在分辨率更低的情况下,帧数比16核Tigerton系统还要低。早期的原型芯片会有如此表现算是意料之中。


img005.jpgimg009.jpgimg007.jpgimg006.jpgimg002.jpgimg003.jpgimg004.jpg

2009年秋季IDF上的Larrabee原型。 图片来源:Computerbase/vgamuseum.ru

2009年秋季IDF上的Larrabee原型。相交原先的PCB方案没有多少改变

对于一款要兼容DX11和OpenGL的芯片来说,看到个CPU演示并不值得去欢呼雀跃。演示清楚地显示Larrabee就是由支持AVX的CPU核心组成的 ,能运行CPU代码。这次并不能体现它的性能如何, 反而让人们看到Intel的软件团队能做出让游戏代码既能在CPU上,也能在GPU上运行的编译器。这也证明软件团队有多么的敬业。

然而还有堆积如山的工作需要去做,编译器只适用于新的应用程序。Intel清楚如果没有对DX、OpenGL和OpenCL的支持,就没法把Larrabee拿来卖。写驱动所需的上亿行代码是项艰巨的工程,不过离我们最近的来源称计划正有条不紊地进行 ? 并提醒说宣传造势还为时尚早。与人们的看法相反,IDF 2009演示对于Larrabee硬件团队而言并不是一个重要里程碑。 某些硬件问题他们没法解决,要回炉重造。 就算性能不及32nm六核Westmere,还只能跑1款程序,Larrabee团队也要交出自己的答卷。“Larrabee显卡”的故事等待着软件开发团队继续书写,成【2010】败【跳票2011】在此一举。



本次演示并没有技惊四座 – IDF之前AMD的Evergreen发布会上,业界分析师们对LRB计划就没说什么好话。IDF一周后NV举办的GTC大会上Larrabee更是被形容为“可笑的”“出货时间都没确定的产品”,还有说“他们执行上失败了,现在AMD,尤其是NV要把CPU[的功能]放进GPU…那才是未来”。我们还从一位有名望的分析师那里收到匿名消息:“Intel没能兑现诺言。Larrabee目前处于无法出货的状态。他们用Atom冒险进入低平均售价市场,马上在低端会受到ARM的压力。Intel最大的错误在于跑到ARM的后花园撒泼 ? 他们要与三星、德州仪器、高通还有现在的NVIDIA抗衡”。

但正如我上面写到的,IDF上让人看到的实际是Intel出色的编译器,而不是Larrabee芯片的实力。要是只看芯片的话,这个上十亿美元的计划已经失败了。

尴尬的相似之处:英特尔Larrabee与波音787

虽然不知道美国企业这些几十亿美元的计划都是怎么搞的,不过可以把两个同为几十亿美元、本该给各自的行业带来革命的计划拿来做个比较:波音787和Intel Larrabee。


奇怪的是这俩之间却有不少相似之处:


高管大肆宣传该产品,并声称对手已经“玩完”

分析人士和软文媒体听到消息,开始赞扬公司,称“竞争对手们死翘翘了”

低等级员工开始在论坛上发帖挤兑对手

高管们用空包弹“炮轰”对手 (展示引擎/无法工作的晶圆)

内部路线图调整,产品跳票

高管们转而闭口不提该项目

不同团队的工程师开始公开称事情正走向失控

路线图进一步跳票

高管开始假装该项目不存在

工程师开始跳槽,说项目的坏话

主要高管被炒

开始公开演示*6

计划多次修订,成本大增

最终项目成本以十亿计


截至目前,波音787和英特尔Larrabee  – 这两个由管理层目光短浅、鲁莽决策而诞生的脆弱折翼新生儿的故事尚未画上句号。有人会说这俩都是眼高手低的典型例子,787早在一年半之前就应开始商业运行,媒体也早应收到Larrabee显卡评测了*7。按照之前的消息,现在Intel也该发布32nm CPU + 45nm GPU的融合芯片*8。要知道这是AMD匆忙花59亿收购ATI的原因,全都是为了能在Intel做出融合芯片后一年做出自己的产品。*9

就我个人而言并不同意“眼高手低”,因为这种说法太过笼统。造出有1万个晶体管的芯片并非易事,更别说超过20亿的大芯片。考虑的万能的Intel*10在Larrabee项目中所经历的种种困难, 业界内外的每个人在把“做能显示图形的芯片很容易”这句话说出口之前,真的应该三思。你必须要有关键人物,更重要的还要有共事多年且经验丰富的队伍,即便都凑齐了也无法保证100%成功。2005年ATI的R520 Fudo因为芯片上一个智障的bug*11就延后3个月,R600也跳票9个月。

然而空客A380成功且可靠,NVIDIA自NV30的惨败后也变得更强,ATI从R600中也有所收获 ? Eric Demers*12告诉我们“要是没有R600,我们就没法醒悟过来并改变做事方式”。NVIDIA这边也正是NV30的滑铁卢才催生了GeForce 6800,7800和PS3的GPU,ATI正凭借Evergreen家族吊打NV,波音和Intel也迟早会把产品做出来,其他的都是空谈。

关于ATI当时的情况还可以参考:

【RV770背后的故事 – AMD小核心之路】The RV770 Story: Documenting ATI’s Road to Success

http://moepc.net/?post=241


【RV870背后的故事 – HD 5000如何诞生并一战成名】The RV870 Story: AMD Showing up to the Fight

http://moepc.net/?post=371

Larrabee现状?


可能你正自问“Larrabee死了吗?”,我们的回答很直接 ? 没有。Intel知道自己的未来正面临威胁:如果AMD成功将CPU技术和ATI的GPU技术融合,NVIDIA把ARM核心整合进GPU,Intel必须作出回应。已经砸了太多钱、太多人力资源,不可能让之付诸东流。


相反,Intel把被称为“Champions of Intel”- 精英中的精英们放进了Larrabee团队,他们是诸如Nehalem等项目*13的工程师们。 现在还不确定天才CPU工程师们能在Larrabee计划里做些什么, 但有消息称与Dadi Perlmutter共事很愉快。针对Pat Gelsinger或Sean Maloney则没多少善言善语。因为不止一个人这么说,相信这种态度不会只出现在希尔斯伯勒(加州)、佛森(加州)、布伦瑞克(德国)和印度等地。


img001.jpg


我们手上现有的信息显示,Larrabee目前 ? “还需要13至18个月完成”,直接把发布推迟到2011而不是2010。然而我觉得这不是件坏事。如果工程师们要按自己所想去做,Intel可能会在官方活动中缄口不提Larrabee,直到2011年再向全世界发布这款独显;接下来还有2012年“Haswell CPU + LRB GPU”的组合。要是Intel在2010年发布,Larrabee可能离完成还差得远,也许会有那么几个做测试的能找到程序,然后出人意料地发现结果并不理想。这种情况,类似Intel对3DMarkVantage做的所谓“优化”可是无法避嫌的。

最近大量传闻称Larrabee要被取消了,而原本还要有“第一代”,“第二代”,“第三大”,“第四代”的?考虑到开发过程中LRB设计的改变程度,用原Intel工程师的话说,不同版本的芯片都能单独算一代了。P54C的顺序执行核心还是没变,问题依然存在于同步和喂饱核心,因此说Larrabee还只能算第一代,但不会是最终上市的版本。Intel不会有AMD和NVIDIA的制造问题,自己就有45nm fab,想干啥就干啥。

现在三代四代的传闻已经证伪,当前版本的Larrabee芯片也永远都不会上市。Intel知道这代芯片完全搞砸了,决定废掉一部分的设计,并重新设计SIMD单元。 不再使用现在的16-wide SIMD单元,这种设计不行。新设计的SIMD单元可能会保持16-wide,AVX指令,但更接近GPU而不是CPU。不巧手上没有更多细节,但Intel说这些架构改动是必须的。原版Larrabee设计只能说是花大价钱交了一次学费,要靠“第二代Larrabee”当做第一代上市产品。


Larrabee有两条路可走,没有折中的办法。可能工程师解决了LRB的问题,成为如期的产品;也可能变成一次血的教训,即便收购Imagination也无法补回的教训。要是Intel收购了ATI,AMD就会被边缘化,像NVIDIA一样。


要是Larrabee失败了,也无大碍 ? Core 2架构赚了[并且还在赚]几十上百亿美金,犯一次三四十亿刀的“错误”也能很容易被忘却。Imagination的PowerVR频率要是跑到4GHz性能应该能和ATI/NV的主流竞争了。但我觉得Intel肯定不会允许这种事情发生,可能又会有哪里的VMware队伍又“被命令”去开发狗屎驱动,整的Sandy Bridge CPU的图形性能反而不如NVIDIA的Tegra。




下一站,目的地在何方?

作为一家公司, Intel是无可争议的技术领导者,尽管过去砍掉过许多失败的项目,但未来才更重要。有了Larrabee,很容易就能拓展Larrabee的CPU部分,告诉世界无论是ARM竞争的低端,还是高性能计算领域,X86架构仍将继续留存下去。虽然Intel体量要大许多,ARM也有进入低售价市场的宏伟计划,价格战就要打响。要知道ARM的IP在2008年出货量就有超过40亿,用户基础是ARM占优,而不是Intel或AMD。高端方面NVIDIA是并行计算的领头羊,还有10+PFLOPS的Oak Ridg这种大肥羊政府合同支持。澳大利亚宣布要在2020之前造出1Exa-FLOPS的超算,目前[2009年]正用NVIDIA GeForce和Tesla显卡开发软件,Larrabee也有潜力进入每个市场 ? 从智能手机到超级计算机。

每个项目中都有挑战,Larrabee的绝对不算少。如果Intel之前能坐得住,没有提前发布让工程师受罪的话,LRB或许会被分析师、媒体们所欢迎。但现在它就是波音787化身为芯片。Larrabee架构上正在进行大量改进,只有时间[和金钱]能证明计划的结果。


Marketing和销售人员会给工程队伍更大压力吗?抑或高管肯让工程师们安心“打造Intel所制造过的最复杂的芯片”?现在开始发生的事将会定义Intel这家公司。未来的一年到一年半时间会很让人兴奋。

再一次,我们对Intel管理层想说的很简单:让Larrabee团队专心搞自己的。你们插手次数已经够多了。

3.png

结语

看了上面的故事,站在今天的角度,相信各位都感受良深…

此后的事情大家也都应该很清楚了,2010年5月Intel宣布终止Larrabee计划,不会再开发独显产品上市,至少短期内不会。


img001.jpg

img003.jpg

img002.jpg

2010年5月31日宣布MIC集成众核的原型卡Knights Ferry,它就是来源于Larrabee计划的产物。【工程卡都一个样,还带显示端口】

img004.jpg

Knights系列后被命名为Xeon Phi品牌,不断进化,这一点和文中一样,CPU部分架构更换成越来越强大的先进架构。


QQ截图20171121193423.png



只是隔壁NVIDIA发展太快,赶上了机器学习大发展的时代,再加上exascale级超算的研发,Intel对现有Xeon Phi不够满意,最终在今年停止了Xeon Phi系列的开发,砍掉了下代Knights Hill,要用新架构换掉它。【Xeon Phi主架构师 Avinash Sodani去年九月跑去了Cavium,且传闻去年就砍掉了Knights系列的队伍,终结了Xeon Phi的命运。

直到最近Intel从AMD挖来RTG头号Raja Koduri,准备开发计算/显示用显示架构,推出高端独立显卡,Larrabee的遗愿可能终将实现。


QQ截图20171204192430.png

R.I.P, Intel的X86手机SOC

文中还提到了ARM,正好预言到前几年Intel和ARM在低价位平板、手机的厮杀。现在x86智能手机早早被砍,平板SOC也经历了长时间的更新停滞。ARM也尝试过进入服务器领域,最近高通的Centriq算是其中之一,且还会有下代、下下代。

不多扯,有人催更了

未来几年,也不会缺少令人兴奋的技术出现啊。

CPU方面A/I两家都将推出新一代微架构,工艺也将进一步推进,竞争将更加激烈

GPU则有NVIDIA/AMD,以及刚加入的Intel,可以期待一下三家,尤其是Intel的新产品。

时间会告诉我们一切。


You will never get bored with this industry. ??Marvin



相关文章:

难以忽视的真相:Intel Larrabee的背后故事【Part1】
http://www.moepc.net/?post=2183

没有永远的敌人:Intel和AMD宣布合作打造第八代酷睿处理器,Kaby Lake-H + Polaris 独显

http://www.moepc.net/?post=3501


Intel准备开发高端独立显卡,将Raja Koduri招致麾下

http://www.moepc.net/?post=3537


Intel中止下代Xeon Phi加速处理器 代号Knights Hill的研发,将转向新架构

http://www.moepc.net/?post=3579


Ice Lake架构 Xeon-H – Xeon Phi的继任者?【Rumor】
http://www.moepc.net/?post=3604

本文地址:http://www.moepc.net/?post=2866

原文来源于:brightsideofnews.com/2009/10/12/an-inconvenient-truth-intel-larrabee-story-revealed/

原作者:Theo Valich

MOEPC.NET编译,转载请保留出处。

剧毒术士马文

留学中 Comp.Arch|RISCV|HPC|FPGA 最近沉迷明日方舟日服 联系方式请 discord 或者 weibo 私信。目前不在其他平台活动。 邮箱已更新为[email protected]。 看板娘:ほし先生♥

相关文章

21 评论

  1. linustechtips拿到了knights corner版本的larrabee,这是不是意味着larrabee项目并没有真正停止?

    1. @Allegorie:那个是Knights Ferry。和文章里的Larrabee原型同款。
      LRB项目早就停了。
      LTT拿这玩意纯粹就是为了骗点击。看标题知意图。

      1. @剧毒术士马文:不会这么没节操吧,在视频中他还特意说了,这块不是早期的knf,是knc的版本,虽然没看到他拆开看型号,而且最后也没点亮。。。

  2. 只希望Intel不要强行用通用处理器的技术做显卡。

  3. Raja过去也不看好,阿三尿性就注定不会挑大梁….intel估计又要哭瞎

  4. 文中拿787作为larrabee的比喻,但是现在787的形势远比380要好。

    1. @afxif:那是后话。
      写文章的时候已经是8年前

  5. 说到拉贾,intel到底是否想要来到消费级市场来和Nvidia拼?抱歉在amd拿出真正有竞争力的产品之前还无法迈进拳击台。diy市场现在的两大趋势是缩小化和高端化。十年十五年后很大可能会被云端计算取代。intel眼下无论是knight系列还是在fgpa都建树寥寥,gpu才是ai的未来。很难想象intel会养活一个巨大的团队,推出各种面积、晶体管数目的图形处理芯片,为的是争夺一个正在萎缩的市场

    1. @在amd看大门:开发是肯定的
      团队真不一定会巨大
      Knights系列团队已经被砍,图形也有裁员
      目前Raja去了之后会是怎样还不清楚,他12月才会上任

  6. 我感觉耗电还行啊。。。
    vega 56 降压超频性能碾压1080,配1700x 打游戏 也就400w 不到。

    1. @chnhi:出来的太晚
      默认电压太高
      而且只解决了部分Fiji上的问题,管线利用率依然不高…

  7. 提到Raja,看見外面的小白在高呼Raja要為Vega負責
    Raja也很無辜呀….畢竟是來收屍的
    如果AMD顯卡依舊電老虎,下次就不買了

    1. @VK4502A:从没怀疑过Raja的技术力
      其他“国内媒体”经常黑。

  8. 到底amd vega有沒有用在超算/企業級的部署?
    翻了一下資料,除了Project 47此外什麼資料都沒有….
    ===
    Raja跑到intel最快都要三四年才能搞出一款顯示晶片
    AMD Navi架構效能充滿疑問,畢竟Raja回來之後負責幫GCN收屍和Navi開發,但一直沒有太多關於Navi的消息流出
    老黃又不擠牙膏,RTG這兩年很難過啊

    1. @VK4502A:老黃被台漏電12nm製程實力坑了一把了,Volta遊戲卡就這樣沒了。說到這個所謂的12nm製程實際應該是台漏電第三代16nm,只是這次將當年其自家20nm製程的把戲再用一回。看農企RTG能不能抓住這個機會了。

      1. @以Porsche之名:算不上挨坑,老黄干了半辈子电子产品,不可能被制程文字游戏忽悠。gv100本来就是为summit超算准备的。供给diy市场的显卡芯片规模也可控,最多就是Maxwell一代的水平,而gf7nm也属于高标低能,amd只靠制程工艺不是长远之计

        1. @在amd看大门:再有经验,也会被制程忽悠
          12nm性能倒是可以估计
          当年TSMC 40nm时候老黄可是被坑很惨

    2. @VK4502A:有部署也不会太快,除了新的超算,其他超算和云服务提供的都是上代成熟技术

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部按钮