NVIDIA发布Titan V显卡:GV100核心,3000美刀售价,今日开售
本文地址:http://www.moepc.net/?post=3820
随着CEO黄仁勋在台上亮出Titan V,NVIDIA于2017 NIPS大会上出人意料地发布了这款显卡。而这距离NVIDIA宣布首款Volta架构产品Tesla V100仅仅只过了七个月。
Titan V搭载GV100 GPU,表明这款产品更偏向于计算市场。发源于2013年的Titan系列显卡,起初就是Prosumer的定位,专为FP64双精度计算,后来NVIDIA的GPU设计开始向显示和计算两方面分化;前代Titan Xp,虽然采用的是侧重于显示性能的GP102核心,定位之一还是入门级计算卡。【不过还是有点偏离初衷,后来的Titan X和Titan Xp上FP64接近于无】
历代Titan显卡规格对比
到了Titan V则换用侧重计算的GX100 GPU,这次是GV100。GV100核心带来的特殊计算功能和价位决定了Titan V会更接近于计算卡,而不是原来的消费级旗舰。当然你可以拿它跑游戏之类的,它依然是一张显卡,显示输出什么的都很全,不过这次NVIDIA史无前例地把它宣传成工作站级别的AI计算卡,利用GV100核心的Tensor Core,可以达到远超前代的深度学习性能。Titan V上,1/2的FP64比率也回归了。这些改变意味着Titan产品线终于回到了初衷 – Prosumer专业消费级【半专业】高端计算显卡的定位。
本文地址:http://www.moepc.net/?post=3820
Titan V和PCIe版Tesla V100在特性和功能上相当接近。NVIDIA确认Titan V在双精度和深度学习上不受限制,能用到GV100完整的FP64和Tensor Core性能。根据目前NVIDIA透露的信息,Titan V的核心功能没有受到阉割。Titan V和Tesla在性能上的区别很明显:显存容量、显存带宽,以及NVLink。Titan V为主动风冷散热,Tesla V100为被动散热。【显存方面见上表。Titan V只有3颗HBM2,也就是6个显存控制器,L2 4.5MB,相应的ROP要比V100少1/4】除此之外都很接近,不知道NVIDIA为何会这样决定,不会影响Tesla销量吗
频率方面,HBM2稍稍降频至1.7Gbps,GPU加速频率为1455MHz,和300W SXM2版的V100差不多。Tensor Core也没有阉割,官方给的110 DL TFLOPS依然低于1370MHz的PCIe版V100,显然NVIDIA在计算时用的是更低的频率。
显卡设计方面,采用真空腔均热板+铜制散热片,16相供电,单芯Titan一贯的250W TDP。输出方面有3个DP,1个HDMI。PCB上有NVLink,却被故意用外壳遮挡,估计被屏蔽了【NVIDIA官方说Titan V不支持SLI和NVLink,而且用的是GeForce驱动…】
游戏性能方面则没有任何信息,NVIDIA确认Titan V用的是标准GeForce驱动。昨天NVIDIA发布的388.59就支持了Titan V,新驱动对Volta架构到底有多少优化就不清楚了。虽然游戏性能不是主要卖点,但应该不会太差:显示所需的各类单元数量都高于Titan Xp,领先不多。可以说Titan V是一张全能卡。
本文地址:http://www.moepc.net/?post=3820
这次Titan V把价位提高到了新高度:2999美刀。目前为止NVIDIA手里的Tesla V100是生产多少就能卖出去多少,Titan V也会差不多。尽管3000刀的价格即便是Titan也算高了,拿来和将近10000刀的V100比就显得很便宜。NVIDIA把GV100卖这么便宜,说实在的有点意外;这些GV100是没法做出Tesla的瑕疵品,原本会直接扔掉,现在却拿来卖这么便宜也不怕影响Tesla销量,显示出NVIDIA对于Tesla有多么自信。
【2999刀对于深度学习用户来说,升级代价不算高。】
在想尝试Volta架构,却又不想购买完整Tesla的NVIDIA专业用户之间,Titan V将会很受欢迎。近两年间NVIDIA的AI业务马力全开,通过把GV100带到3000刀价位,NVIDIA会进一步占领市场。个人觉得可以说Titan V一出,Titan的“专业消费级”定位也算是没了,转而朝向发展迅猛的专业计算领域,如今的Titan正是许多开发者所想要的产品。
附上Reddit用户的跑分:
本文地址:http://www.moepc.net/?post=3820
via:https://www.anandtech.com/show/12135/nvidia-announces-nvidia-titan-v-video-card-gv100-for-3000-dollars
http://www.guru3d.com/news-story/nvidia-titan-v-graphics-card-benchmarks.html
MOEPC.NET编译,有改动及节选,转载请保留出处。
gamenexus游戏评测已出,另外看拆解nvlink的金手指还在,然后看起来也是4块hbm2的样子?老黄这么有钱?
@Fly.Wood-:4块HBM不可能是3072-bit,应该是Tesla瑕疵品直接屏蔽了一块
3块HBM2才是这个规格,12GB
显存控制器都关了一对,L2/ROP也阉割了
此外GN的很多评测不大公正
@剧毒术士马文:拆解链接https://www.gamersnexus.net/news-pc/3169-nvidia-titan-v-tear-down-pcb-bare-gpu
@Fly.Wood-:我看过了的
这就是Tesla打下来的核心
我也是比较在意下一代游戏卡性能 多出40%的CUDA 频率低了10% 按照总体提升50%的话 这样看架构提升大概也就是20%?
@Concord_e:从Kepler到现在Volta,架构提升就是单精度提升,不信你算一下,1T单精度=fse 1000分,从来没有大变化
@theLastWish
amd毕竟研发费用总共才50亿美元
好像还不如老黄和intel的公关费用高……
而且amd计划图里navi是7nm
写的2018年
苏妈能保证正常按照计划图做好就不错了
ttv这次又把散户收割了一波
苏妈更难做了
@wangbaisen1990:(有钱可以为所欲为,能让TSMC定制制程)
@剧毒术士马文:是啊
有钱可以为所欲为
哦对了马文你觉得amd现在这种讨好oem的战略
会让amd重回服务器cpu和计算卡行业
甚至取得一定的市场份额和各种软件优化么?
@wangbaisen1990:可能会取得一定成效
但在其他两家已经建好的完整生态系统面前AMD还有很长的路要走
要提升产品的竞争力….尤其是GPU
@剧毒术士马文:生态链那玩意,只能说,amd穷……
尤其是老黄比intel更会砸钱做生态链……
titan v只要和自己比就行了,gv100卖10000美元杀猪价还有大企业一次买几百上千块,dgx1有的公司一次就批量20台。现在这个3000美元明显就是收割散户,很多搞ai的都说这玩意价格不算贵。Vega20很大程度上就是单双精度2:1的Vega10,ai届只是打边炉角色。倒是可以推测下一代n卡的游戏性能,最多没阶级提升50%,pascal1070打980ti不可能出现了
@在amd看大门:虽然用户群不大,但是能吸引几乎所有的潜在客户,又定了个对这些客户来说能接受的价格……Perfect AI n deep learning solution,谁不爱呢
用这个打游戏总感觉有点大材小用不是么
@hangoverfriday508:amd还是穷,intelphi卡不咋地时候intel靠砸公关都能砸出来一大堆phi用户呢……
另外我记得15年前后amd关于显卡的策略也出过重大失误?当时有高层觉得不需要做高端显卡?
@wangbaisen1990:amd眼下只能把宝压在ryzen上,2020年前都能保证跟住intel脚步。phi卡就是靠搭售,当时好像是一块e7搭一块phi卡,就这样也没起色,前段时间直接收了raja从头再来。amd出Fiji之前最大的错误是低估了数据中心计算卡的市场,导致Fiji一代连WX都没出,直到今年Vega才搭上边
@在amd看大门:fiji核心产量太低
想出也没办法出,所以那不算是失误
另外那个不仅仅是搭配销售
还有低价折扣和免费咨询,要不然真是一点卖不动,因为其实搭配e7销售e7那边没什么折扣的……
现在amd主要目标估计还是拿回oem市场
毕竟这块市场利润很大
而且很多数据中心也是用的oem出货,ai计算这边也有很多oem商在做
不过总的来说看苏妈2018年怎么应对吧
@在amd看大门:按照fs和fse提升还不到25%,不同跑分比例差距这么悬殊,也许意味着架构大改了
@LV3的萝莉控:Superposition是最好情况,能够完全利用到Shader资源
Titan V的显示单元没比Titan Xp多太多
暗金Titan,尊贵的FP64享受
cuDNN一类的地位还是高啊……ROCm的配套不知要过几代才能赶上(据说某乎有人认为可以众核arm_x64做运算卡,jbdxbl),现在想搞机器学习还是NVIDIA POWER成熟,github上很多开源的机器学习项目都是用cuda或者依赖于FP64效率最高。
这卡还算是完善了4K体验,4K 60+FPS不是梦。
就看有没有人用G4560配这个了……
@hangoverfriday508:如果驱动还是依赖cpu的话
用g4560不会卡的要死么……
@wangbaisen1990:神经网络负载好像不大依赖CPU,但是如果新驱动还是吃U的话……可能跑个多卡GPU负载也要用上threadripper。
有钱组多卡titan v方案的人肯定不会在意平台价格了。
顺便问一下,tb上的titan v bridge是NVlink for Tesla v100还是一般的sli bridge……
@hangoverfriday508:看马文写的,好像ttv没有nvlink来着……
@hangoverfriday508:TTV既不支持nvlink也不支持sli,那个桥根本不是给TTV的
@LV3的萝莉控:官网写的是给Quadro/Tesla
NV说Titan V不滋磁NVLink
@hangoverfriday508:tensorflow不用gpu也可以跑的,只是cpu跑太慢了
游戏性能还可以啊
而且售价便宜
感觉是针对mi25的
amd又要凉一阵子了
@wangbaisen1990:等等
感觉更多是为了推广特斯拉单元
可以说radeon instinct MI25和vega FE凉了么?
本来Rocm社区就比较冷 跟cuda是9和接近于0的区别
真是按下葫芦浮起瓢
@niceming:是啊
不知道amd有什么应对
毕竟amd这代才算是真正进入市场
@wangbaisen1990:都说vegaFE的竞品是titan 现在一块vegaFE风冷是一万块 换我 我肯定去买Titan V 毕竟 rocm虽然开源 但是社群很死寂 没有太多第三方移植的东西
titan V双精度又是完整的
@NiceMing:是啊
vega fe的fp64还不是1/2
比不上这个
只是比上代泰坦xp好而已
所以说不知道amd会怎么做应对
毕竟现在amd还是处于亏损状态 ,甚至oem市场份额低的要死,想好好搞发布也不是很容易
老黄现在依然利用推广和oem优势占据高市场份额和高昂利润
就看苏妈怎么应对了(我估计也没什么好用对办法 vega20肯定很贵,而且不见得比这个好,navi据说要2018年h2才能出现)
@wangbaisen1990:AMD已经止亏开始盈利了,虽然利润还很低
v20 双精会是1/2 也算是有高双精的产品了
navi要是18年h2出来黄花菜都凉了
图形上必须呀有所突破才行
@wangbaisen1990:主要还是软件支持上不去,对于个人和小企业来说开发很艰难,而老黄那不管是官方还是第三方还是教材和教育机构方面支持力度都是非常大的。这点amd短时间内是不可能追上来的。不过amd现在策略就是打包销售。压价抱大腿,多找大客户或者oem,比如微软这种。毕竟便宜就是便宜,性能不足也能靠批量部署解决,但是这种方案也就是大客户支付的起。
@NiceMing:感觉amd最大问题还是穷
有钱学老黄往死里砸推广也出来了
@NiceMing:之前到过699
5000RMB
@niceming:目前局势不是非常乐观
@剧毒术士马文:去年年底就宣布的产品 最近才宣布出货 意味着没几个厂商看好 年初的时候 super micro还有测试mi25的视频 到现在也没有信
一共也就两家厂商宣布了Radeon Instinct MI25 产品
Rocm使用者屈指可数 前段时间rocm的leader接受过访问 我整个报道全看下来基本就是以前采用firepro 的石油企业 制造业企业采用了 还有就是百度还在评估和优化
@剧毒术士马文:本来还想试试移植到rocm的tensorflow,结果看了看还没做完……
ttv实质上应该还是消费级,只不过是“生产力”消费级。对应的应该是大学之类教育机构,和个人或者小型企业开发者。基本上就是给买不起Tesla的开发者。毕竟现在新兴的人工智能开发市场很多都是小企业,需求不是很大钱袋子也不是很多。即使是大企业给员工工作机也可以直接选ttv这种便宜的做实验工作站。算是应对intel和amd那边的解决方案。
@appleache:只是Titan在Prosumer的同时还是消费级旗舰
这次的Titan V向专业方向迈了一大步