雷锋网按:随便冤枉人,还讲不讲理了!
这几天,围绕着英伟达的一份使用禁令,国内的人工智能和科技圈展开了极其热烈的“讨论”,但随着昨天英伟达公布官方意见,这件事终于水落石出。
结论只有一个——英伟达这次真的被“冤枉”了。
首先我们先来重新“复盘”一下新规,以及此次整个事件的爆发。
此次的新规定实际上来自于英伟达英文官网的GeForce驱动下载页面,用户在下载驱动之前必须勾选相应的许可协议(与安装软件之前必须勾选的那种相似)。这也意味着——所有使用GeForce驱动软件的用户,默认实际上是都同意了本许可协议。
争议性的内容出现在“授权许可”部分中的“限制”项中,具体说法为“数据中心并不被许可使用该软件,除非数据中心在进行区块链运算。”
这一内容最早被德国科技杂志golem.de发现并实时报道,随即被用户“booooomba”发上Reddit论坛,但在新闻的描述中却悄然发生了改变——“The new NVIDIA EULA prohibits Deep Learning applications to be run on GeForce GPUs.(新的NVIDIA EULA禁止在 GeForce GPU上运行深度学习应用程序。)”
究竟为什么“booooomba”会选择这个角度来诠释新规,我们不得而知,但这份新规的确带来了以下几个疑问:
这项规定中所指的“数据中心”究竟是指什么?
为什么区块链运算会被排除在外?
“限制”条款中其他三项都是常见的产品权利,为什么会在第四条出现一条如此具体的规定?
接下来,雷锋网就这三个主要疑问做进一步的解析。
昨天,NVIDIA官方给雷锋网的回复中,可以明确得知一点——此次新规定针对的对象并不是普通的GeForce显卡用户,而是大型数据中心。而在拥有这些大型数据中心的,往往是各大云服务商。
将GTX1080Ti放进服务器
NVIDIA官方声明中是这样说的:“不鼓励用户在严苛的大规模企业环境中不恰当的使用我们的GeForce和TITAN产品”。同时NVIDIA还强调:“研究人员通常会将GeForce和TITAN产品用于非商业用途或其他不以数据中心规模运作的研究用途。NVIDIA无意禁止这些用途。”
通过这两条阐述,我们不难看出其中的两个、需要同时满足的关键界定标准:是否商业用途、数据中心规模。将这两个条件结合起来,我们能得到的就是目前正在向用户提供“GPU云计算”服务的大中型云服务商们。
在很多之前的报道中,很多媒体都或多或少加入了一种“描述”:“NVIDIA这次限制了数据中心,却放过了比特币挖矿!”,有的友媒甚至在标题上大大的写着“英伟达新禁令:不能随便用GeForce显卡跑深度学习(挖矿可以)”,但事实真的是如此么?
首先需要澄清的第一点是,NVIDIA从来就不支持GeForce系列产品用来挖矿。今年年中,NVIDIA就曾在某显卡品牌活动上直接表示:“NVIDIA不鼓励GeForce游戏显卡挖矿,不鼓励用户这么做,要挖矿请使用专门的挖矿显卡型号”。
虽然截至目前这句话仍未写在任何规定当中,但NVIDIA在今年年中拿出的专用挖矿GPU就是最好的证明。今年NVIDIA推出的挖矿专用显卡代号“P106-100”,在消费级市场的GeForce GTX1060显卡“修改”而来,但不仅没有硬件图像输出接口,就连Dirext功能(微软的显示API软件,目前Windows上的各类游戏都需要此软件才能运作)也在物理层面上被阉割掉。
如此大费周章的目的只有一个——尽可能保护消费级市场。
在比特币曾经辉煌的2013-2014年,AMD的HD7000系列也曾发生过长时间的断货现象。但随着2014、2015年比特币大幅降温,越来越多曾经用于挖矿的AMD显卡“重返”消费级市场,这一批经过挖矿“虐待”的产品极大地冲击了AMD的消费级产品市场,所带来的售后问题更是让AMD叫苦不迭。
对于显卡挖矿潮这件事,NVIDIA实际上一直有着警戒之心,今年早些时候由ICO带动的“挖矿潮”兴起时,国内很多NVIDIA显卡OEM厂商在产品包装外部专门贴上表示:“如果本产品被用于挖矿,我们将保留拒绝保修和维护的权利。”
从AMD的前车之鉴、到OEM厂商生命、再到专门矿卡P106-100的推出,NVIDIA躲挖矿还躲不及呢,怎么可能对它表示支持的态度呢?
P106矿卡的驱动实际上由GeForce驱动修改而来
问题来了,为什么这次的规定中还会对区块链运算放一马呢?在一位显卡行业专业人士最终告诉了雷锋网其中的奥秘果——不是NVIDIA支持区块链,而是GeForce驱动实际上“间接”也用在挖矿专用显卡上。
至于为什么不专门弄一个系列的驱动嘛,NVIDIA没那个功夫,也不想花那个功夫。
虽然说驱动的用户协议通常大家都会点同意,但NVIDIA将其与众多的产品最基础规定放在一起,可见这项规定的重要性。为什么NVIDIA要如此“突出”这项规定?直接原因除了NVIDIA官方在声明中提到的产品适用性担忧之外,更重要的是NVIDIA对于明晰消费市场、企业市场区分的渴望。
必须提前着重说明的是,这跟钱有关,但并不是简单的钱的问题。
因为在整个半导体产品市场,这种情况也是普遍存在的,从NVIDIA的竞争对手AMD,到CPU老大英特尔,实际上都有着自己的市场区隔。当然根源还是消费级市场和企业级市场的差异。
消费级市场用户的用途往往比较简单,同时对于产品的需求也比较集中。例如GPU,你只要图形性能好和运行稳定就可以了。但对于企业来说,只提供硬件是远远不够的,你还需要给他们开发各种软硬件接口,你需要对各种应用场景进行适配,你需要提供各种企业级服务,甚至是工程师到现场进行技术协助。这些羊毛自然应该出在羊身上,也就造成了价格差距。
NVIDIA针对不同GPU加速应用推出的解决方案
如何分别对消费级市场、企业级市场这“两群羊”分别进行合理的收费,最终成为了半导体行业企业都必须面对的一个问题。而对能够产生商业收益、同时又需要更多产品服务的云服务商收更多钱,这本身就是“合乎常理”的。
从另外一个角度来说,“消费级产品比企业级更便宜”甚至可以理解为“NVIDIA合理地收取企业级市场费用,进而降低消费级市场的成本”。这不仅是公司整体策略的取舍,更是市场竞争法则最终选择出来的结果。
正如上面所说,消费级市场和企业级市场“天差地别”,其中一个最好的说明就是两者的使用环境差距:消费级市场GPU通常安装在机箱内,需要自己完成整个散热过程,同时使用时长较短、使用频次较低。企业级市场,GPU通常都被“塞”进服务器机架中,通常只装备散热器而依靠外部力量(风、液体)来完成散热过程,使用时长非常长、使用频次非常高、稳定性要求永远优先。
这也让两个市场的产品在各方面差异性巨大,例如外形。以同样使用GP102核心(具体型号不同)及关键处理器参数十分接近的的GeForce GTX1080Ti和Tesla P40为例。前者和后者的外形是完全不一样的:
GTX 1080Ti,图片来自:太平洋网络
GTX1080Ti自带涡轮风扇,同时显卡散热器尾部并不可以流通空气,这种散热方式在消费级PC市场的使用环境中非常高效。而Tesla P40则采用了无风扇、头尾贯通的设计。可以数张紧密地排在服务器中,同时不影响散热效果。
除了外观上的不同外,NVIDIA实际还会花一些潜在的功夫。虽然GPU生产过程中用着相同的材料和工艺,但最终的成品往往还有一些细微差距。例如有些GPU能够在较低的电压下工作、有的GPU拥有更高的超频性能等等,这些细微的差距再加上NVIDIA在产品参数上的区别调校,最终形成了服务器产品的冗余性。
在结合众多因素考虑之后,相信你或许已经有了自己的判断,至少在雷锋网看来:这次新规只是NVIDIA对于自身产品业务的一次明晰,而“不幸”中招的企业,都是之前“不按云服务行业规矩”的公司。
雷锋网就此还专门采访了国内的云服务巨头阿里云和腾讯云,其中阿里云表示不予置评。但根据雷锋网查询,阿里云实际上一直与NVIDIA保持着密切的合作,NVIDIA最新的Tesla V100系列GPU也已经到了阿里云手中,正在部署之中。
腾讯云给出的回应则更加直接:“用GeForce GPU打造企业级IaaS(基础设施即服务)服务,然后来售卖这种做法,我们并不推荐。从企业级用户的需求来看,他们更看重稳定性。Telsa系列稳定性,能效比的确有优势。”
在询问道NVIDIA与其合作的价值时,腾讯云工程师表示:“NVIDIA对我们硬件上的支持是非常迅速的。腾讯云在此基础上,通过深度开发,推出了多款产品满足用户的需求。”
有趣的是,亚马逊AWS今年10月就已经引入了NVIDIA的8路Tesla V100 GPU加速器,并且作为全新的云服务提供给终端用户。
这样看来,虽然用GeForce在账面上更划算,但这样去打造企业级服务的云服务商,其实只是行业“异类”。
作为并行计算、乃至人工智能时代的主要“动力源”,NVIDIA的数款GPU利用自身不断提升的性能在带动着整个行业前进。而且NVIDIA做的并不仅仅是打造产品这一项,开发软硬件接口、提供应用解决方案、孵化创业公司、举办技术峰会等等。
与其黑NVIDIA“垄断”,倒不如说NVIDIA自身技术不断的“跃进”,造就了其产品和服务中的巨大优势。但因为一个企业在技术和市场方面发展快而去限制它,防止它“垄断”,是否又违背了技术发展和市场发展的本意,或者说那才是真正的“滥用”权利呢?
吃水,除了自己喝,还请喂一口打井人。