近日reddit上一篇帖子再次引发了圈内热议,当BN和dropout被谷歌申请了专利时,像Facebook这样的公司如何确保Pytorch不侵权?很人认为对此没有必要担心,这只是谷歌的“防御”专利,但事实就是如此吗?
相关链接:https://www.reddit.com/r/MachineLearning/comments/qg4750/d_how_can_companies_like_facebook_use_pytorch_for/
近年来,人工智能、深度学习方面取得了巨大进展。这些技术可以极大地提升对图像、视频、语音、分子、测量等进行计算处理的准确性和易用性。
特别是开源深度学习系统的出现,如Tensorflow、PyTorch和DeepChem,使新手也能使用GPU硬件建立相当复杂的学习系统。这些工具的出现使谷歌仅用了几个月就将其翻译系统换成了神经机器翻译系统。神经系统的实施极大地提高了翻译的准确性,不仅如此,新的谷歌翻译很可能比原来的翻译更容易构建。
像Tensorflow这样的工具已经使简单的神经机器翻译系统的构建成为计算机科学课的家庭作业练习。
当开源学习工具允许构建以前需要花费数年时间才能构建的系统时,这对专利来讲意味着什么?
随着深度学习技术扩展到软件生态系统的各个部分,这个问题变得越来越重要。一旦算法系统能够以最小的努力学会复制复杂的手动调整的软件包,软件发明的创新性标准将需要进行大幅调整。像“将学习算法X用于应用Y或系统Z”这样的专利不应该被授予,因为这些已经成为了从业者的常识。
受过6个月人工智能培训的学生可以很容易地创建这些专利所涵盖的系统原型,而且往往使用的是谷歌自己创建的工具。
但是,这种专利已经被广泛授予了。
谷歌,尽管它对开源软件持强烈态度,但却申请了大量的类似专利。
早在19年6月25日,谷歌的 Dropout 专利生效,有效期 15 年。Dropout是在进行深度学习、训练神经网络时,普遍会用到的方法,也是调参的一种手段,可以有效防止过拟合。
虽然谷歌目前没有执行这些专利,但如果谷歌面临财务危机,那会发生什么呢?
PyTorch是什么?
PyTorch是由Torch7团队开发的以Python优先的深度学习框架。它的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。不仅能够实现强大的GPU加速,同时还支持动态神经网络。
”真是荒谬“VS”没啥好担心的“
谷歌为BN和Dropout这一普遍且通用的方法申请专利,到底是出于什么样的目的?会存在什么样的风险?像Facebook这样的公司有必要担心Pytorch侵权吗?怎样才能“不造成威胁也不受威胁”呢?
reddit 上针对此事进行了热烈的讨论:
有的人认为这是非常荒谬的,甚至有人认为凡是关于软件专利的一切都是荒谬的。
还有人认为这只是谷歌的针对“专利巨头”而做的,像Facebook这样的公司根本不会担心。
有人认为这种专利名不副实。认为楼主混淆了一些事情:获得专利的不是TensorFlow的具体实现,而是实际算法。所以TensorFlow的许可并不重要,Pytorch有自己的实现办法,不存在侵权问题。其次,专利并没有被执行。虽然谷歌拥有专利,但似乎更多的是为了确保其他人不会申请专利并试图限制其使用。另外,如果谷歌试图执行这些专利,在法庭上是否能站得住脚还是一个问题。
还有人表达了自己的期望:如果有某种像专利一样的法律,但能保证"我不能实施这项专利,但它仍然算作先前的工作,所以专利巨头再次申请专利",那就更好了。这样一来,公司可以申请专利,以保护自己不受专利巨头的侵害,也不用担心会因此起诉他人。
并且还表示 "他们不能在没有公关风暴的情况下实施专利 "是可以的,但如果能保证他们永远不会这样做就更好了。
Apache license中专利许可内容是这样的:
Subject to the terms and conditions of this License, each Contributor hereby grants to You a perpetual, worldwide, non-exclusive, no-charge, royalty-free, irrevocable (except as stated in this section) patent license to make, have made, use, offer to sell, sell, import, and otherwise transfer the Work, where such license applies only to those patent claims licensable by such Contributor that are necessarily infringed by their Contribution(s) alone or by combination of their Contribution(s) with the Work to which such Contribution(s) was submitted. If You institute patent litigation against any entity (including a cross-claim or counterclaim in a lawsuit) alleging that the Work or a Contribution incorporated within the Work constitutes direct or contributory patent infringement, then any patent licenses granted to You under this License for that Work shall terminate as of the date such litigation is filed.
(根据本许可证的条例和条件, 每位贡献者特此授予您永久、全球、非排他性、免收费、免版税、不可撤销(本节中注解除外)专利许可,以制作、使用、出售、销售、进口和以其他方式转让作品,其中此类许可仅适用于此类贡献者许可的专利主张,这些专利主张必然受到其贡献单独或其贡献组合的侵犯提交此类贡献的工作。如果您对任何实体提起专利诉讼(包括诉讼中的交叉索赔或反诉),声称作品或作品中包含的贡献构成直接或贡献专利侵权,则根据本作品许可证授予您的任何专利许可应自提交该作品之日起终止。)
相关链接:https://www.apache.org/licenses/LICENSE-2.0.html
因此有人提出:如果你要使用TensorFlow中的dropout,那么谷歌可以授予你任何必要的专利许可。换句话说,Apache license不仅授予了版权所控制的权利,还授予了额外的权利,包括专利权。你根本不可能编写出不侵犯大量专利的软件,所以你必须赌一下,不管是侵犯了什么专利,要么无法执行,要么专利持有人会拒绝执行。谷歌在这方面有非常好的记录,所以这些特定的专利可能是最不需要担心的。
欧莱雅首席数据科学家 Louis Hénault 曾在推特上写道:认真的@GoogleAI?。
一位律师也曾讲:即使专利被授予,只要谷歌不起诉你,你仍然可以使用它。谷歌可能会等到你的公司长大后再回来起诉你,这可能会让你或你的机构承担责任和后果。
谷歌负责人Jeff Dean曾表示过开发者并不需要为此担心,Google并不打算靠专利牟利,但考虑到当前的市场环境,Google选择了先申请专利,防止可能的碰瓷或不必要的麻烦。
这种类似于“加减法”的专利虽还未产生实质性的影响,但是否应该被授予?其他公司又该如何确保自己不会面临诉讼纠纷?对此,大家怎么看呢?
https://rbharath.github.io/software-patents-are-obsolete-in-the-age-of-ai/
雷锋网雷锋网