雷锋网 AI 科技评论按:Google AI 近日终于发布了 AutoML 的测试版,有人说这项服务将彻底改变我们进行深度学习的方式。
Google 的 AutoML 是一套新的云端机器学习软件工具套件。它基于谷歌在图像识别领域最新的研究成果,即神经结构搜索(NAS)。NAS 其实就是一种算法,它会根据你所给定的数据集,自动搜索在上面执行某个任务时可以达到最佳表现的神经网络。AutoML 也是一套机器学习工具,它使人们可以轻松地训练高性能深度神经网络,而无需用户(自身)掌握深度学习或 AI 知识,你只用标记数据就行啦!Google 将使用 NAS 为你指定的数据集和任务量身定做最好的网络。Google 已经展示过这套算法,并成功获得了远超人工设计网络的性能。
AutoML 完全改变了整个机器学习领域的玩法,因为对于许多应用而言,以后再也不需要掌握专业技能和知识。许多公司只需要运用深度网络就能完成比较简单的任务,如图像分类。那时,他们就不再需要雇用 5 名机器学习博士;他们只需要一个会移动和会组织数据的人即可。
那么 AutoML 真的就像一柄尚方宝剑那样,能让任何公司或个人都能轻松做 AI 吗?!
.…… 还没那么快……
使用 Google 的 AutoML 进行计算机视觉,它的价格是每小时 20 美元。简直贵疯了!在你付费并试用它之前,你甚至都不能确定它真的会比自己手工设计的网络更精确。值得一提的是,从以前开始,无论在 Google 还是 AI 社区,人们总是倾向于开源,以便能够与所有人分享知识。
而这正是 Google 的 AutoML 将会吃亏的领域:开源。
看看 AutoKeras 吧,这是一个编写在十分易于使用的深度学习库 Keras 中的一个开源的 python 包。AutoKeras 使用了 ENAS,这是一种高效且最新版本的神经结构搜索方法。你只要使用 pip install autokeras 就能快速轻松地安装软件包,接着就能用自己的数据集来执行自己的架构搜索啦!而且还是免费的哟!
由于所有代码都是开源的,所以如果你想做一些定制化的事情呢,甚至可以去调整部分参数。因为仍然是用 Keras 编写的,使得代码易于理解和钻研,这让开发人员可以迅速创建准确的模型,也利于研究员更深刻的理解架构搜索的方法。
AutoKeras 拥有一个伟大的开源项目所应具备的一切要素:快速安装、易于运行、大量示例、便于修改,甚至还能看到 NAS 最终发现的网络模型的具体结构!如果你更中意 TensorFlow 或 Pytorch,那么这里和这里也有它们对应的代码实现!
我一定会推荐你们使用 AutoKeras 或其他任何实现,因为它们比 AutoML 便宜太多了。也许谷歌正在开源的部分之外为 AutoML 做更多的幕后工作,但考虑到 NAS 模型和手工设计的模型之间的性能差别非常小,我真的怀疑大家会为了只高出一点的性能来支付如此昂贵的费用。
深度学习和人工智能是十分强大的技术,我们不应该用如此高额的费用来阻碍它的现世。虽说谷歌、亚马逊、苹果、Facebook 和微软确实都需要用盈利来生存和竞争,但在当前研究论文公开的前提下,我们明明有深度学习库可以用来快速复制方法,却要尝试阻止开源,这实在不是明智之举。
这里还有一个潜在的更大的问题:知识本身正在被隐藏。最近人工智能发展趋势的一大亮点是,许多研究社区决定在 Arxiv 等网站上公开发布他们的研究成果,与社区分享并获得反馈。更重要的是,越来越多的人将研究代码发布到 Github 上,可以复制和继续改进,并在研究和真实世界问题中得到更进一步的引用。然而在这里,我们仍然看到这样的研究被放在付费墙后面。
共享科学知识有助于进步并增加每个人的普遍知识。有一点是可以肯定的:知识应该是开源的,这能惠及每个人。
via techcrunc,雷锋网 AI 科技评论编译雷锋网