雷锋网(公众号:雷锋网)AI研习社【本期论文】
Optimizing the Latent Space of Generative Networks
生成网络潜优化
近期,生成对抗网络(GAN)在机器学习研究方面取得了新的进展。我们可以直接合成动物新的图像,从图像中创建3D图形,或者根据我们对图像的编辑来创建新的产物。
生成对抗网络意味着有两个神经网络在相互竞争相互比赛。生成网络尝试生成越来越多逼真的图像,并将这些图像传递给判别网络,而判别网络尝试判断真实的图像与伪造的图像之间的区别。
在这个过程中 两个神经网络一起进行学习和提高,知道它们能力越来越强(达到稳态)。
但是,互相训练这些网络并非一帆风顺——我们不知道过程是否收敛,或者是否达到非合作博弈均衡。非合作博弈均衡是指,两个行为者相信他们已经找到了一个最佳的策略,同时也考虑到了其他行为人可能的决定,但他们也不会对改变他们自己的策略有兴趣。
正如游戏中经典场景:两名被定罪的嫌疑人正在考虑他们是否应该相互勾结,但其中一方不知道对方决定采取的是什么样的行动。
人工智能和游戏理论有相似之处,但是更厉害的地方在于:在这里,我们尝试建立一个不需要处理这种情况的系统,这种方式简称为生成潜优化,简称GLO。
以下将介绍只通过使用生成网络来欺骗判别网络。如果你修读过字体设计专业,你久知道这是一个非常复杂的领域。但是,如果我们想创建一个新的字体类型,我们通常只关心是几个特性,比如他们要如何弯曲,再或者就像我们处理一种简单描述衬线字体那样,同样的原则也可以应用于人脸、动物以及你能想象的到的大多数课题。这意味着有许多复杂的,包含大量信息的概念。
这些概念其中大部分信息可以只通过少量功能的简单描述来捕获,这是通过将该高维数据投影到低维隐藏空间来完成的。
这个潜在空间有助于消除对抗性优化,使得该系统更加容易训练。主要的优点是它仍然保留了生成对抗网络具有吸引力的属性,这意味着它可以从学习的数据集合中合成新的样本。
如果学到鸟的概念,就能合成新的鸟类,它可以在数据点之间执行连续插值。这意味着我们可以在两种选择之间产生中间状态,它也能够在任意数量的数据点之间执行简单的算术运算。
例如,如果A是戴有太阳镜的男性,B是没有太阳眼镜的男性,C是女性。那么A-B+C将产生戴有太阳镜的女性。它也可以用于超分辨率,当然还有其他很多方面。
▷ 观看论文解读大概需要 4 分钟
阅读论文:https://arxiv.org/abs/1707.05776
经验丰富的同学知道,对于生成对抗网络,有很多关于如何通过更多细节合成高分辨率图像的研究。这意味着,这又是一项令人兴奋,使人视野更加开阔的工作。但这并不能与GAN后续工作进行比较,毕竟GAN还建立在更为成熟的研究的基础之上。
雷锋网AI研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。欢迎关注雷锋网雷锋字幕组专栏,获得更多AI知识~感谢志愿者对本期内容作出贡献。