资讯 人工智能开发者
此为临时链接,仅用于文章预览,将在时失效

谷歌开源 TFGAN,让训练和评估 GAN 变得更加简单

GAN
作者:汪思颖
2017/12/14 12:29

雷锋网 AI 科技评论按,三年前,蒙特利尔大学 Ian Goodfellow 等学者提出「生成式对抗网络」(Generative Adversarial Networks,GANs)的概念,并逐渐引起 AI 业内人士的注意。自 2016 年以来,学界、业界对 GAN 的兴趣出现「井喷」。近日,谷歌开源 TFGAN 轻量级的工具库,据悉,其设计初衷是让训练和评估 GAN 变得更加简单。

雷锋网 AI 科技评论将原文编译整理如下:

训练神经网络的时候,通常需要定义一个损失函数来告诉网络它离目标还有多远。例如,图像分类网络中通常会有一个损失函数,一旦给出错误的分类就会进行惩罚。如果一个网络把狗的照片错当成猫了,那将会出现很高的损失值。

然而,有些问题并不能轻松用损失函数来定义,特别是当它们涉及到人的感知时,比如图像压缩或文本转语音系统。

生成式对抗网络 (GAN) 这种机器学习技术已经在广泛的应用领域引导我们取得了进步,包括基于文本生成图像、超分辨率,以及机器人抓取的解决方案。然而,GAN 在理论和软件工程上都引入了新的挑战,想要跟上它这种快速的研究步伐也很难。

为了让基于 GAN 的实验更加容易,谷歌选择开源 TFGAN,这是一个轻量级的库,设计初衷是让训练和评估 GAN 变得简单。

它提供训练 GAN 的基础设施,也提供经过良好测试的损失和评估指标,并包括易于使用的示例,可以看到这个库极具表达性和灵活性。与此同时,谷歌还发布了一个教程,其中包括能快速基于自己的数据进行模型训练的高级 API。

谷歌开源 TFGAN,让训练和评估 GAN 变得更加简单

上图展示了对抗损失对图像压缩的影响。最上面那行是来自 ImageNet 数据集的图像 patch。中间展示了用传统损失训练的图像压缩神经网络对图像进行压缩和解压缩的结果。底部是用传统损失和对抗性损失训练的网络对图像进行压缩和解压缩的结果。

虽然基于 GAN 损失训练的图像比起原图来,信息还是有所丢失,但比起其他的方法,图片更加清晰,包含更多细节。

TFGAN 可以从以下几个方面来支持实验。

谷歌开源 TFGAN,让训练和评估 GAN 变得更加简单

如上图,大多数文本转语音 (TTS) 神经系统产生的频谱图都过于平滑。当应用到 Tacotron TTS 系统时,GAN 可以重新创建一些更真实的纹理,这将减少输出音频中的人工痕迹。

TFGAN 的开源意味着你将与许多 Google 的研究人员使用的相同的工具,任何人都可以受益于谷歌在库中最先进的改进。

via:Google Open Source Blog

雷锋网 AI科技评论编译整理。

长按图片保存图片,分享给好友或朋友圈

谷歌开源 TFGAN,让训练和评估 GAN 变得更加简单

扫码查看文章

正在生成分享图...

取消
相关文章