雷锋网 AI 科技评论编者按:今年,ECCV 2018 的参会人员达到了史无前例的数量,计算机视觉领域的最新进展,也一如既往地在此一一亮相。如我们所料,本次会议的所有议程都聚焦于卷积神经网络(CNNs)的深度学习。
没有参会的小伙伴们,不妨通过这篇亮点集锦,来了解一下在 ECCV 2018 上亮相的一些颇吸引眼球的主题:
Self-localization on-the-fly(《行驶途中的自我定位》)
ECCV 2018 的重点主题之一就是自动驾驶。你能与竞争得过 LIDAR 吗? 你能基于视频对车辆进行 3D 物体检测和重建吗?查看一下 ECCV 中的一些挑战。
挑战赛地址:http://apolloscape.auto/ECCV/challenge.html
CARLA: Democratizing Autonomous Driving Research(《CARLA: 让自动驾驶研究平民化》)
对于城市地区来说,自动驾驶有很高的安全性要求。你听过 CARLA 仿真器吗?有了它,不需要实际上路也能训练你的自动驾驶算法。你可以在这里找到学习指导。
演示视频:https://www.youtube.com/watch?v=AaJekfFR1KQ
Convolutional Networks with Adaptive Computation Graphs(《带有自适应计算图的卷积网络》)
Anreas Veit 表示 CNNs 并不一定需要固定的前馈结构,而是提出了在 ImageNet 上的表现比 ResNet 更好的自适应网络拓扑结构。你可以在这里阅读论文梗概。
Lifting Layers: Analysis and Application(《提升层:分析与应用》)
对于深度学习在图像分类和图像去噪中的应用来说,增加输入的维度为什么会有帮助呢?为什么还能训练得更快呢?
Jointly Discovering Visual Objects and Spoken Words from Raw Sensory Input(《从原始传感器输入中联合提取视觉目标与语言词汇》)
你知道神经网络能够用来发现音频-视觉语义的对应关系,从而让我们突出大家所提到的(图像中的)物体、视野或区域吗?
Learning Discriminative Video Representations Using Adversarial Perturbations(《通过对抗性扰动学习有判别力的视频表征》)
CNN 特征,史蒂费尔流形,黎曼共轭梯度体系——把这些艰深的东西全部汇到了一起。
Diverse Image-to-Image Translation via Disentangled Representations(《通过解耦表征的多样化图像到图像转换》)
我们怎样用指定的内容和属性生成一张新图片?
Style-aware Content Loss for Real-time HD Style Transfer(《用于实时高清风格抓换的基于风格的内容损失》)
雷锋网获悉,该论文的作者为图像的风格迁移问题打下了基础。他们为我们提供了一种能模仿不同历史艺术家的风格的——虚构的「绘画」。这些「绘画」都由 CNNs 产生自真实世界的图像,并且可以轻松骗过人类观者。这项工作甚至可以用来生成视频!
Kochen mit Spaß!
现在有一个叫做 Cookpad 的移动 App!你可以用它来给美食拍照,之后,CNN 将会对食物进行鉴别,让这个 App 能够告诉你要准备什么材料,以及怎样自己动手做出这些食物。
计算机视觉大家庭还在蓬勃成长,绝妙的点子和应用也越来越多!雷锋网也将继续为大家带来有趣的计算机视觉技术相关消息。