「AI 大毒瘤」Deepfake 识别赛排名出炉！3.5 万种算法准确率最高 82.56%，Facebook 要在 CVPR 上“放大招”

Deepfake

作者：付静

2020/06/13 15:39

不否认已有的成绩，但问题还没解决。

为应对自 2017 年起引起全球恐慌的「AI 大毒瘤」Deepfake，政府、企业、学界联合发力。

2019 年，Facebook 斥巨资发起“Deepfake 检测挑战赛”（Deepfake Detection Challenge，DFDC）。最近，Deepfake 检测挑战赛首个结果新鲜出炉，识别准确率最高可达 82.56%，黑盒测试准确率最高为 65.18%。

Deepfake 检测挑战赛缘何发起？

故事源于 2017 年。

美国社交新闻网站 Reddit 一位名为 Deepfakes 的用户利用 AI 把《神奇女侠》女主角 Cal Gadot 的脸嫁接到一个成人电影女主身上，伪造了一段色情视频 po 上网络。

视频火了，Deepfake 技术也火了。

从技术角度来看，Deepfake 是种深度自动编解码器模型（Autoencoder-Decoder），通过用源人物和目标人物的至少几百张照片，训练模型分别识别、还原两人面部的能力，最后用源人物的照片搭配目标人物的解码器，从而完成转换。

「AI 大毒瘤」Deepfake 识别赛排名出炉！3.5 万种算法准确率最高 82.56%，Facebook 要在 CVPR 上“放大招”

毫无疑问，用户 Deepfakes 上传的视频涉及色情内容，且侵犯到了他人隐私，Reddit 官方自然而然地将其封号。不过，Deepfakes 也很刚，作为报复，直接把视频的 AI 代码免费公开。

此后，AI 大毒瘤开始迅速发酵——荷兰网络安全初创公司 Deeptrace 2019 年 10 月发布的关于 Deepfake 现状的报告指出，Deepfake 视频中 96% 涉及色情，在各大色情网站上疯传，所有受害者均为女性，娱乐圈名人成为主要被恶搞的对象。

可见，Deepfake 有着极其恶劣的影响，指不定哪天登上奇奇怪怪的网站连自己都不知道，真是细思极恐。

这还没完，Deepfake 也被卷入了政治中——比如，由于同性性关系在马来西亚属违法行为，2019 年一段马来西亚经济部长 Azmin Ali 与男性发生性关系的视频曝光后搅动了政局，不过 Azmin Ali 表示视频属 Deepfake 技术伪造，认为“这是场政治阴谋”。

基于此，政府、企业、学界下定决心联合起来清除毒瘤。

2019 年 9 月 5 日，Facebook CTO Mike Schroepfer 宣布，Facebook 正与微软联合包括麻省理工学院、牛津大学、康奈尔科技校区和伯克利大学在内的多所大学研究检测 Deepfake 的方法，同时非营利性研究组织 Partnership on AI 也参与其中，该组织的成员包括 Google、苹果、亚马逊、IBM 等大型科技公司。

同时，Facebook 投入了 1000 万美元发起“Deepfake 检测挑战赛”（Deepfake Detection Challenge，DFDC），竞赛于 2019 年末在温哥华举行的 NeurIPS 2019 上正式启动，旨在激励研究人员以及业余爱好者寻找能够识别出由 AI 操纵的视频算法。

Deepfake 检测结果如何？

具体来讲，Facebook 雇佣了 3000 多名不同性别、肤色、种族、年龄的演员录制了大约 10 万个视频片段数据集，其中一部分经过了 AI 的修改，把别人的脸贴在视频里。

雷锋网了解到，Facebook 利用了多种 Deepfake 生成模型、诸如图像增强之类的细化技术以及诸如模糊、帧率修改和覆盖之类的增强和干扰。这样做的目的就是，使数据集能够涵盖实际可能存在的任何类型视频。

为确保挑战赛能达到预期的效果，Facebook 与康奈尔大学、麻省理工学院、慕尼黑技术大学、加州大学伯克利分校、奥尔巴尼桑尼大学、马里兰大学、那不勒斯费德里科二世大学以及牛津大学的专家合作，收集反馈和建议。

「AI 大毒瘤」Deepfake 识别赛排名出炉！3.5 万种算法准确率最高 82.56%，Facebook 要在 CVPR 上“放大招”

下图是 Facebook AI 官方给出的挑战赛时间节点。

可以看出，自 2019 年 12 月 11 日正式启动以来，比赛如火如荼地展开，截止 2020 年 3 月 31 日，约 2114 名参赛者提交了超过 35000 种检测算法。随后的 4-5 月，研究人员对参赛者识别视频的能力进行测试，从而评选获胜者。

「AI 大毒瘤」Deepfake 识别赛排名出炉！3.5 万种算法准确率最高 82.56%，Facebook 要在 CVPR 上“放大招”

终于，当地时间 2020 年 6 月 12 日，Facebook AI 团队公布 Deepfake 检测挑战赛首个结果——视频识别算法准确率最高可达 82.56%，不过在黑盒测试（black box）中准确率最高为 65.18%，这表明特定场景的 Deepfake 视频仍具有挑战性。

实际上，检测 Deepfake 的一个核心挑战就是将新的场景归到已知的例子中，因此难度升级，参赛者须设计即使在不可预见的情况下也可能有效的模型。每个参赛队伍的方案都必须经过黑盒测试，黑盒数据集包括 10000 个比赛参与者无法获得的视频，既有可以在网上找到的视频（有真有假），也包含专门为挑战赛制作的视频。

经过 2 个月重重筛选，排名总算出炉。

「AI 大毒瘤」Deepfake 识别赛排名出炉！3.5 万种算法准确率最高 82.56%，Facebook 要在 CVPR 上“放大招”