解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

网络安全阿里巴巴月饼门

作者：陈圳

2016/09/21 21:55

雷锋网按：本文作者fuqiang liu，文章原载于知乎，雷锋网已获授权。

本文通过一个的实验，简要介绍频域手段添加数字盲水印的方法，并进一步验证其抗攻击性。在上述实验的基础上，总结躲避数字盲水印的方法。（多图预警）

本文分为四个部分，第一部分综述；第二部分频域数字盲水印制作原理介绍；第三部分盲水印攻击性实验；第四部分总结；

一、综述

本文提供的一种实现“阿里通过肉眼无法识别的标识码追踪员工”的技术手段。通过看其他答主的分析，阿里可能还没用到频域加水印的技术。

相对于空域方法，频域加盲水印的方法隐匿性更强，抵抗攻击能力更强。这类算法解水印困难，你不知道水印加在那个频段，而且受到攻击往往会破坏图像原本内容。本文简要科普通过频域手段添加数字盲水印。对于web，可以添加一个背景图片，来追踪截图者。

所谓盲水印，是指人感知不到的水印，包括看不到或听不见（没错，数字盲水印也能够用于音频）。其主要应用于音像作品、数字图书等，目的是，在不破坏原始作品的情况下，实现版权的防护与追踪。

添加数字盲水印的方法简单可分为空域方法和频域方法，这两种方法添加了冗余信息，但在编码和压缩情况不变的情况下，不会使原始图像大小产生变化（原来是10MB添加盲水印之后还是10MB）。

空域是指空间域，我们日常所见的图像就是空域。空域添加数字水印的方法是在空间域直接对图像操作（之所以说的这么绕，是因为不仅仅原图是空域，原图的差分等等也是空域），比如将水印直接叠加在图像上。

我们常说一个音有多高，这个音高是指频率；同样，图像灰度变化强烈的情况，也可以视为图像的频率。频域添加数字水印的方法，是指通过某种变换手段（傅里叶变换，离散余弦变换，小波变换等）将图像变换到频域（小波域），在频域对图像添加水印，再通过逆变换，将图像转换为空间域。相对于空域手段，频域手段隐匿性更强，抗攻击性更高。

所谓对水印的攻击，是指破坏水印，包括涂抹，剪切，放缩，旋转，压缩，加噪，滤波等。数字盲水印不仅仅要敏捷性高（不被人抓到），也要防御性强（抗打）。就像Dota的敏捷英雄往往是脆皮，数字盲水印的隐匿性和鲁棒性是互斥的。（鲁棒性是抗攻击性的学术名字）

二、频域制作数字盲水印的方法

信号是有频率的，一个信号可以看做是无数个不同阶的正弦信号的的叠加。

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

上式为傅里叶变换公式，是指时域信号（对于信号我们说时域，因为是与时间有关的，而图像我们往往说空域，与空间有关），是指频率。想要对傅里叶变换有深入了解的同学，建议看一下《信号与系统》或者《数字信号处理》的教材，里面系统介绍了傅里叶变换、快速傅里叶变换、拉普拉斯变换、z变换等。

简而言之，我们有方法将时域信号转换成为频域，同样，我们也能将二维信号（图像）转换为频域。在上文中提到，图像的频率是指图像灰度变换的强烈情况。关于此方面更系统的知识，参见冈萨雷斯的《图像处理》。

下面以傅里叶变换为例，介绍通过频域给图像添加数字盲水印的方法。注意，因为图像是离散信号，我们实际用的是离散时间傅里叶变换，在本文采用的都是二维快速傅里叶变换，快速傅里叶变换与离散时间傅里叶变换等价，通过蝶型归并的手段，速度更快。下文中傅里叶变换均为二维快速傅里叶变换。

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

上图为叠加数字盲水印的基本流程。编码的目的有二，一是对水印加密，二控制水印能量的分布。以下是叠加数字盲水印的实验。

这是原图像，尺寸300*240

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

之后进行傅里叶变换，下图变换后的频域图像，

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

这是我想加的水印，尺寸200*100，

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

这是我编码后的水印，编码方式采用随机序列编码，通过编码，水印分布到随机分布到各个频率，并且对水印进行了加密，

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

将上图与原图的频谱叠加，可见图像的频谱已经发生了巨大的变化，

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

之后，将叠加水印的频谱进行傅里叶逆变换，得到叠加数字水印后的图像，

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

肉眼几乎看不出叠加水印后的图像与原图的差异，这样，数字盲水印已经叠加到图像中去。
实际上，我们是把水印以噪声的形式添加到原图像中。
下图是在空域上的加水印图与原图的残差（调整了对比度，不然残差调小看不见），

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？

可以看出，实际上上述方法是通过频域添加冗余信息（像噪声一样）。这些噪声遍布全图，在空域上并不容易破坏。
最终，均方误差（MSE）为0.0244
信噪比（PSNR）为64.2dB

那么，为什么频谱发生了巨大的变化，而在空域却变化如此小呢？这是因为我们避开了图像的主要频率。下图是原图频谱竖过来的样子，其能量主要集中在低频。

解密：阿里巴巴公司根据截图查到泄露信息的员工的技术是？