今天上午携程网官网和应用的无法正常使用,官方回应说服务器遭攻击宕机,恢复时间未定。马上朋友圈里就有传闻说携程网数据库被”物理删除”,损失巨大。倘若传言成真,携程网这次可要”哭晕在厕所”了。
企业网站数据备份、灾难恢复向来不是个轻松的活计。一般来说大型网站都会在数据安全上不惜重金投入,耗费大量人力物力来保护用户和企业自己的信息。个人用户保护自己重要的数据,诸如照片、文档之类的方法无非是在移动硬盘、网络云盘上复制一两份,而企业级的数据管理要复杂得多。
以旅行网会员数据库为例,大型企业的一种存放方式是”异地双活”,也就是整套数据库在两个城市或是一个城市相隔较远的两处中心同时运行。任何时候一个中心出现严重事故,另一个中心能继续维持服务运行。这种方式要求两个中心用高速专线连接,确保两方存储和更新的数据不出现冲突,因此成本不菲;另一种方式则不要求双中心的数据随时同步,而是备用中心每隔几分钟或几小时与主数据库同步一次,这种方式对成本和技术的要求就低些。
为了提高性能,目前很多高性能数据库的存储介质都换成了闪存,像12306这种负载极大的网站甚至直接把库放到服务器内存里跑。企业使用的服务器稳定性远强过家用PC,而且闪存系统都有RAID一类的容错保护,一组SSD中有一两个挂掉不会造成数据损失。除此之外整个数据库每隔一定时间就会在另一套存储系统(通常用机械硬盘)保存一份快照,这样SSD万一整体完蛋还能挽回大部分损失。最后,数据中心都有独立的备份电源,就算外部短时间停电也可继续运行。
这么复杂的保护就能保证企业数据万无一失了么?可惜世上无绝对,任何方案也不可能做到百分之百的保险。拿极端的例子讲,如果几个数据中心全部被暴力摧毁,就是神仙也救不了那些数据了。诚然这种情况发生的概率太低,一般也不用太担心。可是其他一些问题也可能让IT部门好好喝一壶了。
一种非常可怕的事故就是拥有管理员权限的人,可能是黑客可能是一时大脑进水的网站员工,恶意或者手滑删掉了整个数据库。就算是双活异地备份也经不住这种打击,一瞬间存储在闪存或内存里的东西就全都灰飞烟灭了。以前大家用机械硬盘,还可以立刻用数据恢复软件把删除的文件快速找回来;现在用闪存或内存,误删除操作根本不可能恢复,只有去找离线存储系统一段时间以前的备份了。从备份系统恢复数据速度相当缓慢,而且免不了会丢失掉一部分最新更新的内容。这次携程网遇到的麻烦就有可能是这种形式。
还有一种灾难是系统崩溃。虽然服务器使用的操作系统都专为持久稳定使用设计,但也保不准哪天就像windows蓝屏一样突然出错。尤其是系统升级更新时容易出这种幺蛾子,当年工商银行升级核心系统时就中过招。系统崩溃一般不会造成保存的数据损失,但重建系统、重新校验数据库也是个费时费力的事儿。携程这次也可能是这类问题。
天下没有绝对安全的系统,任何企业都逃不掉这个规律。不管这次携程遇到的问题是严重的数据丢失还是轻一些的系统崩溃,希望他们能尽快解决问题,尽可能保护用户的数据。其他IT公司乃至政府单位和个人也该从中吸取经验教训,时时刻刻绷紧数据安全这根弦。光是买了昂贵的系统是不顶用的,预防数据灾难最重要的还是保持高度警惕的心态。