史上最昂贵的自拍照,诞生于2007年。两名美国大兵在伊拉克的军营中玩自拍并且传到了社交网络上。结果几天之后,这个秘密的驻扎地就遭到了恐怖分子火箭弹的袭击。四架“阿帕奇”直升机惨遭“爆菊”,两亿美金灰飞烟灭。美军情报部门“百思不得姐”,最后才发现:原来是大兵的自拍照中附带了经纬度信息,让“好友”轻易掌握了他们的位置。
而就在几个月前,某ISIS成员在其“总部大楼”自拍,并且在社交网络上大肆吹嘘这里的指挥能力有多么“炸裂”。结果一语成谶,22小时之后,这幢大楼就被美军三枚导弹“强拆”了,“炸裂”得粉身碎骨。
【恐怖分子也是自拍爱好者(图文无关)】
虽然这张照片没有直接透露出经纬度信息,不过根据美军361号情报小组对照片“元数据”的分析,结合所掌握的大数据,很快就定位到了这个建筑。正所谓君子报仇,“八”年不晚。(只是这些恐怖分子已经不是当年的那拨了)
美军“自拍战”的故事告诉我们,照片能够泄露的信息,远比你想象得要多。只要采取正确的姿势“拷问”大数据,它什么都会交代。所以,每小时发10张自拍到各种社交媒体的妹子们,祝你们安全。
然而,这里不是动不动就抽刀拔枪的中东。在安定团结的天朝,你的大数据究竟被怎么玩呢?
你站在空无一人的公交站台上,百无聊赖地抬头看到电子广告牌,那是一款志玲姐姐代言的内衣。你决定掏出手机。此刻,你将要为大数据做出贡献了。
如果你开始在网页上搜索内衣的品牌,那么运营商会把这个动作记录在案,告诉广告主:有人对你的产品感兴趣。
如果你进一步进入了品牌官网,甚至开始查看内衣型号,那么这个动作也将被记录,广告主会得知:有生意要上门了!
如果你凝视广告牌许久,然后在搜索框中默默输入:“志玲姐姐 胸”,那么,广告主会得知:死宅男,浪费老子广告费!
这是联通公司凭借其运营商的特别地位提供的户外媒体指数。当然以上的信息都会以指数的形式呈现,除了联通公司,并没有人掌握你和搜索动作的对应关系。
当然,联通可以获得的信息还远不止搜索行为这一项。甚至你是否去了内衣专卖店,是否拨打了品牌的服务电话,都会被汇总,以指数或者报告的形式反映出来。
【此处应有林志玲】
同样,联通旗下还有“投资指数”,通过侦测某App在各个手机上的活跃度,来给投资机构判断这个App是否值得投资。另外,还有“旅游指数”,可以判断每一个进入景区的游客用的是多少钱的话费套餐、属于高富帅还是屌丝、平常喜欢在网上买什么,从而判断这些游客消费能力如何,给旅游局等部门提供参考。(相信黑导游一定喜欢这样的数据)
这样的指数还有很多很多,几乎你和手机有关的一切行为都会成为大数据的一部分。而且建立在中国庞大的人口基数之上的,是庞大的手机数量和基站数量。各大运营商的基站都配有太阳能板,如果把这些太阳能板接受日光强度的变化进行汇总,加上各大基站都会配备的温度湿度传感器反馈的信息,最了解中国气象全局的就不是中央气象局了,而是电信运营商。
有了运营商的大数据版“天气预报”,原来提前三天才能预测的雾霾,现在提前十天就可以预测啦!这样,帝都的小伙伴们就可以——提前做好受难的心理准备了。。。
【蔡元培像被戴上口罩】
如此说来,中国最精确统计常住人口的机构也许还是运营商,因为昂贵的漫游费逼你要买本地电话卡。而精确地知道居民住址的,也许是教育局,因为为了孩子的安全你一定会把你的真实地址报告给学校。
你生活的痕迹就是大数据。如果有一种技术可以轻易地记下你的脚印,那么你的爱好、习惯、职业、经济状况、婚姻状况都可以通过你去的地方精确展现出来。只不过问题在于,脚印这种数据非常难以记录。
在BDTC(大数据技术大会)上,阿里巴巴集团CTO王坚做了这样的类比:
大部分大数据都留存在基础设施之上,而互联网和高速公路都是基础设施。在这两者之上记录的数据都是大数据,只不过高速公路上的信息很难沉淀为社会财富,只有破案或者发生车祸的时候才会有人去查看车辙。而互联网有一个天然的优势,就是数据可以低成本地被记录下来。
于是,人在网上的一举一动都可以被记录在案。这些记录在案的数据,一定会以某种形式还原出事件的真相——人们的行为、机器的运行、建筑的状态。从这一点上来看,数据是物理世界在网络空间投射的DNA。
曾经有一起金融诈骗案,主犯注册了一家煤炭公司,然后利用自己亲属、朋友的名字注册了诸多金融公司,以煤炭公司的名义和中国神华进行了一些小的业务往来。进而以此为噱头,利用金融公司做担保,向银行骗贷。涉案数亿元。
在整个案件中,主犯的数据、他亲友的数据都是公开可查询的,而却没有一家银行识破这些人的关联关系。关键的问题就在于这些数据是独立分散的,没有一个“柯南”或者“黑猫警长”把这些信息整合起来。
而当年美国航天飞机挑战者号升空爆炸之后,半小时内,和挑战者号关联的四个公司股价都强烈下挫,而三个小时之后,三家公司的股价都企稳,只有一家公司持续下跌,根据后来总统专家委员会调查的研究报告现实,正是这家公司的燃料系统出现问题,才直接导致了灾难的发生。实际上,在这三小时之内,信息已经在投资者圈内流传,而且非常准确。如果当时有一种更加快速的方式传递信息,NASA甚至就可以根据大数据迅速判断航天飞机失事的真实原因。
【挑战者号爆炸的瞬间,看台上的观众甚至没有明白发生了什么】
而以上两个故事的关键都在于,我们对大数据的处理能力还像小学生一样薄弱。然而,看不懂天书,并不是天书的错。练不成葵花宝典,要从自己身上找原因。大数据就像是土地,你在上面种粮食还是盖房子,得到的收益是不一样的。
说到对于大数据的采集,微软算是先驱。当初微软每年卖掉几亿份拷贝的Windows,却硬是无法知道用户在家究竟是怎么使用这个系统的。于是他们便对用户的鼠标点击数据进行收集,给Windows升级提供依据。这就是最早的“用户体验改善计划”。而同样是收集用户的点击数据,谷歌却做到了知晓用户的性格和爱好,从而实现精准的广告投放,产生了远大于微软的商业价值。
说到大数据最成功的“商业运用”,莫过于如鬼魅一般的骚扰电话了。向妈妈推荐母婴用品,向房主推荐抵押贷款,向赌徒推荐澳门博彩,向色狼推荐特殊服务。在不胜其烦的同时,也不得不佩服其定位的精准。
相比倒卖个人信息的“黑色产业”,电信运营商合法取得你的通话、浏览、位置等数据,也让很多人感觉胆战心惊。专门研究大数据的律师王新锐说:“从商业上来讲,越是隐私的数据价值就越大。”
那么问题来了,在隐私和服务之间,究竟法律的界限如何划分呢?
王新锐告诉雷锋网:
根据法律,判断数据的收集是否合法,很重要的一点就是看数据有没有被转移。如果运营商直接把个人的大数据提供给第三方,就侵犯了个人隐私。如果跟第三方合作,由运营商根据他人的要求自己做查询判断,或者做抽象的总结,则是可以的。
形象来说,个人的数据就像互联网版的肖像权,财产权,人格权一样,权利属于个人,但是从众多数据中升华判断出的新价值,就属于服务提供商了。而服务提供商把数据放在黑箱里(脱敏)再和第三方进行交付,则是它的权利。
这就像新闻镜头一样,如果镜头里只展现了两个人:你拉着别人的女朋友,那么这个镜头无疑侵犯了你的隐私,如果此刻将镜头拉远,包含了无数路人,也包含了你们俩,也许还包含了跟踪已久正在远处磨刀霍霍的你的正牌女友,所有的人都是模糊不清的。这个时候大数据则并不侵犯你的隐私,只是总结道:此处有杀气。
BDTC 中国大数据技术大会(Big Data Technology Conference,BDTC)是目前国内最具影响、规模最大的大数据领域的技术盛会。