Facebook 建立的根基就是了解用户一举一动并将它们掌握的各种数据打包卖给广告商,随后它们会将挣来的钱用于研发,为用户提供更多新鲜有用的功能,如视频和购物,而通过这些新功能,它就能继续加深对用户的了解。
Facebook搭建的这套网络实现了双赢,用户可以尽享交流和对话的便利,Facebook 也能借此发展壮大。当然,用户获得良好体验的背景下,是 Facebook 数据工程师辛勤的劳动,因为我们是谁,喜欢什么,时间都花在哪这些数据非常繁杂,它们根本没有结构。
那么数据工程师面对的是多浩大的工程呢?雷锋网了解到,每分钟全世界会有 12 亿人在 Facebook 上上传 13.6 万张照片,更新 29.3 万次状态。因此,即使是 Facebook 的技术大牛,也只能从这些无结构的数据中截取一些有价值的部分,而这部分通常是最难量化和处理的。
不过,现在数据工程师们有了强援——深度学习。深度学习技术让机器能学着自己对数据进行分类。最典型的例子就是深度学习图像分析工具,无需人类专门教导,机器就能识别出哪些图片包含有猫咪,而这一“神技”背后,是机器对大量图片的分析。“书读百遍,其义自现”,机器通过读图看出了图片包含的信息,懂得了到底哪类图片会包含猫咪。
通过对数据的量化,分析工具能洞察出所需信息,并完成对非结构化数据的结构化工作。在此过程中,分析工具会试图回答类似包含猫咪的图片中某家公司产品出现的频率如何?我们应该专门针对爱猫人士推出这款产品的广告吗的问题。
随着深度学习算法变得越来越复杂,它们能处理的数据也越来越多,文字、图片甚至视频都不在话下。
下面,我们就来共同盘点几种深度学习的特定用例,利用该技术,Facebook 不但为用户提供了方便,还完成了对我们的深入了解。
如今,Facebook 上用户分享的大多数数据依然是文本化的。虽然视频和图片可能包含千言万语,但回答简单问题时你根本用不上那么多单词,那些用不到的数据就会成为噪声,如果不加区分的对其进行精细化处理,就是在浪费 Facebook 的存储和分析能力。
为了让机器更好的理解文本,Facebook 开发了名为 DeepText 的工具,它能自动学习并通过分析上下文来理解文本大意。同时,神经网络这可分析单词之间的关系并以此理解不同单词组合会产生什么语义的变化。由于这属于半自动的无监督学习,因此算法无需始终参考数据。
这就意味着在学习过程中 DeepText 不会被拼写、俚语或语言风格所困。事实上,Facebook 称这项技术“与语言本身无关”,因为它已经给单词贴了标签,因此可以轻松的在不同的语境间进行切换。
眼下,该工具已经可以根据用户的言语直接找出他们的“愿望清单”并智能的进行推荐了。
除了 DeepText ,Facebook 还有一个名为 DeepFace 的应用,这次它要识别的可不是猫咪,而是人脸了。Facebook 对该应用信心满满,它们声称 DeepFace 绝对没有脸盲症,它认人的能力早已超越人类,准确度高达 97%(最强的人类只有 96%)。
不过,此类技术的应用也遭到了隐私保护人士的反对,他们认为 Facebook 做的太过了,这种在照片上给人脸贴标签的行为是人们通向自由的阻碍。欧盟立法者同意该观点,为了保护欧盟公民,2013 年时它们就要求 Facebook 在欧盟禁用此类工具。而在当时,Facebook 使用的面部识别工具还只是初期产品,深度学习技术并未介入。
对于该技术带来的隐私困扰,Facebook 也相当小心,它们的研发一直处于秘密状态,直到此类案子有了结果才敢放出自己的研究成果。
与谷歌类似,Facebook 也要靠广告来挣钱,因此如何精准的进行定向广告投送就成了社交网络巨头的头等大事。在广告推送问题上,Facebook 则用到了深度学习的基石——深度神经网络。通过该技术,机器在了解用户行为习惯的基础上,就能将他们进行精确分类,然后再定向发送适合用户的广告。
为了找出最有效的深度学习应用,Facebook 还用到了名为 Flow 的超级系统,该系统每个月会利用深度学习分析法模拟运行 30 万个机器学习模型,这样以来工程师就能找出最有效的模型并从中发现商机。
Facebook 是开源计划的有力支持者之一,因此 Facebook 人工智能研究所的大部分工作成果对全世界都是透明的。眼下,社交网络巨头的深度学习研究都集中在 Torch 平台,该平台主要注重深度学习和神经网络技术的研发。
深度学习在 Facebook 的未来发展中必然会扮演重要角色。虽然 Facebook 依然谨守自己对深度学习未来应用愿景的秘密,但外界早已看出些许端倪。未来,深度学习能让盲人拥有识图的能力,因为它可以自动生成图片的文字描述。同时,该技术还能预测贫困地区对于网络的需要,帮助 Facebook 推进自己的免费网络计划。从长远来看,Facebook 在 AI 上的努力能让全社会受益。
Via. Forbes