更高效的聚类、相似性搜索算法库,Facebook 开源 FAISS
MIT 黑科技,合成数据也能用于机器学习
机器学习算法成功预测人造地震
每日推荐阅读
ViZDoom 使用教程:训练 AI 来玩《毁灭战士》
雷锋网消息,FAIR(Facebook 人工智能实验室)上周发表了一篇论文,提出一项针对聚类和相似性搜索的新算法设计。新架构比此前最先进的算法更快更高效,并使用 GPU 来获得更高的内存带宽和计算吞吐量。
基于此项研究,FAIR 近日在 Github 开源了一个名为 FAISS 的库,相关文档已陆续完成上传,并于昨日更新了安装文件。能进行聚类和相似性搜索的算法已有不少,FAISS 对它们进行了优化,以便更高效地在 GPU 上运行。FAISS 整合的部分算法有:
Fast K-Nearest Neighbour
QuickSelect
Warpselect
K-Means clustering
FAIR 表示,FAISS 有五大特性:
使用 C++ 编写,有完整的 Python/numpy 封装。
支持单个、多 GPU。
优异的可扩展性,通常情况下能支持最多 100 个维度。
基于 BLAS 和 CUDA。
比当前最先进的库速度提高 8.5 倍。
详情:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html
GitHub:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html
论文:https://arxiv.org/abs/1702.08734
IEEE 数据科学大会上出现了一篇重磅论文。该论文的作者是 MIT LIDS(Laboratory for Information and Decision Systems) 实验室的首席科学家 Kalyan Veeramachaneni。他提出了一项新技术:通过机器学习算法基于真实数据生成合成数据,将后者应用于模型训练,却能产生和前者相当的效果。
你或许要问,这个技术有什么价值?
很多领域,比如医疗和金融,普通用户的隐私、敏感信息要么难以合法获取、要么代价极大(雷锋网注:AI 公司从医院购买患者扫描图像普遍需要一笔巨资,几乎没有企业负担得起)。而合成数据避免了隐私泄露问题,但又具备真实数据的价值;因此可用来开发、测试算法模型。
Kalyan Veeramachaneni 发明的这个机器学习系统名为 Synthetic Data Vault (SDV),能基于真实数据创建机器学习算法模型,来自动生成人造、合成数据。这套系统基于名为 "recursive conditional parameter aggregation" 的算法。
详情:http://news.mit.edu/2017/artificial-data-give-same-results-as-real-data-0303
论文:http://dai.lids.mit.edu/SDV.pdf
众所周知,地震预测一直是终极科学难题之一,至今尚无可靠的方法。相当多地质专家认为这根本不可能实现。雷锋网消息,美国 Los Alamos 国家实验室的两名研究人员,利用机器学习技术实现了对实验室环境的人工地震预测。这再次点燃了希望。
他们训练了一个机器学习算法,对人造地震发生前材料受压释放的声波成功进行了识别。考虑到地震预测课题的难度,研究团队对该技术在真实地震条件下的预测效果表示谨慎。但这项研究指出了一个新方向。
该突破在地质学界造成了相当大的震动。可以预料,将会有一大批科研人员着手研究如何将机器学习应用于对地震前兆信号的识别。
ViZDoom 是一个可与 Tensorflow、Theano 等框架结合的强化学习库,同时是一个基于游戏《毁灭战士》(“Doom”)的 AI 研究平台,为机器视觉学习和深度强化学习而设计。技术人员可用该工具开发仅通过 screen buffer 信息来玩《毁灭战士》的 AI 智能体。
英国数据咨询师 Mark Litwintschik,近日发表了一篇使用 ViZDoom 的上手教程。该教程基于 Tensorflow,感兴趣的可以玩一玩。
文章地址:http://tech.marksblogg.com/tensorflow-vizdoom-bots.html
ViZDoom 地址:http://vizdoom.cs.put.edu.pl/
栏目介绍:AI 开发者头条是雷锋网旗下 AI 研习社推出的资讯栏目,周一到周五更新,汇总每天 AI 开发圈的重磅新闻,并推荐技术干货。你所关注的 AI 技术资讯,尽在开发者头条。
关注 AI 研习社公众号,获取每日头条推送。
相关文章: