百度发布 PaddlePaddle 新 API,以及免费手册《使用 PaddlePaddle 进行深度学习》
微软更新 Linux 平台的数据科学虚拟机(DSVM)
谷歌发布机器学习数据清理服务 Cloud Dataprep
每日推荐阅读
什么是数据虚拟化:一个数据的大超市
昨日,百度宣布已完成 PaddlePaddle 新 API 的内测版本。PaddlePaddle 是百度研发的深度学习开源平台,于去年 9 月对公众开放,称得上是国内机器学习开源项目的领军者。雷锋网获悉,该新 API 接口大幅精简了 PaddlePaddle 的代码量。下面百度官方公布的对比图,左为旧 API 上的 CNN 程序,右为新 API。
如图所示,新 API 的代码非常简洁。百度表示,这主要是由于三个方面的改进:
新的概念模型
提供“训练、“测试”、“推理”等新的高级 API,并支持 Kubernetes 。
组合的 data bricks
此外,百度还开放了《使用 PaddlePaddle 进行深度学习》的使用手册,其中有示例教程。
手册下载地址:http://book.paddlepaddle.org/index.en.html
详情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/
该虚拟机全称是 Data Science Virtual Machine,一个基于微软 Azure 云服务的定制虚拟机镜像,内置一系列数据科学和机器学习的开发工具,旨在方便开发者开发和部署机器学习应用软件。
DSVM 有两个平台的版本:Windows 和 Linux。微软宣布更新了 Linux 版的 DSVM,加入了对 Spark、Hadoop、Microsoft R Server 等平台的支持, 并在工具包中提供 JuliaPro。
在昨日的 Google Cloud Next 谷歌云开发者大会上,谷歌发布了一项新服务—— Google Cloud Dataprep。它能自动检索数据中的模式(schemas)、连接(joins)以及异常部分,比如缺失或者重负的值,并在这一过程中不需要人工写代码干预。这一过程中它利用了机器学习技术,以筛选出符合用户要求的数据清理规则。 简单来说, Cloud Dataprep 能帮助开发者为机器学习准备、清理数据。
外媒 VentureBeat 指出, Cloud Dataprep 事实上是谷歌版的 Wrangler Enterprise app,后者是初创公司 Trifacta 所推出,让开发者在简单易用的交互界面上清理数据。
目前 Cloud Dataprep 的公测版本已可下载。但据雷锋网了解,谷歌计划把 Cloud Dataprep 作为一项收费服务。
与此同时,谷歌还宣布了 BigQuery 的一系列改进。
详情:http://venturebeat.com/2017/03/09/google-launches-cloud-dataprep-an-embedded-version-of-trifacta/
如题,以超市做比喻,解释什么是数据虚拟化(data virtualization)。非常生动自然,有助于初学者进行理解。
地址:http://www.datasciencecentral.com/profiles/blogs/data-virtualization-a-supermarket-for-data
栏目介绍:AI 开发者头条是雷锋网旗下 AI 研习社推出的资讯栏目,周一到周五更新,汇总每天 AI 开发圈的重磅新闻,并推荐技术干货。你所关注的 AI 技术资讯,尽在开发者头条。
关注 AI 研习社公众号,获取每日头条推送。
相关文章:
谷歌公布 Video Intelligence API 助力视频内容搜索;Facebook 开源新一代机器学习 GPU 服务器 Big Basin | AI 开发者头条
Google Cloud Next 云技术大会开幕;英伟达发布全新 Jetson TX2 嵌入式开发组件 | AI 开发者头条