Microsoft Cognitive Toolkit 原名 CNTK,是微软去年开源的深度学习框架。
作为语音识别领域声名卓著的开发工具,Microsoft Cognitive Toolkit 具有相当不错的可扩展性、速度和精确性。在海量数据上开发深度学习应用,它具备商用级别的稳定型,以及与主流编程语言与算法的兼容。
如今,它即将迎来新一代的 2.0 版本。
自从去年十月发布 2.0 beta 版,微软为 Microsoft Cognitive Toolkit 2.0 已陆续添加了超过 100 余个新特性、升级以及漏洞修补。而近日雷锋网获知,微软在 GitHub 上放出了它的 RC1版,即第一个候选版本,标志着内测阶段已经完成。
我们离 Microsoft Cognitive Toolkit 2.0 的正式发布又近了一步。
前天,微软在博客表示:
“我们很高兴地宣布,微软已经将 Microsoft Cognitive Toolkit 2.0 带出内测阶段,并在今天向大家公布其第一个候选版本。该工具此前被称为 CNTK,是一个针对深度学习的系统,用来加速诸如语音、图像识别以及搜索相关性(search relevance)等领域的技术进步。并可运行于 CPU 或英伟达 GPU。Microsoft Cognitive Toolkit 既可本地运行,也可在云端基于 Azure GPU 运行。
Microsoft Cognitive Toolkit 在一系列微软产品中都有十分广泛的应用。全世界范围内有大规模深度学习部署需求的公司,对最新算法、技术感兴趣的学生,都是其用户。自从 2016 年十月,我们已发布了超过十个 beta 版本,涵盖数百个新特性、性能提升和修补。”
在 BrainScript 之外提供了更多 binding。2.0 版本把 Cognitive Toolkit 作为一个支持以下 binding 的算法库:
Python (versions 2.7, 3.4, and 3.5).
C++.
C#/.NET Managed.
微软充分认识到 Python 在深度学习领域的重要性,准备了一系列 Python 示例与教程(后者作为 Jupyter Notebooks 来执行)。请见:
Python Tutorials (Jupyter Notebooks).
雷锋网了解到,你也可以用 Cognitive Toolkit Docker Containers 来运行 Jupyter Notebooks 教程。
Layers 算法库得到了大幅升级。大量的通用“layers”已预定义,使编写包含标准层级的简单网络变得十分容易。
雷锋网获知,新的 Cognitive Toolkit 评估算法库在易用性和性能上被大幅升级。该算法库可被用于 Windows 和 Linux,使用 C++、Python、C# 其它 .NET 语言。
新特性列表
The ability to extend Cognitive Toolkit functions, learners, trainers and optimizers with your own algorithms in Python, C++.
Enhanced, built-in distributed readers for speech, image, and text deep learning tasks.
The ability to use TensorBoard visualizations from Cognitive toolkit! Read more here.
Pretrained models available for use.
Performance improvements.
Support of distributed scenarios in Python API. See more in the sections on distributed scenarios in the ConvNet and ResNet examples.
Support of Asynchronous Stochastic Gradient Descent (ASGD)/Hogwild! training parallelization support using Microsoft’s Parameter Server (Project Multiverso).
Support for training on one-hot and sparse arrays via NumPy.
Support of object recognition using Fast R-CNN algorithm.
Integration with NVIDIA NCCL, a stand-alone library of standard collective communication routines, such as all-gather, reduce, broadcast, etc., that have been optimized to achieve high bandwidth over PCIe. See how to enable NCCL in the Cognitive Toolkit Wiki.
Lambda rank and NDCG at 1 are accessible from Python for real this time.
Performance Profiler for BrainScript and Python.
Support in training session for cross validation and preservation of all checkpoints.
Github 地址:https://github.com/Microsoft/CNTK
相关文章: