资讯 人工智能开发者
此为临时链接,仅用于文章预览,将在时失效

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

作者:杨鲤萍
2019/11/19 18:06

雷锋网 AI 开发者:2019 年 11 月 19 日,小米开发者大会(MIDC,MI Developer Conference)在北京举行,1 场主论坛+12 场分论坛,将呈现 AIoT+5G 等主题为「智能新时代」的多个领域最新技术;同时,这也是一场开源盛会。

大会现场,小米集团副总裁、技术委员会主席崔宝秋不仅正式发布了支持更丰富的异构计算算子、降低跨设备运行性能损失的自研移动端深度学习框架 MACE 0.12.0 升级版;也发布了小米自用 NLP 技术 MiNLP 1.2;还宣布了 Pegasus 1.12 已在 GitHub 上线的消息。因此,雷锋网 AI 开发者将开源内容整理编辑如下。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

更丰富算子,更低性能损失

据了解,MACE 是专门为移动设备优化的深度学习模型预测框架,MACE 提供工具和文档,帮助用户将深度学习模型部署到移动电话、平板电脑、个人电脑和物联网设备上。

通过这一框架,小米可在移动端布局各类深度学习应用和算法,包括计算机视觉、语音识别等。据小米不完全统计,MACE 每天被调用 5000 万次。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

MACE 从设计之初,便针对移动设备的特点进行了专门的优化,例如:

更多详细可参考《小米开源自研移动端深度学习框架MACE》:

https://www.leiphone.com/news/201806/5PYJx9sVJDURvwpj.html

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

MACE 计算框架的整体结构

而现在,MACE 支持的应用场景大大增多,包括:AI 单摄、图片风格化、场景识别、图像超分辨率、翻译以及语音等。它针对移动芯片特性进行了大量优化,目前在小米手机上的人像模式、场景识别功能中已广泛应用。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

用 MACE Model Zoo 中的 fast style transfer 模型在手机端生成的风格化图片

这次的升级,MACE 0.12.0 主要从以下四个方面入手,使其在实际应用中有了更大优势:

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

其中,框架已支持的语音识别系统 Kaldi 是由 Daniel Povey(日前刚出任小米集团语音首席科学家)主导开发的开源语音识别系统,在众多语音识别测试和应用中有广泛的使用。

据介绍,MACE 已经支持大部分 Kaldi 系统内组件,以及 ONNX 形式的的 Kaldi 模型。此外,项目还提供了 Kaldi-onnx 转换工具。

值得注意的是,小米也在大会上公布了 MACE 近期(未来一两个月)的规划:

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

崔宝秋也表示,在未来小米将继续加大在 Kaldi 上的投入,帮助打造一个国际化的开源社区,进一步引领开源的语音识别技术。

Github 地址:

https://github.com/XiaoMi/mace 

文档地址:

https://mace.readthedocs.io/en/latest/ 

MACE Model Zoo 项目地址:

 https://github.com/XiaoMi/mace-models 

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

其它开源内容

MiNLP 1.2

今年年初,小米 MiNLP1.0 正式发布,该平台是小米基于声学自主深耕平台,在小米开发者大会上,崔宝秋表示小米 MiNLP 平台每天调用次数达到 60 亿次,然后正式发布 MiNLP 1.2。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

新版 MiNLP 1.2 平台相较之前主要有两个重大更新:

另外,新版平台也可以吸收和集成当前的前沿进展,并进行技术创新;同时,新版平台所支持的业务也进行了全面拓展,目前可支持公司的多项业务。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

Pegasus 1.12 

Pegasus 是一个分布式 Key-Value 存储系统,最初是用于弥补 HBase 在可用性和性能上的不足。

Pegasus 系统的 Server 端完全采用 C++ 语言开发,从而避免了使用 Java 所带来的 GC 影响和虚拟机开销;同时,它也使用了 PacificA 协议支持强一致性,使用了 RocksDB 作为单机存储引擎。由于不依赖外部文件系统,Pegasus 的 IO 路径更短,延迟通常更加稳定可控。

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

模型设计上,Pegasus 则采用了哈希分片进行数据的拆分,分片(Partition)是系统内部数据迁移的最小单元,每一分片内的数据有序存储,各个分片之间数据隔离,每个分片对应一个单独的 RocksDB 实例。

它也可看做是 HBase 和 Redis 的结合体,保证了高的可用度,也具有好的伸缩性。如果业务对性能的要求不是太高(譬如 P99 要求在 1 毫秒以内),那么 Pegasus 将是个不错的选择。

对于升级后的 Pegasus 1.12,其性能变化主要有三点,包括:

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

目前,Pegasus 1.12 则在提供一系列丰富的功能支持,如:快照冷备份、表的软删除、表级写限流等的基础上,有了更完善的高可用、高性能、强一致、易伸缩等性能。

Pegasus 1.12 Github 地址:

https://github.com/XiaoMi/pegasus 

更多关于 Pegasus 

https://pegasus-kv.github.io/overview/ 

雷锋网 AI 开发者

长按图片保存图片,分享给好友或朋友圈

Kaldi 之父加盟后的小米开发者大会:亮眼 AI 开源项目逐一盘点

扫码查看文章

正在生成分享图...

取消
相关文章