“得益于深度学习与人工神经网络的发展,语音识别在近些年取得了一系列突破性的进展,在产品应用上也越来越成熟。作为业界领先的语音技术,讯飞是如何处理语音技术中的难点,达到97%的识别准确率?本期AI公开课将为你深度解析语音技术中的热点——端点检测、降噪、音频压缩。”
作为一个完整的语音识别系统,最终的效果不仅由识别的算法决定,许多相关因素都直接影响着语音识别结果。端点检测就是语音识别的重要环节,也是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果,因此端点检测方法的研究一直是语音信号处理中的热点。
未经压缩的语音数据,网络交互应用中的网络流量偏大,从而降低语音应用的成功率。因此为降低存储空间和传输成本,对数字信号进行音频压缩是十分必要的。而不同的压缩技术又有各自的优点与缺点,不断优化与升级的压缩算法与技术也一直是业界热议的话题。
在现实生活环境中,语音信号在编码、传输等过程会受到各种噪声的污染,影响语音处理系统性能。语音降噪是针对噪声问题的一种有效的处理技术,那么目前业界有哪些降噪方法,能够最大程度的消除噪声的影响,提高语音清晰度、改善语音的质量?
针对以上几点大家关心的问题,本期我们为大家请到科大讯飞资深工程师李洪亮为大家讲解语音处理技术中端点检测和降噪的基本原理,一起探索音频压缩的奥秘。
课程亮点
端点检测原理
降噪原理
音频编码和解码
几种编解码库能力对比
讯飞语音云编解码库相关信息
嘉宾介绍
李洪亮
科大讯飞资深工程师
毕业于中国科学技术大学。科大讯飞资深研发工程师,长期从事语音引擎和语音类云计算相关开发,科大讯飞语音云的缔造者之一,主导研发的用于讯飞语音云平台上的语音编解码库。主导语音类国家标准体系的建设,主导、参与多个语音类国家标准的制定。
分享时间
4月27日 19:00—20:30
听课方式
视频直播
互动方式
官方微信群进行问题解答
适合人群
人工智能技术爱好者
语音技术从业者
免费参加
扫描二维码,填加课程助手小A。提供姓名、公司、职位、联系方式,分享活动预告文章到朋友圈、截图发给小A,审核通过后即可进群。