小鱼易连袁文辉：视频云平台语音交互不同于智能音箱

袁文辉小鱼易连

作者：吕倩

2018/05/21 07:20

小鱼易连袁文辉：视频云平台语音交互不同于智能音箱

这一次，小鱼易连将云视频运用到教育领域。

5月17日，小鱼易连和高思教育，合作发布肩膀计划，利用小鱼易连“云+AI”技术推进教育信息化变革，同时整合优秀教育资源。

1、

具体技术支持上，肩膀机会背后是一整套远程双师课堂技术解决方案作为支撑。小鱼易连作为远场音视频云识别的解决方案提供商，通过远场音视频云识别能力保障双师课堂生动流畅效果；同时动态调整不同网络带宽下音视频质量，依靠核心音视频算法保障授课、听课端教室在互联网丢包环境下顺利上课；标准化的统一部署方案保障大规模的方案复制。

袁文辉表示，小鱼易连远场音视频云识别解决方案的核心技术之一，就是防丢包。

所谓”丢包“是指在通信中是指通信数据包丢失。数据包的传输，不可能百分之百的能够完成，因为物理线路故障、设备故障、病毒攻击、路由信息错误等原因，总会有一定的损失。当线路较差（如用调制解调器），数据的损失量就会非常大，补包工作也不可能百分之百完成。在这种情况下，数据的传输就会出现空洞，造成丢包。

袁文辉对雷锋网表示，过去DVD一旦有了划痕，日本款DVD机就播放不出来了，但是国内产品可以——因为国内厂商具备超强纠错技术。袁表示，以前的视频技术都是基于传统专线，不会丢包，设计的时候便也没有考虑过丢包问题。

小鱼易连的核心策略，是通过优化音视频编码、构建新的媒体服务架构和信令系统、优化网络传输和网络部署。其中就包括抗丢包能力、 SVC 技术、网络上传技术、纠错技术等，在网络丢包30%的情况下都能确保视频不卡顿。

2、

此外，相比于视频，袁文辉表示，声音处理技术难度更高。

但就本质而言，袁文辉对雷锋网表示，小鱼易连的核心壁垒并非某项技术，而是构筑墙固的生态圈——目前，小鱼易连正通过构建全球互联的视频云平台，打造“云+端+服务+业务”服务生态。提供视频会议、远程教育、远程医疗、远程金融及远程政务等服务，实现人务互联。

针对高思教育为什么会选择小鱼易连这个问题，其实很明显可以发现，双方背后站着共同的投资人——李开复。他在现场表示，小鱼易连特别强大的技术就是在现有互联网上能提供非常高清的视频，在120寸电视上用外国友商十分之一、二十分之一成本达成这样的技术。以后凭借增强现实，可以帮助学生拉近与老师的距离。

但在具体技术方面，仍有很多不足要改进，包括像人脸识别，对数据的积累，对学生学习数据的积累，数据的补足可以帮助在课上提供好的技术解决方案，比如当学生回答客观题或主观书写部分时，通过手写识别，可以看到学生的答题过程与思路差异，对一个学生更长时间的数据积累，可以使得对其的画像更加到位。另外，整个对学生像AR技术的使用上，其实AR技术本身也在不断逼近真实，我们也跟进先进的技术，使线下比线上更加逼真，符合学生的认知。这是我们在后续持续不断努力的一个方向。

袁文辉表示，更多需要突破的技术主要集中在收集更多数据处理分析上，尤其像视频数据上课的过程是海量的数据，我们每节课都是录下来存在云端，但是这些都是非常难以处理和查找的，现在通过AI的方式把非结构化的数据结构化，将来你想看某个学生在整个课堂从头到尾集中精神多少分钟，走神多少分钟，今天的技术很难实现，但是在未来查类似的数据很方便，因为人工智能会帮助你，把非结构化做结构化的处理。

其次，在袁文辉看来，语音是比视频更具难度的技术领域，具体包括回声消除、回响消除、自动声音控制、噪音抑制这些机制全面组合在一起，才能形成高保真远程面对面的传输。

而类比目前正火热的智能音箱语音交互技术，袁文辉对雷锋网表示，两者是完全不同的方向。智能音箱通过麦克风达到比较好的性噪比，声音要唤醒或者语音识别，说话声音要比外面的噪声超过一定的比例，才能识别出来。并不需要靠声音回声消除，说话声音放大到最大，别的声音都可以被抑制掉，不用考虑回声消除的问题。而小鱼易连要解决回声消除跟远端交互难度更大，当然这是两个不同的方向。

未来，袁文辉对雷锋网预测，小鱼易连将具体运用到智慧法庭、智慧政务、公安、司法、医疗、教育等不同领域。