资讯 业界
此为临时链接,仅用于文章预览,将在时失效

百度大脑,“上新了”!

作者:赵晨希
2019/03/26 14:22

前不久,百度大脑推出了包括语音技术、视觉技术、自然语言处理、知识图谱等在内的通用AI能力,以及开源深度学习框架方面的优化升级。与此同时,人工智能已经连续三年进入政府报告、“智能+”成为2019年行业的新命题。

雷锋网了解到,百度大脑自2016年启动开放以来,目前已经是服务规模最大的AI开放平台。共计开放了158项AI能力,24小时快速集成,开发者数量超过100万。面向广泛的企业和开发者提供最先进、最全面的AI能力,不断降低AI应用落地的门槛。

语音方面

在今年1月的百度输入法探索版发布会上,首次发布了领先国际的语音技术:在线语音领域全球首创的流式多级截断注意力模型SMLT「Streaming trancated multi-layer attention」。值得注意的是,这是首次在大规模语音识别工业界采用注意力(attention)模型。

提升识别率的同时大幅优化了解码速度。“语音识别极速版”,拥有更快的响应速度,相对识别准确度提升15%。此项语音能力在API调用方式下,实时率小于0.1,意味着5s的音频不到500ms即可完成识别过程,减少了识别音频所需的耗时,提升语音交互的响应体验。

百度大脑,“上新了”!

在近距离安静环境下,识别准确率可达到98%,同时支持略带口音、童声、耳语的识别,使语音识别应用更加广泛。多平台的SDK也即将推出,使APP、服务器端更可实时识别,应用这一领先技术。目前,每个开发者账户将赠送5W次免费调用量,针对新能力的使用者,也即将推出一系列赠送及优惠活动。

同时,近场语音识别升级了预置语义解析。预置场景由35个升级为51个,包括天气、航班、电话、电影播放、页面屏幕控制、电视剧、美食、手机设置、通用录、提醒、短信、故事等,语义解析效果全面优化,80%优于原有解析结果。

百度大脑,“上新了”!

百度大脑称以下新品也将推出,例如:语音识别自训练平台,支持自动评估选出最好的基线模型,仅上传业务场景文本语料即可训练语言模型,零代码自助训练专属的语音识别模型,极大地方便语音开发者提升所在业务场景的识别准确率,满足业务上的语音识别需求。

另外,远场语音开发套件,可快速进行远场识别开发评估,此套件应用于机器人、儿童故事机、家电、车载设备等硬件。同时还将开放离线合成,以及推出更多音库。

视觉方面

首先,在OCR方面:

对已有的OCR能力也进行了功能升级:表格识别:支持合并单元格、无表格线等复杂样式;iOCR 自定义模版文字识别:支持列宽不固定、有合并单元格的表格样式的定制识别;驾驶证识别:支持驾驶证副页的识别。

百度大脑,“上新了”!

百度大脑,“上新了”!

百度大脑,“上新了”!

百度大脑,“上新了”!

其次,在车辆分析方面,推出包括车辆检测、车流统计、车辆属性分析和外观损伤识别。

百度大脑,“上新了”!

最后,在人脸人体识别方面,新发布了情绪识别,可以准确识别7类情绪:生气、害怕、厌恶、高兴、悲伤、惊讶、无情绪。

此项技术可应用于幼儿园安全监控等场景,通过监控孩子的心理状态,判断教师和幼儿是否有异常状况,从而保障幼儿安全、及时预警并参与辅导等。

同时,人脸融合以及手部关键点将在3月推出。此外还有2项功能全新升级,包括:人脸检测快速检测人脸并返回人脸框位置、定位五官与轮廓关键点数量,从72个增加至150个;新增2种手势,共24种常见手势,整体识别率在90%以上,使得手势识别更丰富、更准确;而即将上线的更高进精度的人像分割,可应用于人像美图、影视后期等场景。

百度大脑,“上新了”!

图像识别方面,新增红酒识别和地标识别这2个新能力。通过红酒识别,用户只需要对着红酒标签拍照,系统就能自动识别红酒的品牌和名称,目前可识别数十万种国内外红酒,识别准确率98%以上,从法国波尔多到中国张裕,商品信息都能得到准确关联。

地标识别则能够精准识别约5万中外著名地标、景点,准确率高达94%以上。用户只需要拍摄包含国内外著名景点、地标的照片,系统就能自动生成足迹、图文博客等有意思的交互内容。

百度大脑还宣布即将上线邀测钱币识别功能。该功能可以精准识别中外钱币,支持数百类币种、数千种面额,识别准确率98%以上,不仅能够提升金融机构货币兑换的效率,也能让“外币骗局”无处藏身。目前,百度大脑的图像识别种类已经多达11种。

百度大脑,“上新了”!

语言及知识方面

雷锋网了解到,百度大脑语言及知识方向能力集,共包括语言处理应用平台、语言处理应用技术、语言处理基础技术、知识理解以及知识图谱。

语言处理应用技术方面,推出新能力:

在知识理解方面,推出新能力:

不久后,智能写作平台也将上线,将从素材上为创作者提供工具、帮助找到灵感,提升创作者的写作效率和产出质量,降低写作成本。

百度大脑,“上新了”!

深度学习

雷锋网了解到,2016年,百度开源了深度学习框架PaddlePaddle。近期,百度大脑对PaddlePaddle进行了更新:

推出深度强化学习框架PARL1.0,支持可定制的并行扩展,覆盖DQN、DDPG、PPO、A3C等主流强化学习算法。通过8块GPU拉动近20000个CPU节点运算,将近5个小时迭代一轮的PPO算法加速到不到1分钟。

百度大脑,“上新了”!

长按图片保存图片,分享给好友或朋友圈

百度大脑,“上新了”!

扫码查看文章

正在生成分享图...

取消
相关文章