资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

作者:黄楠
2023/06/30 19:11

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

我们搭乘在数字化高速前行的列车上,大数据精准推荐、AI解决一大部分繁复工作、智能家电提供便捷居家服务......人工智能发展给我们的生活带来更多改变。

但在社会的角落,有这样一群人,或因身体机能老去、或因生理条件不允许,这些障碍人士成为数字世界中的弱势群体。

驻足在自助办理机前进退两难的老人;因为环境嘈杂,在火车站入闸口听不清安检指令的听障人士;看不清公交提示错过站点的视障者......他们似乎被快速变化的数字时代遗忘了。

如何越过障碍,将科技力量平等惠及每个角落?

近日,《无障碍环境建设法》颁布,这是我国首次就无障碍环境建设制定专门法律。立法次日,腾讯与中国残联公益组织签署战略合作协议。未来五年,双方将在无障碍环境建设多个领域展开探索。

在这场翻越障碍的探索中,腾讯找到了新方向——下一代互联网技术。这是包括人工智能、大数据、游戏科技等在内的前沿科技。腾讯正积极将下一代互联网技术,应用于无障碍领域。

前沿技术如何与无障碍结合?突破口在哪里?实现了哪些创新应用?在公司内部数个业务团队,多领域实践中,腾讯无障碍的技术路径成形了。


“假摔”筑起防护墙


北京海淀银科大厦一间不足20平米的办公室,聚集了七八个年轻的算法工程师。室内地面只铺了两层薄薄的褥垫,几个人排着队,轮流上前,以各种不同的姿势摔倒。这一次次正面摔、侧身摔的“摔倒”数据,都被王楠认真记录下来。

王楠是腾讯SSV (可持续社会价值事业部)银发科技实验室运营负责人。2017年,在深圳市政府及民政局邀请下,腾讯与之合作开始搭建智能养老研发团队。王楠带着成员调访了数十家养老院。

团队了解到,养老领域普遍存在的痛点主要有两方面:一是人力稀缺,人员素质良莠不齐,稳定性不高;二是事故责任认定不清。其中,老人摔倒事故在责任认定不清方面占据极大比重。

目前,国内大部分养老院床位约一千个,在人力稀缺的情况下,单个护理员难以同时兼顾数十个老人的看顾,一旦老人发生跌倒或意外,会导致无人救助或救助延迟,从而直接错过最佳救助时间。同时,老人摔倒是由于自身的身体问题、亦或是院方的责任,也亟需科技的手段来帮助完成场景追溯。

没有过多犹豫,王楠便敲定将摔倒作为技术团队探索的首个场景。

但进入研发阶段,问题也随之出现了。王楠发现,在老龄化领域的科技应用上,全球当前仍处于初级阶段,如养老机构、社区、居家等场景都是一个需要不断学习和调整适应的阶段。这直接导致了数据缺乏问题。不管什么场景,王楠团队的数据获取量几乎为零,无法实现人体姿态检测,难以支撑起一个简单的AI算法研发。

这个发现给王楠团队“倒”下了一盆冷水。怎样才能在短时间内获取真实可靠的样本数据?她想到了用“假摔”积累样本的方法。

这个想法听起来有些“异想天开”。毕竟只有七八人的团队,就想摔出成百甚至上千数据,这是个不小的挑战。但团队成员并没有质疑或怨言,反而每个人都积极加入“腾讯试摔官”队伍。

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

“试摔官”们在不同场景测试摔倒

为了积累许多不同的数据,他们尝试着用各种角度、姿势、速度和时长进行摔倒测试,因此也就有了开头的那一幕。几乎每隔一段时间,就能看到银发科技实验室的工程师们挤在一个小小的房间里,排着队轮番朝地上摔倒,解锁各式各样的姿势。

也正是有了这成百上千次的“假摔”后,王楠和团队把“隐形护理员”摔了出来。

“隐形护理员”融合了腾讯的AI技术,通过摄像头和AI姿态识别的算法能力,可实现无感知、全方位、及时准确地发现老人可能出现的摔倒意外事件,在照护老人身体健康的同时,也降低了护理员等照护者的压力和工作强度。

之所以选择用摄像头作为硬件载体,一方面是因为其性能更稳定,另一方面也考虑到产品的适配性和普惠性。王楠表示,“我们希望通过腾讯技术的公益赋能,让智能产品性能更优、普惠性更强,让更多的老年人受益于科技助老的产品和服务。”

在技术推向产品落地的过程中,往往要面临更大规模、不同场景、多交互等情况,为此,银发科技实验室研发团队以个人家庭和养老院这两大代表性场景,在“隐形护理员”中设计了两个不同的解决方案:

其中养老院版本,提供隐形护栏、跌倒监测、火灾报警、轨迹还原等服务,主要扮演辅助看护角色,帮助提高机构场景下养老服务的看护效率和专业度,例如在隐形护栏功能中,当老人夜间离床、离房,或是有非机构人员闯入时,系统会在第一时间告警并通知看护人员,保障老人安全。

而居家版本,包括摄像头跌倒检测、呼救词检测、双向语音通话以及摄像头实时监测功能,以预防老人在独居或者子女不在家的情况下,一旦发生摔倒或其他意外事件,无人救助或救助延迟而错过最佳救助时间的情况。

王楠告诉雷峰网,“隐形护理员”双向语音通话功能,其使用远超出原本的产品设想。他们在调研中发现,无论是养老院还是居家养老,许多老人都很喜欢用摄像头与家人或护工聊天,一个监测工具在日积月累中转变成了老人联结外界的的情感纽带。

AI之外,技术不是冷冰冰的名词,科技的力量正成为解决养老问题的重要手段,在保障老年人生存安全、改善老年人生活质量的同时,已逐渐成为了温暖老年群体精神世界的慰藉。


让“听清”提升四成



对老年人来说,听力下降伴随着老去缓慢发生。除此之外,中国还有近3000万听障人士,他们长期生活在暗淡的“无声”世界里。

1969年,世界上首款可穿戴式的人工耳蜗问世,作为治疗重度和极重度听力障碍最有效的方法,人工耳蜗技术经过多年发展,如今被国内的听障群体广泛认知和接纳,帮助许多听障人士实现从“无声”到“听见”的跨越。

但是,在商场、火车站、机场等较为嘈杂的公共环境中,他们有时仍面临着“听不清楚”的问题。如何实现从“听见”到“听清”的进阶,腾讯会议天籁实验室关注到这一问题。

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

搭载腾讯天籁AI音频技术的天籁inside助听器

作为腾讯会议旗下专注音频通信技术研究的团队,天籁实验室也希望探索用技术服务反馈社会的可能。腾讯天籁实验室主任商世东曾带着团队四处寻访,在同许多听障人群的交流中,他深刻地感受到听障人士对解决“听清”困扰的紧迫性。

腾讯天籁实验室有技术,也有优秀的工程师人才,但对于哪些技术适用,需要提供怎样的方案或产品等等,这是他们不擅长的。天籁实验室需要找到更了解听障者的团队,来帮助他们回答这些问题。

在联系多家人工耳蜗厂商无果之下,偶然一次活动中,商世东团队经人介绍,认识了诺尔康神经刺激科学重点企业研究院副院长黄穗。黄穗从事人工耳蜗产品研究多年,对存在的问题和痛点有深刻见解。

彼时,黄穗正为如何解决人工耳蜗在不同场景下识别成功率低的问题四处奔走,腾讯天籁实验室的到来,无异于雪中送炭。

双方在合作目标上出奇一致,第一次见面,就敲定了两个合作方向:首先,提高场景识别技术在应用场景中的成功率;其次,共同开发一款App,借助手机更强大、便捷的处理能力,对所采集的语音信号进行预处理,通过蓝牙传输至人工耳蜗,以进一步改善听觉效果。

但现实的问题很快就出现了。

对于视频会议产品,决定用户体验的关键因素之一是声音净化。为此,腾讯会议天籁实验室在采集了上千小时的语音噪声数据后,利用天籁AI算法和深度学习能力,成功消除300余种噪音,为用户提供了清晰流畅的语音体验。

可团队发现,天籁音频AI技术在解决会议场景下的问题效果很好,但将算法迁移到人工耳蜗中,由于使用习惯、听觉限制等因素影响,算法的复用效果并不好,听障用户使用感受不佳。

例如,处理环境声降噪时,为了达到最纯净的声音体验,研发团队将噪音降至最低,经听障者体验后反馈,过度降噪导致了声音失真,反而听起来很不舒服。

为此,天籁实验室的成员们必须将算法重新打磨,调整一个新版本给到黄穗放入研发软件内,再给到用户测试和收集反馈。重复的流程经历后,才最终提出一个适用于听障场景的方案。

经过一年多的努力,腾讯会议天籁实验室与黄穗团队,共同解决了国内首个突破人工耳蜗动态实时噪音处理的难题,帮助佩戴人工耳蜗的听障人士在语音清晰度、信息可懂度上提高了40%。

在解决听障人群难题上,AI的能量远不止于此。

目前,急救知识尚未大规模普及,在急救能力缺失、急救器械配备不足等情况下,难以有效满足全部的急救需求。当突发性疾病发生在听障人士身上时,由于无法独立拨打120,必须求助他人,分毫拖延都可能给听障者的生命安全带来巨大风险,耽误最佳的急救时间。

为了改善呼救流程,提高对听障者的急救效率,腾讯应急开放平台在2021年推出“无障碍急救”小程序:当发生危险时,听障人士可以使用小程序进行文字报警,系统会自动将文字转译成语音拨打至本地的120急救中心,并将位置同步传输至120,减少沟通环节、提高急救效率;随后调度人员的语音回复,系统也会将回复同步转译成文字、发送给报警人,从而实现听障者独立急救报警。

AI的力量正在渗透听障群体生活的方方面面,在解决少数者生存、生活等问题中挖掘科技工具的可能性,提高听障人士的生活质量,保障他们生存和拥有幸福的权利。

与此同时,AI也在不断深入另一个障碍群体——视障人士的生活中。


用“触摸”破解难题


“盲人们一直拥有一个顽固的认识,他们把有眼睛的地方叫做主流社会。”这句出自电影《推拿》的旁白,直击了隐身于大众社会背后视障群体的真实生活。

世界卫生组织报告显示,目前,全球视力受损或失明人群已超过22亿,仅我国就有1700多万视障人士,大约每80人中就有一人面临视力问题。他们或许无法看到物理空间的图案,但每个人的世界都是丰富多彩的,只是人们鲜少去关心,他们的生活轮廓究竟是怎样的。

出行,是视障群体主动迈向“主流社会”的第一步,而出行的体验如何,不仅关系到他们后续对外的互动交往,同时也制约着其个人生活方向和职业选择等。

不可否认的是,无障碍意识在国内尚未广泛建立,视障群体的出行安全难以得到充分保障。举个例子,在办公楼、教学楼等公众建筑都有无障碍坡道,视障或肢障人群可以通过坡道进入建筑内,但现实的情况是,很多驾驶电动车或自行车的人,会不自觉地将交通工具停在坡道口造成拥堵,以至于真正有使用需求的人士无法利用。这就是一个无障碍的意识问题。

在腾讯,有个团队正尝试用触觉反馈技术改善视障群体的生活体验。鲜少有人知道,触觉反馈最早是一项为游戏而研发的技术。游戏是一个多模态互动的行为,涉及到视觉、听觉等多个触觉感官。2019年,腾讯游戏MTGPA团队探索触觉反馈技术,为游戏中的角色、武器、载具等超过200个场景开发了专属的振动效果,该技术于2021年4月在《和平精英》中得以应用。

同年10月,一次与障碍用户的交流中,MTGPA团队了解到这部分人群正面临着艰难的出行安全问题。他们开始思考,团队在游戏世界中的技术发现,能否被应用在解决障碍用户出行这一场景?

很快,MTGPA团队联合腾讯志愿者协会、深圳市信息无障碍研究会,针对障碍人群展开数次用户需求调研,他们进一步了解到,不仅仅是出行,障碍人群在日常的浏览资讯、来电接听、社交互动等场景中也面临着许多难题。

随即,团队基于触觉反馈技术迅速做出了一款方案给到视障用户体验,令他们惊喜的是,方案得到的反馈出人意料地好:上手没有难度,甚至反馈速度比听觉更快更直接。这也给予了MTGPA团队投入服务视障人群项目中的决心。

为了使这套触觉反馈方案更加契合障碍人群的使用场景和需求,拥有扎实科研能力和技术沉淀的高校成为MTGPA团队合作的选择。他们找到东南大学宋爱国教授团队合作,共同打造面向手持设备的振动测试平台,根据六点盲文规则、设计了一套与六点盲文编码规则匹配的无障碍振动方案。

不仅如此,MTGPA团队还与腾讯搜狗输入法、腾讯地图等团队合作,将触觉反馈技术在步行导航方向提醒、公交出行到站提醒、触觉输入三个场景实现了落地应用。据腾讯游戏技术运营部总经理刘栖铜介绍,仅需20分钟到半小时,视障人士即可了解振动触觉反馈的使用方法。

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

腾讯搜狗输入法触觉输入键盘示意图

具体到应用场景中,研发团队对输入法键盘中的锚点字符,如“删除键、S、G、K”等字母键处引入不同的振动效果,使视障用户可以通过特殊的振动、迅速辨别所触碰到的字符内容,解决了仅依靠听觉获取信息的单一途径,提高了障碍群体的信息安全性。

比如,当时视障人士在嘈杂环境下输入密码时,依靠读屏语音,可能会导致密码泄露,影响账户和资金安全。而借助触觉反馈技术,即是在不便使用声音反馈的情况下,视障人士也能通过触觉来输入或修改密码,保护个人隐私同时,提升输入的效率和准确度。

此外,触觉反馈技术也与腾讯地图的步行导航偏移矫正、公交地铁导航振动提醒两大无障碍场景结合。

步行导航时,当视障人士的方向与导航路线出现角度偏差,腾讯地图会以振动提醒协同语音播报,距离指针方向越近振动越轻,距离目标方向越远振动越强烈。

当视障人士搭乘公交出行时,系统也提供了“到站候车、即将到站、到站、到达目的地”四种不同场景的定制振动效果,以准确获取站点信息,提醒用户下车。

在游戏世界中发现技术应用更宽阔的可能性,MTGPA团队利用触觉反馈技术,为障碍群体解决了生活场景中的部分困扰,让视障人群得以更“平等”地融入到数字时代。


无障碍的技术路径


如今,我们身处在数字化转型的时代浪潮中,社会前进和技术发展已经无法脱离数字行为。技术发展与社会进步,“无障碍”在当下也被扩展了更多含义,包括信息无障碍、无障碍环境建设以及无障碍社会。

数字技术已经成为无障碍建设的基础支撑。找到一条从无障碍需求发掘、技术应用,到成果转化的成熟路径,势在必行。

2007年,一个特殊的需求,给到了腾讯QQ的产品经理,让他们意识到竟然有一批依赖盲写和读屏软件使用QQ的用户。彼时,QQ刚刚在登陆环节加入验证码等安全机制。没想到,这一保护账号安全的功能却成为了视障用户的使用障碍。

因为无法独立通过验证码,盲人用户只能求助他人。在那个用户反馈机制还不完善的年代,这群视障用户只能求助中国盲人协会。

通过协会,腾讯收到这一需求,并很快给出解决方案:由盲协支持,将部分盲人用户的QQ账号加入无需验证码的白名单。这一看起来相对原始的解决方式,也成为腾讯信息无障碍建设的开端。

过去十六年,腾讯针对所有产品自发做了无障碍改造,还开发了40多项专门的功能和产品,为所有障碍人士提供服务。在此基础上,腾讯还将研发成熟的技术,以技术开源、专利开放等方式,对外输出。

2022年1月,由中国残疾人辅助器具中心指导,腾讯搜狗输入法联合多方发起“众声”无障碍输入公益计划,基于搜狗输入法、腾讯技术公益的无障碍技术积累,搭建无障碍输入开放平台,向全行业免费开放视障输入、肢障输入、长辈输入、AI手语翻译等技术解决方案。

天籁实验室也在持续面向听障领域的开发者、设备厂商、NGO等,开放腾讯会议的天籁音频AI技术,提升助听设备降噪效果。近期,腾讯还向社会免费开放了四件“触觉反馈”无障碍技术专利,通过专利开放许可方式,推动前沿技术在无障碍领域更广泛落地。

如今,腾讯还与中国残联公益组织成立无障碍联合创新实验室。基于这个平台,腾讯计划面向社会招募1万名障碍用户,作为产品体验官,共创式参与无障碍产品研发,探索技术创新应用场景。此外,这个实验室还会沉淀更多无障碍数字化服务,陆续对外输出,实现社会多方共创,构建信息无障碍。

数据显示,中国残障人群总数已超过8500万人,包括视力障碍人数1200多万,肢体障碍人数超2500万,还有超2.64亿60岁及以上老年人。无障碍事关3亿人群,需要更多企业、机构等社会力量参与。

十六年,腾讯走出一条从自发到共创的无障碍技术路径。

技术发展是一个持续迭代的过程,在推动社会进步同时,科技之手可以拨开笼罩障碍群体头顶的乌云,让向善的火炬照亮更远、更广阔的地方。

(雷峰网(公众号:雷峰网)雷峰网)

长按图片保存图片,分享给好友或朋友圈

腾讯要用下一代互联网技术,帮助 3 亿人跨越障碍

扫码查看文章

正在生成分享图...

取消
相关文章