【 图片来源:Nature 】
近日,美国FDNA公司在国际知名医学科研期刊《自然医学》(Nature Medicine)上发布了题为《使用深度学习识别遗传疾病的面部表型》(Identifying facial phenotypes of genetic disorders using deep learning)的论文。论文阐述一个名为DeepGestalt的计算机视觉系统,能够通过面部识别诊断遗传疾病。论文表示,目前DeepGestalt已经能够诊断200多种不同的遗传综合症。在用三项典型遗传疾病对系统进行测试的过程中,DeepGestalt表现出优于临床医师识别遗传疾病的能力。
AI“面诊”罕见遗传疾病
论文提到,遗传疾病综合症影响了世界范围内8%的人口,许多综合症具有可识别的面部特征。例如患有德朗热综合症(Cornelia de Lange)的人往往有小鼻子和拱形眉毛;天使人综合症(Angelman)的异常表现是白皙的皮肤和头发。
FDNA是一家位于波士顿的数字健康公司,该公司的研究人员搭建了一个名为DeepGestalt的人工智能系统,该系统利用计算机视觉算法分析面部照片,凭借面部特征识别遗传疾病。
迄今为止,DeepGestalt已经分析了超过15万例病例。FDNA公司通过建立一个名为Face2Gene的智能手机应用程序,利用社区平台来积累数据,训练DeepGestalt。临床遗传学家可以免费使用该平台,在经患者同意的前提下将患者面部图像上传到平台。此次DeepGestalt研究中包含216种不同的综合征的17,000张诊断病例图像数据,就是由Face2Gene提供。
据雷锋网了解,此次研究人员利用DeepGestalt对德朗热综合症和天使人综合症进行两项测试。测试结果表明,当任务是区分患者是否患有某一种遗传综合症时,Deepgestalt的准确率超过90%,击败了专家临床医师,通常医生在类似测试中的准确率约为70%。在502张显示92种不同综合症患者的图像上进行测试时,Deepgestalt用了90%的时间对图像做出10种可能诊断,从而确定了目标疾病。
另外,研究人员还使用该模型对第三种称为努南综合症(Noonan)的不同遗传形式进行分类。在努南综合症患者的图像实验中,Deepgestalt需要测试出努南综合症中五个特定基因突变因素中哪一个致病因素最高。这项测试中,软件的准确度稍差,命中率为64%,但仍然比随机猜测的20%命中率要高得多。
在有些专家看来,DeepGestalt这类算法并不是识别遗传疾病的灵丹妙药。西奈山伊坎医学院教授和努南综合症专家Bruce Gelb博士表示,DeepGestalt是在年幼儿童的有限数据集上开发和测试的,可能难以识别老年人。另外也有声音质疑DeepGestalt存在种族歧视,算法对白种人的疾病识别率比黑种人识别率要高得多。
FDNA似乎意识到了这些缺点,因此该公司将DeepGestalt称为“参考工具” ,与其他人工智能软件一样,它可以帮助而不是取代人类诊断。
牛津大学(University of Oxford)专家克里斯托弗·内尔·克尔(Christoffer Nellåker)也表示,“这些极为罕见的疾病,诊断过程可能需要很多年。对于某些疾病,DeepGestalt将大大缩短诊断时间。对于其他人来说,它或许可以增加一种找到其他患有这种疾病的人的手段,从而有助于寻找新的治疗方法。”
录音也可判断遗传疾病
雷锋网了解到,在诊断遗传疾病这件事情上,除了FDNA公司的面部识别方式,还有一些团队在关注人类声音中传递的遗传信号。
2017年,威斯康星大学麦迪逊威丝曼中心(University of Wisconsin–Madison’s Waisman Center)和威斯康星发现研究院( Wisconsin Institute for Discovery)研究得出仅靠5min录音判断某个人是否易患遗传疾病以及相关的并发症的系统。
雷锋网了解到,X染色体易损综合症的主要特征是智力下降和身体残疾,目前全世界有数百万人口携带突变前期脆弱的X染色体。具有这种特征的染色体会增加神经退行性疾病、不孕不育等病症的风险,此外携带该染色体的人群的后代也容易发生脆性X染色体综合征(fragile X syndrome)。
研究人员利用机器学习能力分析数百种语音记录,能够准确地识别携带突变前期的脆弱的X染色体的个体。
基于录音和机器学习算法,研究人员创建了语言和认知功能的列表,例如记录中的句子的平均长度或填充暂停的数量,音标的发音方法,这些特征可以有效区分出两组的不同。然而目前看来这项研究还不适合被临床使用,根据之前实验表明,这类录音机器学习算法仅能达到81%的区分准确性。