资讯 人工智能开发者
此为临时链接,仅用于文章预览,将在时失效

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

作者:杨鲤萍
2020/02/05 19:20

雷锋网 AI 开发者按:自 AI 迅速发展以来,除互联网之外,其在医疗方面也是屡屡作出突出贡献。无论是高效的检测速率,还是高精度的诊断结果,都帮助医者大大减少了工作量,为病人夺得了更宝贵的救治时间。

就在最近全球紧密关注的新型冠状病毒战「疫」中,AI 再次发挥了其高效特性。在由浙江省疾控中心、阿里巴巴达摩院、杰毅生物共同研发的一套全新检测平台中,研究者们巧妙利用 AI 算法,最终使得病毒基因分析的速度由半天(约 8 小时)缩短到半小时!

而作为公民兼开发者的我们,尽管大多数人无法参与这次的抗疫开发实战中,但我们可以加入 AI 研习社【肺炎检测挑战赛专题】,将我们所拥有的力量,以另一种方式贡献到这次抗疫支援行动中。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

AI 能为这场战「疫」做些什么?

众所周知,要赢得这场瘟疫战胜利的关键,一方面在于通过确诊从而严密控制疫情扩散;另一方面则是特效疫苗的成功研制。而整个过程中,无论是病毒基因检测,还是疫苗研发,都需要大量的时间。

以前在面对疫情时,我们的医者只能通过人工进行长时间的反复研究、反复修改、反复检测,然后获得预期的疫苗,但现在我们有了 AI——这一能够对海量数据进行精密计算的得力助手,这将大大有利于我们提高研究效率,更快取得这场没有硝烟战争的胜利!

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

图片来源:CNBC  所有者:CNBC

根据各个机构公布的数据,新型冠状病毒全基因组序列全长 29847bp,是基因组序列最长的病毒之一。而在 2 月 1 日浙江省疾控中心上线的自动化全基因组检测分析平台中,就充分利用了阿里达摩院研发的 AI 算法,替代了原有的核酸检测方法。

相比之下,AI 检测除了将原来数小时的新型冠状病毒肺炎疑似病例基因分析缩短至半小时,大幅缩短确诊时间之外;还弥补了原有方法只能检测到病毒基因局部的局限,能够更加精准检测出病毒的变异情况。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

新型冠状病毒结构

AI 检测核心技术

在传统的病毒基因分析过程中,整个流程涵盖主要包含了:样本标记、分装;核酸提取;荧光定量 PCR 体系配制;上机检测;数据报告分析。

可以发现,其中的病毒基因的检测和分析是两种不同的工作。据了解,这次提高检测效率的核心则在于将检测的结果进行「数据化」,然后交由达摩院开发的算法进行分析。

其中阿里达摩院的一位算法专家在采访中表示,每次测序过程会产生海量的数据,基于一系列优化的算法,可以加快样本病例的检测速度;在这个环节里,算力和算法同样重要。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

达摩院算法专家顾斐博士在疾控中心基因检测分析现场

而在算法方面,具体而言,在序列比对过程中开发者增加了分布式设计,可以有效提升比对效率。而在病毒序列拼接阶段则用到了分布式设计的 de Bruijn 图算法,从而将病毒拼接的速度由 30 分钟-1 小时缩短到 15-30 分钟。

而且截止目前,检测结果还未出现不准确的情况;通过这样的检测方式,甚至变异病毒也能得到精准的检测结果。它能够对疑似病例的病毒样本进行全基因组序列分析比对,避免因为病毒变异造成的漏检情况。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

新型冠状病毒的电镜照片 图片来源:中国疾控中心

我们的战「疫」行动

通过这次 AI 抗疫,我们可以看到,AI 检测相关技术确实能够大幅缩短医生的工作量,并且提高专业诊断的效率和准确性。

本次由 2019-nCoV 病毒引发的肺炎疫情仍在持续。因此,AI 研习社(https://god.yanxishe.com/)重启「肺炎赛题」,希望大家尽量减少外出,安心在家打比赛、拿奖金、勤洗手、戴口罩;全国人民上下一心,共抗疫情。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

图片来源:AI 研习社

大赛主页提供了「肺炎 X 光片」相关的数据集,包括了训练集 20013 张以及测试集 6671 张。比赛任务即:编写相应代码,训练模型正确识别肺炎 X 光病灶数量~

开始时间:2020-02-04 09:00:00

结束时间:2020-03-05 00:00:00

大赛基础奖金池为 5000 元,除了比赛原有的三种奖项——参与奖(30%)、突破奖(20%)、排名奖(50%);AI 研习社春节红包活动仍在继续,邀请好友参赛得奖金,奖金直接划入个人账户,视同比赛奖金。以上四种奖项均互不冲突哦!

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

数据集部分图片示例

数据集下载链接:

http://1t.click/bxSW 

春节红包活动:

https://god.yanxishe.com/competition/activity/jumpPullNewer 

评审标准

最终提交结果文件如下所示,其中,第一个字段位:测试集图片 ID(注意 ID 即文件名是从 0 开始的);第二个字段:病灶数量(0、1、2、3、4)。

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

Ps:建议使用 UTF-8(BOM)编码,共计 6671 个结果,数量不足可能导致无法评分哈~

整个比赛的评审完全透明化,我们将会对比选手提交的结果文件,按照如下公式计算得分,其中:

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

每日 24:00,我们也会将最新结果更新在官网排行榜上。众志成城,武汉加油!

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

雷锋网 AI 开发者  雷锋网

长按图片保存图片,分享给好友或朋友圈

「肺炎 X 光病灶识别」挑战:面对疫情,开发者能做的还有很多!

扫码查看文章

正在生成分享图...

取消
相关文章