近日,遗传学家与程序员组成基因组学与健康全球联盟,联合开发互联网DNA信息交互的协议。这一成果将可与HTTP传输协议对网络的重要性相比。
团队展示的第一个成果为是一个简单的搜索引擎,它将储存在9处的包含数千人类基因组的DNA文献进行梳理,其中就包括了Google的服务器群。团队表示,这个搜索引擎是DNA网络的开端,并最终将无数基因组连接在一起。
此前,由于基因组数据大多储存在私人数据库中,受法律许可协议所限制,也受限于隐私权的桎梏,部分科学家出于对自身科研的保护,自私地将数据私有,基因信息无法得到共享。因此50名科学家在万维网联盟(W3C)之后,组成了这个联盟。
团队的研究成果可以说是一种可以交换基因信息的互联网语言。
现在正在开发的是应用程序接口API,可以使不同基因数据库之间实现信息交互。将不同的基因信息综合起来,有助于加快发现基因是如何影响人体,并帮助医生通过将拥有疑似基因突变的儿童与已有病例进行比对,诊断罕见的先天畸形。
由于基因解码的成本降低,近两千美元就可以测量基因数据,而现在是时候采取一些行动了,发挥数据价值了。
由于遗传学家需要搜索更多的人的基因信息,因此基因组数据的储存成为一大难题。他们用一百万名志愿者的DNA信息来搜索有关精神分裂症、糖尿病以及其他疾病的相关基因。然而即使已有这么多的数据仍不足以发现什么遗传规律。科研需要成千上万的基因组信息,另外也没有任何独立的数据库足够大。
而解决的方法就是网络,它能为科学家获取数据库开辟了一条途径。目前,团队已经着手将全球最大的乳腺癌BRCA1,与BRCA2基因信息数据库连接起来,还包括九个可能导致罕有儿童疾病基因的独立数据库。
团队将会陆续公布这款软件,希望使得任何科学家能对任何实验室拥有的基因数据进行共享,不用受到技术壁垒及隐私权的限制。
今年三月,团队开始了一项测试,看科研机构是否愿意共享数据。一个取名Beacon的产品使得数据库拥有者将数据严格限定在几个搜索引擎内分享。目前为止,Beacon适用于15个数据库,其中三个为Google拥有的公共基因组。
未来会有一种协议可以搜索到更多数据,但是并不是以任意的方式。科学家们必须要注册或者甚至签署协议合同。如果想要获取全部的基因组,用户还需要输入联系方式。
同时这项联盟正在推进的一个变化是一种新的知情同意书,列出了交出基因组的志愿者的权力。这份同意书涵盖的内容比大多数更多,比如可允许全球研究者受控方位,此外还保证研究者不会通过基因组透露参与者的身份信息。
via mit