你可知道，DNA也需要自己的互联网

DNA 基因互联网 MIT

作者：李旭旭

2014/12/18 22:20

你可知道，DNA也需要自己的互联网

近日，遗传学家与程序员组成基因组学与健康全球联盟，联合开发互联网DNA信息交互的协议。这一成果将可与HTTP传输协议对网络的重要性相比。

团队展示的第一个成果为是一个简单的搜索引擎，它将储存在9处的包含数千人类基因组的DNA文献进行梳理，其中就包括了Google的服务器群。团队表示，这个搜索引擎是DNA网络的开端，并最终将无数基因组连接在一起。

此前，由于基因组数据大多储存在私人数据库中，受法律许可协议所限制，也受限于隐私权的桎梏，部分科学家出于对自身科研的保护，自私地将数据私有，基因信息无法得到共享。因此50名科学家在万维网联盟（W3C）之后，组成了这个联盟。

团队的研究成果可以说是一种可以交换基因信息的互联网语言。

现在正在开发的是应用程序接口API，可以使不同基因数据库之间实现信息交互。将不同的基因信息综合起来，有助于加快发现基因是如何影响人体，并帮助医生通过将拥有疑似基因突变的儿童与已有病例进行比对，诊断罕见的先天畸形。

由于基因解码的成本降低，近两千美元就可以测量基因数据，而现在是时候采取一些行动了，发挥数据价值了。

由于遗传学家需要搜索更多的人的基因信息，因此基因组数据的储存成为一大难题。他们用一百万名志愿者的DNA信息来搜索有关精神分裂症、糖尿病以及其他疾病的相关基因。然而即使已有这么多的数据仍不足以发现什么遗传规律。科研需要成千上万的基因组信息，另外也没有任何独立的数据库足够大。

而解决的方法就是网络，它能为科学家获取数据库开辟了一条途径。目前，团队已经着手将全球最大的乳腺癌BRCA1，与BRCA2基因信息数据库连接起来，还包括九个可能导致罕有儿童疾病基因的独立数据库。

团队将会陆续公布这款软件，希望使得任何科学家能对任何实验室拥有的基因数据进行共享，不用受到技术壁垒及隐私权的限制。

今年三月，团队开始了一项测试，看科研机构是否愿意共享数据。一个取名Beacon的产品使得数据库拥有者将数据严格限定在几个搜索引擎内分享。目前为止，Beacon适用于15个数据库，其中三个为Google拥有的公共基因组。

未来会有一种协议可以搜索到更多数据，但是并不是以任意的方式。科学家们必须要注册或者甚至签署协议合同。如果想要获取全部的基因组，用户还需要输入联系方式。

同时这项联盟正在推进的一个变化是一种新的知情同意书，列出了交出基因组的志愿者的权力。这份同意书涵盖的内容比大多数更多，比如可允许全球研究者受控方位，此外还保证研究者不会通过基因组透露参与者的身份信息。

via mit