基因测序可以简单理解为,把生命数字化的过程。基于这些数据,可以实现健康管理、遗传疾病诊断、个性化医疗等。
1990年正式启动的人类基因组计划,预算是30亿美元;而到2007年,测序成本就降到100万美金了;现在则是在1000美元以下。成本的降低,使得基因测序应用范围扩大,普通用户也可以享受到检测服务(虽然实际作用还很难说)。作为上游测序仪厂商,从下图Illumina公司的股价走势也可以看出,基因检测市场及对其需求的快速增长。
Illumina上市以来股价走势图
Illumina、华大基因等公司测序仪技术的成熟(纳米孔技术,基于硅基的光电技术),解决了测序问题,将生命转换成数字,这样就进入了生物信息领域,即怎么样去理解这些以前没有的数字信号,理解生命编码信息。这也是华点云所做的事。
所谓生物信息技术,是在特定领域的数据处理和挖掘技术。测序所得数据,需要经过生物信息技术处理,才能从数据中得出与健康疾病等应用相关的结果,并传递给终端用户。
华点云产品及运营合伙人陈杰告诉雷锋网,公司处在从上游仪器到下游应用(患病风险、疾病诊断)的产业链条中间,所做的事是把生物信息技术产品化、服务化,降低使用门槛,提供给下游提供基因服务的公司。目前公司提供有CelLoud生物信息云平台。
陈杰表示,公司目前主要服务两类用户。
一是行业中做基因检测产品及相应服务的公司。生物信息是产业链条中关键的一步,如果要做相应的服务,必然要用到生物信息技术。
二是医院客户,因为不管通过哪些基因检测的产品或服务商,使用产品或报告的最终用户都是医生、医院和健康管理机构。这些人对于服务的体验,决定了能不能在市场里有相应的份额。
每个行业有不同的特点,处理的数据和数据应用类型不同,所以正如金融行业有金融云一样,生物信息领域也有相应的云服务。
在陈杰看来,生物信息云是云应用里最繁杂的,因为由于其数据特点,有高频的数据查询分析需求,“比如,对于有没有得某种疾病的突变位点,作为一个普适的健康应用时要考虑如何处理大量数据。我们在与合作伙伴共同开发乳腺癌筛查时,要考虑的不是能不能做,而是几千上万人访问同一个数据库时,如何解决高并发问题。”
同时,生物信息应用中有高计算量的需求,“在测序完成后,怎么样分析所有数据,给出相应报告,这在IT中需要高I/O、大内存和高CPU,这些不是单独存在的,是在整个数据处理中被反复调用。”
所以陈杰认为,“生物信息云是一个繁杂的应用,集成了大部分行业云的特点,也有自己的特殊需求”。当然它与金融云等的共性是安全:金融要保障财产安全,生物信息则是生命数据和隐私的安全。
高性能计算则是生物信息云平台的技术支撑。
华点云技术总监于伟文告诉雷锋网,高性能分成两块:一是随着测序成本下降和数据增多,如何对数据解读;二是面向临床,怎么快速给到医生报告。
他认为,传统分析方法慢则几天,面向临床肯定不行。所以在技术上,针对不同的数据类型,以及同样数据类型的不同数据量,他们会使用混合计算模式。他们会收集所有相关的已有生物信息计算算法,并进行比较,针对不同的领域找出最适合的算法。
于伟文称,公司开发的乳腺癌检测产品,用传统方式分析100个样本要四小时,而现在仅需5分钟。据称,嘉宝仁和的无创产检服务,所有流程都在华点云的服务上实现。而阿里云对他们的评价是:第一家有能力将基因分析应用,落地在阿里云的EMR产品上的生物公司。
虽然现在华大基因也有提供BGIonline数据分析云平台,不过在陈杰看来,从竞争本身看,目前的生物信息服务还不到需要谈竞争策略,才能活下来的地步。
他推测,“整个应用市场100个华大基因也未必能支撑起来,还有更多应用产品和技术转化的空间”。从华大出来的他认为,不妨说华大作为探索者做了一些市场预热工作。
他告诉雷锋网,整个基因检测行业还处于进入期到成长期的转型阶段,还有更多的公司在注册成立。一个市场成熟的标志,是要看行业里有没有相应的标准,有没有相应的政策,有没有对于一些公司的调控与支撑。至少目前看来,行业没有形成统一的标准,不是一个成熟的市场。
另外,基于基因检测的产品本身还不成熟,没有形成有影响力的产品与服务。现在较为成熟的无创产前检测NIPT,也只是针对产前检查,属于医院某个科室的某个应用而已。
目前,华点云通过支撑为医疗和健康管理机构做基因检测服务的企业,提供所需要的生物信息技术,把服务规模化,在这一过程中收取技术服务费。就像他们与嘉宝仁和的合作方式一样。陈杰表示,实际上在整个领域里面,关于盈利模式的问题也都在探讨与尝试。