雷锋网消息,近日,数据隐私计算大数据企业翼方健数宣布完成数千万美元B轮融资,本轮投资方包括中芯聚源、奇绩创坛、复盛创投等。
翼方健数成立于2015年,是一家专注隐私安全计算的大数据和人工智能公司,主要基于“数据和算法互联网(IoDA)”,建立一个包括数据提供方、数据需求方和数据服务方、平台管理方的IoDA数据生态生态。
今年四月,国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》,将数据和、土地、资本、劳动力提升至同样的生产要素高度。
人工智能时代,数据的价值已经获得前所未有的提高。数据的价值虽然已经被普遍认可,但依然存在数据孤岛、没有被广泛挖掘和重视的情况。
翼方健数首席执行官罗震表示:“现在看似人工智能已经在医疗、保险等很多场景得到应用,但数据的价值并没有得到充分的挖掘,美国市场研究机构force research的调查就显示,目前有60%~73%的数据没有被充分利用。”
这个现象的本源问题,并非来自于技术和生产价值,而是因为数据本身作为一种生产力资产,具有多种特殊性。
首先,数据作为一种虚拟化资产,不需要物理实体的体现,可以完成1到无限次不同目的使用;其次,相比较昂贵的生产成本和收集成本,可变的复制成本非常低廉;最后,价值实现存在极大的外部依赖性,在缺少具体场景和应用工具的情况下,对于数据拥有方,拥有并不代表价值。
这些因素的叠加,在行业内造成了供方和需方的竞争性、数据价值实现和利益关系的矛盾,也就形成了一个个的数据孤岛,但数据价值的外部依赖性特点决定,只有在共享之后才能产生更多的实际价值。
翼方健数董事长陈恂表示:“ 数据在本质上不能共享,但数据的资产价值实现应该共享,并且界定好数据在价值共享过程的所有权和使用权;这也是我们从信息时代走向智能时代的最根本的矛盾。既然有这么根本的矛盾,就一定有特别巨大的机会,于是有了翼方健数。”
雷锋网了解到,翼方健数实现共享数据资产价值的主要途径就是隐私计算。
作为一门交叉学科,隐私计算是数据科学与工程、密码学、分布式计算与存储的综合工程,涉及包括差分隐私、多方计算MPC、同态加密、联邦学习、可信任执行环节(TEE)等多种技术。
相比较传统数据利用平台,隐私计算可以将模型训练过程囊括其中,在原始数据不离开数据平台的情况下,输出数据的价值。
翼方健数CEO罗震表示:“利用隐私安全计算技术,可以完全不用交换原始数据,在计算平台里面,仅仅交换和输出数据的价值,满足数据供方和需方的双方需求,翼方健数也利用这个技术构建了自己的隐私安全计算数据能力平台——翼数坊(XDP平台)”
作为解决数据共享矛盾的工具,XDP平台首先解决的第一个问题就是数据孤岛。平台可以根据数据所有权和使用权的情况,保持数据价值开放,但原始数据从不离开平台。
以医药研发为例,数据提供方,将数据授权给平台之后,药研所和AI公司的研发和训练过程全部在平台中进行,在实现数据价值的基础上,保证原始数据并不外流。
目前,翼方健数已经利用XDP在厦门构建了区域医疗大数据平台。
翼方健数CEO罗震表示:“厦门有400万人口,目前已经实现三年内的临床数据覆盖,并在今年年底实现5年的数据规模。这些数据的覆盖从根本上打破了过去医院之间的数据孤岛情况,在数据价值实现上,已经有多个研究机构和商业导向的用户作为使用方,分享数据的价值。”
XDP解决的第二个问题就是解决提供方和使用方利益矛盾,促进数据价值共享。
翼方健数董事长陈恂表示:“过去将数据资产化和完成数据价值的分配非常困难,最常见的交易特点就是一锤子买卖。一次性交易所有数据,但这种方法对于买方和卖方都会产生竞争性。”
另一种方法就是一方提供数据,一方提供技术,最后按照价值分配。但在实际使用中,一种模型算法经常要囊括多方数据源。
这种情况也就导致,很难精准测算出各方数据源对于模型价值贡献的情况,在最后的交易和结算过程中,无法完成利益的公平分配。
XDP平台建立了基于智能合约的数据共享激励机制。在数据提供方数据集发布的同时,即建立智能合约,使用方在数据共享中可以参照智能合约,建立数据价值兑现时的分配方案。
对于多重数据提供方情况,智能合约触发时可以按照衍生关系触发上游智能合约,实现回溯。
作为数据价值的共享工具,XDP平台解决这些数据资产化难题之后,就可以利用数据价值,帮助第三方探索AI、物联网等场景的使用。
以医疗为例,翼方健数基于XDP平台,开发了以“探路者”系列产品为代表的智能前端应用。
探路者可以根据临床医生书写电子病历的痛点,利用数据处理工具和服务对XDP平台中的三甲级别医院临床病历数据进行训练和学习。在数据不出平台的前提下,探路者就可以输出病历结构化服务,帮助医生完成电子病历质控和辅助书写。
而且,在数据进一步采集之后,XDP平台的数据还将会为更多场景AI应用提供资源。
翼方健数董事长陈恂表示:相比其他区域平台,翼方健数会比较侧重于数据采用和治理后的资源实现,未来随着各地、各区别对于数据开放的深入,数据平台下一步将帮助像药厂、保险等更多大行业应用,提供底层支持。”雷锋网