存储和共享基因数据是一个技术问题,计算已经成为了研究的亮点。一个原始的组学数据大概有5-6千兆字节,包含了30亿个碱基对,并且在测序过程中,还有很多数据需要标注,这些数据很难管理。
哈佛大学发起的”千人基因组计划“把测序所得的全基因组数据都放在了网上,可供用户免费下载。但这些数据的管理方式都是比较传统的,即通过压缩工具将数据压缩,再进行传输和存储。
2016年,哈佛大学遗传学先驱Georg Church与来自剑桥大学的计算机科学家Kamal Obbad、以及哈佛大学科学家Dennis Grishin共同成立了一家叫做Nebula Genomics的初创公司。
用户在获得数据后,可将数据存储在Nebula Genomics的区块链平台中。其他研究机构可以通过这个平台来获取脱敏后的数据,当然,这一过程是需要付费的。该系统建立旨在一种特别定制的加密数据上,为了支付购买数据的费用,研究机构必须先购买代币。
这些数据的购买并非终身制,使用一次就需要进行一次付费,并且一组数据可以出售给多个机构。
用户获得的代币可以向Nebula Genomics的合作机构兑换检测服务,目前主要是与Veritas Genetics(Church创立的另一家公司)合作进行兑换。
Nebula Genomics的想法是将用户的遗传数据变成类似专利一样有版权的东西,让用户享有数据的归属权和版权,从中获益。当然,用户最初需要支付量的现金用于检测服务,目前的价格是1000美元/次全基因组检测。
随着测序成本的下降,服务价格也将随之降低。公司希望在未来6个月正式开始运营和服务,并于安全专家合作,打造一个更安全、受保护且匿名的环境。
Nebula Genomics是自有平台、并有数据来源的一类企业,而诸如EncrypGen、Luna DNA和Zenome等加入区块链元素的公司并不向用户提供测序服务,他们通常需要通过第三方来获取数据。
Luna DNA 是区块链在医疗应用的早期尝试之一,与Nebula Genomics的最初想法一致,他们想通过区块链技术把个人数据变成数据资产。
不过Luna DNA不提供测序服务,在测序层面上避免了和23andme 以及Ancestry的竞争。他们认为,通过Luna Coin来鼓励数据分享,能够反过来促进测序服务机构的销量。
“个人层面数据的意义不大,统计学意义的数据需要有十几万、上百万人参与。”Luna DNA联合创始人兼CEO Bob Kain表示,“除非是一个社区级的数据聚集在一起,否则很难解决基因组和健康方面的问题。”
尽管区块链现在还处于蛮荒时代,但也不乏有投资者看到了其中的机会,他们获得了200万美元的种子轮投资,投资方是Illumina的前高管。
来自俄罗斯的EncrypGen与Luna DNA采取的是相似的策略,目前他们已经进行ICO。这些虚拟货币并不会作为投资工具,他们将在7月结束发行。
解决了用户层面的数据归属问题,那如何满足研究机构对大规模数据的需求呢?Shiva或许能够带来答案。
这家成立于2017年的德国公司希望通过最先进的技术来改变全球医疗的现状,包括区块链、云计算、基因测序、人工智能和大数据分析等。他们相信,这些新技术将带领医学研究进入新纪元。
除了面向个人的服务,他们还通过与全球的医疗机构、政府建立合作关系,通过公共项目赞助的方式来建立大样本的数据库,比如公司在2018年3月与Andhra Pradesh政府达成的合作。
另外,他们还会选择与罕见病多发区建立联系,在平台上产生更具特征性的大规模数据。
Shiva同样还推出了个人服务。Shiva并不提供服务,而是作为一个生态环境的营造者,将服务提供商、用户聚集到区块链平台上。用户可以用自己的数据换取服务,这些数据通常来自第三方检测机构;而平台上的服务上也不止测序机构,其中还包括了保险服务、体检等机构。
Shiva希望基于区块链技术打造一个生态圈,为服务提供商和用户提供一个开放的环境。除了基因组学和个性化医疗服务之外,入驻机构还可以添加其他应用和服务。
以上几家主要解决的是数据归属和交易问题。除了交易外,区块链还带有存储功能,并且具备极强的隐私性和安全性。基于此,Zenome则希望基于这些特性做出应用。
他们第一阶段的计划是建立分散的基因数据存储系统,建立一个可以自由交换的安全环境。Zenome同样不提供测序服务,平台的数据主要来自网络参与者。接下来,他们将通过问卷调查和评估系统确保数据的真实性。在数据到达一定规模后,Zenome将吸引大型公司和科研中心来购买数据。
但他们最终的目的并不在交易,而是希望能够让这些公司将数据存储在他们的平台上,从而建立一个类似Google Genomic的社区。