攻克DNA信息存储领域的技术难题,华大等机构发布研究成果
深圳特区报记者 闻坤
2022-04-26 17:32

4月25日,华大等多家机构的研究团队联合在《自然》(Nature)子刊《自然-计算科学》发表研究论文。研究团队结合DNA双链模型,从中华文化中“阴阳”对立统一的思想获得灵感,开创了一套名为“阴阳”的比特-碱基编解码系统,以解决当前DNA信息存储领域的技术难题。

Nature Computational Science官网截图  图片来源于华大研究院

当前正处在前所未有的信息大爆炸时代,据估算,2025年全球每天将产生491EB数据(1EB=1024PB,1PB=1024TB),相当于每天制造出2亿张DVD光盘。海量数据如何长期稳定存储已成为亟待解决的一大难题,而以“BT+IT”融合的DNA信息存储技术,或能为这个问题提供更优解,因此受到了越来越多的关注。

据了解,研究院团队将中国传统的阴阳哲理巧妙应用到DNA编解码系统当中,以两套不同的规则,分别对两条二进制信息进行“一对一”编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列。

接下来,在人工合成DNA的保存上,为了全方位验证“阴阳”系统的信息恢复稳定性,华大研究院团队通过体外DNA干粉和细胞体内大片段在体内和体外两种存储环境进行测试,皆实现了原始存储数据的完整恢复。

其中在体外模式上,研究团队采用不同浓度的原始DNA文库溶液进行了共200多组测试。结果证明,“阴阳”编码采用的线性数据恢复模式在每种DNA分子的平均拷贝数仅有100时,仍然能恢复最高88%的原始数据。而DNA喷泉码使用的编码方式使得每个数据包间存在一定的拓扑关联,在同样条件下,平均恢复率仅有1.3%。

而在体内模式上,研究团队将信息存在了酵母活细胞的体内,酵母菌株经过1000代以上传代之后,信息仍可以被完美恢复。这在一定程度上意味着,利用活体细胞作为DNA存储的载体,上千年后原始信息或仍能被解读。这样的存储方式可以得到接近于天然DNA分子存储理论极限的物理信息密度,每克DNA能存储的信息量约为432.2 EB。

华大研究团队曾将《开国大典》影片存储于DNA中  图片来源于华大研究院

从起步至今短短10年时间,DNA信息存储领域已取得不少令人瞩目的研究成果,包括检索、修改等高级功能也已完成原理验证性的测试,以微软、谷歌等产业巨头形成的DNA存储联盟更是在为其商业化广泛合作蓄势。

在探索DNA信息存储的同时,华大也在DNA合成、DNA测序的设备与技术自主研发道路上持续深耕。基于华大的MPS合成技术和DNBSEQ测序技术,结合本研究的比特-碱基编解码技术,华大已经实现了DNA存储的全流程技术闭环。相信随着华大等全球科研机构、数字信息产业界的不断突破,在不远的未来,“DNA硬盘”将成为我们日常生活中必不可少的数据存储设备之一。

据了解,该研究由深圳华大生命科学研究院主导,深圳国家基因库、首都师范大学、美国哈佛大学等多个研究团队共同参与。华大研究院平质博士为论文第一作者,华大研究院沈玥研究员、徐讯研究员与哈佛大学George M. Church教授为论文的共同通讯作者。

(原标题《攻克DNA信息存储领域的技术难题,华大等机构发布研究成果》)

见习编辑 饶欢 审读 吴剑林 审核 关越 曹亮

(作者:深圳特区报记者 闻坤)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页