物理科技生物学-PHYICA

DNA日向夏海数据存储的新变化让用户可以预览存储的文件

技术工程 2021-12-02 21:54:53

DNA双链DNA片段。学分:Vcpmartin/Wikimedia/ CC BY-SA 4.0北卡罗来纳州立大学的研究人员将DNA数据存储领域的一个长期挑战变成了一个工具,利用它向用户提供存储数据文件的预览——例如图像文件的缩略图版本。脱氧核糖核酸数据存储是一项有吸引力的技术,因为它有潜力在一个小包装中存储大量数据,它可以长时间存储这些数据,并且以节能的方式进行。然而,直到现在,还不能预览以DNA形式存储的文件中的数据——如果你想知道一个文件是什么,你必须“打开”整个文件。

“我们的技术的优势是在时间和金钱方面更有效率,”凯尔·托梅克说,他是这项工作的论文的主要作者,也是北卡罗来纳州的博士生。“如果你不确定哪个文件有你想要的数据,你不必对所有潜在文件中的所有DNA进行测序。相反,你可以对DNA文件中小得多的部分进行排序,作为预览。”

这是如何工作的快速概述。

用户通过将称为引物结合序列的脱氧核糖核酸序列附加到存储信息的脱氧核糖核酸链的末端来“命名”他们的数据文件。为了识别和提取给定的文件,大多数系统使用聚合酶链反应。具体来说,他们使用一个小的脱氧核糖核酸引物,与相应的引物结合序列相匹配,来识别包含您想要的文件的脱氧核糖核酸链。然后,该系统使用聚合酶链反应制作相关脱氧核糖核酸链的大量拷贝,然后对整个样本进行测序。因为这个过程制造了目标DNA链的许多拷贝,目标链的信号比样本的其他部分更强,使得识别目标DNA序列和读取文件成为可能。

然而,DNA数据存储研究人员面临的一个挑战是,如果两个或多个文件具有相似的文件名,聚合酶链反应将无意中复制多个数据文件的片段。因此,用户必须给文件起不同的名字,以避免数据混乱。

“在某个时候,我们突然想到,我们可能可以将这些非特异性的相互作用作为一种工具,而不是将其视为一个问题,”该工作论文的合著者、北卡罗来纳州化学和生物分子工程助理教授艾伯特·强(Albert Keung)表示。

具体来说,研究人员开发了一种利用相似文件名的技术,让他们打开整个文件或该文件的特定子集。当命名一个文件和该文件的一个给定子集时,通过使用一个特定的命名约定来实现。他们可以通过操纵PCR过程的几个参数来选择是打开整个文件,还是只打开“预览”版本:温度、样本中DNA的浓度以及样本中试剂的类型和浓度。

“我们的技术使系统变得更加复杂,”该论文的合著者、北卡罗来纳州计算机工程教授詹姆斯·塔克说。“这意味着我们必须更加小心地管理文件命名约定和聚合酶链反应的条件。然而,这使得该系统不仅数据效率更高,而且对用户更友好。”

研究人员展示了他们的技术,将四个大的JPEG图像文件保存在脱氧核糖核酸数据存储器中,并检索每个文件的缩略图,以及完整的高分辨率文件。

“虽然我们只存储了图像文件,但这项技术与其他文件类型广泛兼容。它还在不增加成本的情况下提供了这一新功能,”该作品的合著者、北卡罗来纳州的博士生凯文·沃尔克尔说。

新的“文件预览”技术也与研究人员为使脱氧核糖核酸数据存储更加实用而创建的脱氧核糖核酸富集和嵌套分离(DeSign)系统兼容。通过引入改进的数据文件标记和检索技术,DENSe有效地提高了DNA存储系统的可扩展性。

“我们目前正在寻找行业合作伙伴来帮助我们探索这项技术的商业可行性,”强说。

这篇题为“基于脱氧核糖核酸的数据存储中更智能文件操作的混杂分子”的论文将于6月10日发表在《自然通讯》杂志上。这篇论文是由北卡罗来纳州立大学的前本科生伊莱恩·英德穆尔合著的。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/5062.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~