当前位置:首页 > 创业科技 > 正文

用DNA直接存储图像,「活细胞相机」分辨率达96像素

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

DNA可以用来拍照了,而且是直接存进去的那种!

新加坡国立大学的研究团队成功将图像投影到DNA上并进行了存储,分辨率达到了96像素。

甚至,利用同一段DNA序列,还能存储多张!

传统的DNA存储需要从头开始构建DNA序列,并通过人工合成的方式编码。

但这一成果直接使用从大肠杆菌中提取到的DNA,将图像转换成DNA数字信号的编码器也是活细胞。

于是,通过将细菌(Bacteria)和照相机(Camera)结合,团队把这一成果命名为BacCam。

BacCam不仅将DNA存储的效率大大提高,还具有极强的鲁棒性,常见的一些特殊环境都能耐受。

相关论文已经登上了Nature子刊。

英伟达AI科学家范麟熙(Jim Fan)也转发了这一成果。

虽然我不是生物学专家,但我很期待看到生物和机器之间的无缝衔接。我已经迫不及待地想要把大语言模型(LLM)挂载到「生物API」上了!

无惧水深火热

实验中,BacCam展现出了极强的鲁棒性。

对于其中一张图像,将DNA稀释5万倍之后,数据没有受到丝毫影响。

稀释后的DNA浓度只有0.36皮(10-12)摩尔每升,比在水池中放一粒沙子还要低上那么几个数量级。

不过,稀释对DNA分子本身影响不大,可能还不足以说明问题。

但将溶液烘干之后复原,熟悉的笑脸依旧清晰可见。

对于复杂的外部环境条件,BacCam也能轻松应对。

除了在室温条件下能保持完好之外,冷冻和加热也都对数据没有什么影响。

在60度的烘箱当中放上一周,图像仍然完好无损,不过70度就不行了。

但据论文中介绍,把DNA在70度环境下放上一周,相当于在9.4度下放两千年。

就算用紫外线照上一个小时,里面的数据依旧岿然不动。

而对于存储不同图像的DNA,也无需分别进行保存,直接混在一起就可以了。

将不同DNA混合后,读取时,只需要使用特定引物,对需要的部分进行扩增。

团队将5段存储不同图像的DNA混在了一起,结果单次读取时图像几乎能保持完整,多次随机读取的更低准确率也有80%。

△B行为单次读取,C行为多次随机读取

既然如此,它是如何做到的呢?

点阵化方式处理

BacCam大致的工作流程是酱婶儿的:

首先,要存储的图像被分割成96个区域。

然后,利用对特定波长光线敏感的反应重组酶,根据该波长光的有无,对DNA进行编辑。

这种“条形码”式的编辑方式直接保留了图像中各像素点的空间位置,使图像数字化,而不需要额外进行编码。

此外,利用光的复用能力和对不同波长敏感的酶,团队将正交的红蓝两种颜色图像分层,实现了用同一段序列存储两个图像。

这种存储方式下,BacCam依旧拥有很高的准确率。

利用机器学习方式,研究团队对BacCam的解码方式进行了优化。

经过大量的无监督式学习,已经实现了DNA编码的自动化解读。

团队简介

BacCam的研究团队来自新加坡国立大学EngBio实验室。

该实验室主要进行以生物学为核心的多学科交叉工程研究。

论文之一作者是来自该实验室的华人博士生Cheng Kai Lim。

他的研究方向是利用DNA进行数据存储,同时还在攻读MBA学位。

Lim的导师、实验室负责人Chueh Loo Poh教授是本文的通讯作者。

论文地址:https://www.nature.com/articles/s41467-023-38876-w