MIT的新型生物计算机
MIT的新型生物计算机
作者: Graham Templeton
翻译:Younger
审校:心
原文:extremetech
数年来,科学家一直在寻找将细胞制作成计算机的方法。该愿景基于这个逻辑:细胞将信息存储在类似于内存的地方,在刺激条件下,细胞会根据严格、基于规则的程序表达,以惊人的速度执行操作。每个细胞都包含足够的物理复杂度,理论上每个细胞都是一个强大的计算单元,但是细胞的体积又足够小,几百万个细胞也可以组装成进微小的物理空间。如果我们能像制作计算机一样,全面拥有对细胞行为的编程能力,生物计算的前景将难以预估。
MIT的研究人员已在该领域先行一步。他们的细胞机器可以进行简单的计算,储存和回忆等行为。理论上,他们提供的是某种控制功能,我们可以以此设计和构建真正的细胞计算机。但在这之前,MIT的研究会使细胞生物学发生彻底变革。
MIT对此方面的研究最为硕果累累。发明该细胞机器前的2013年,同一研究团队就已设计了一个计算菌株:一个生物“状态机”。状态机是计算机或计算机模型的直接形式(结构不一定非常简单),其中的机器只处于有限个可能状态之中的某个状态,而且会根据输入在这些状态之间进行转换。
细菌比现代晶体管更大,同时也更适宜组装进微小空间内。
自动售货机就是一个典型的状态机。其中计数器其实并不真的执行数学操作,它只知道如果本来就有5美分又收到5美分,就应该覆盖掉“我有5美分”模式转为“我有10美分”模式,对于下一枚硬币的任何可能性都有该模式对应的一套行为计算。机器的这种功能完全不同与有一个鲁棒的数学大脑,或对5或10有自己的概念,或基于两者之间的某种情况。
状态机这种基础系统将输入和单个不断改变的内部状态结合在一起,不断重复这个操作。它的复杂度非常低,远不及现代的语音识别算法。机器学习很大的程度上就是这些反应状态链的自动化构建过程,使计算机拥有科幻小说一样的能力,快速精确地缩小某个口语词汇的含义范围。这些都表明:状态机的概念可能比较古老和简单,但如果能够精心构建,状态机也是有用的。
通过基因中的新兴技术,就可以将状态机概念应用在存活的细胞中。DNA基因组会提供制作可用状态机所有必要的功能,而我们只需要正确使用这些功能。
不管是在实验室还是实体产业中,DNA操纵都正使几大产业产生迅速变革。
MIT的 新论文说,他们在高度定制的大肠杆菌菌株中特意安置了“靶序列”,这些序列非常精细地放在细菌基因组中。科学家如果提供特别组合类型的化学信号,同样早就发明的基因工程技术就会使细胞释放一种“重组酶”,这种酶可以反转DNA预编程中拉伸的方向,或将其彻底清除。重组酶的行为以及其对靶序列的响应,组成了细胞计算中所有的新能力。
对于每个输入变量或化学制剂,重组酶要么会将相关的基因组部分消除,要么将其反转。重要的一点是,那部分基因组本身包含可以命令后面的重组酶结合的靶序列。因此,任意重组酶的行为都会改变环境,下一个重组酶会发现上面的活化行为,并改变之后的重组酶与基因交互的方式。如果重组酶A反转了序列A,重组酶B就可以在此处结合;如果重组酶A删除了序列A,重组酶B就不可以结合,而应执行其他操作或什么也不做。
快速、高吞吐量的测序仪可方便地读取刚刚记录的内容。
这就是说,每个新变量的反应链应该保留在细菌的DNA序列中,并可以通过对基因组测序而检索该反应链。更加有用的是,应将每个状态与产生特定颜色的荧光蛋白偶合在一起,科学家们就能可视地、实时地,而且准确地识别细胞状态序列。比如,输入A后再输入B,就会产生红色和绿色的荧光蛋白;如果改变A和B的输入顺序,细胞则会产生红色和蓝色的荧光蛋白。
同时,这也是追踪基因表达——一个仍使很多分子生物学家困惑的问题——的简易可行的好办法。比如,我们之前很难追踪某个干细胞发育为大脑皮层中健康细胞所需要的基因表达模式。而如果我们经过追踪知道了规定细胞发生这个自然变化的模式,我们就可以很快地用人工复制这种方法。
比实验规模复杂的多的MIT细胞状态机已经实现,该状态机能够记录高速而复杂的基因表达模式,还能永久记录这些至关重要的自然过程。
不要以为生物计算机的控制和保存会和硅处理器一样简单。
实验中的生物状态机只使用了三种颜色的荧光蛋白(绿,红,篮),因此将这些颜色结合在一起,只能从视觉上区分这些相对较少的输入类型,而不能完全区分所有的荷尔蒙,转录因子,以及其他记录细胞分化路径需要追踪的信号分子。但研究人员将系统设计成可扩大复杂度的系统,在足够好的应用条件下,该系统能够添加强大的新工具以研究细胞发育和基因表达。
细胞的可编程性是固有的,因此如果你能将信息可靠地存储在基因组里,用这些信息执行简单的输入输出操作,就会用到生物学中以前发明的技术。那么问题来了:用一个完全可编程的或者一个理想的细胞通信组到底能做什么?换句话说,我们已经有了计算机,为什么要在活细胞内重新发明计算工具?基因表达很快,但现代计算机处理器更快,虽然有荧光蛋白指示信息,但人们对细胞信息输出的读取永远不及线路上输出的电脉冲那样高效。
但生命之于现代工程有一个重大优势:功耗低。运行AI算法每年会消耗很多Gth的电能,而如果使用生物科技,极端冗长且复杂的问题造成的开销则可能会大幅度减少。可能你实验桶里用于计算的大肠杆菌的速度只有谷歌数据中心速度的千分之一,但谷歌的每个超级计算机每年都会消耗几百万美元的能源费,而你的生物计算机则只需要在几个常见而廉价的代谢分子上运行。
计算机需要保存在温度适宜的室内,但一些细菌在酸性液体池中仍充满活力。
另外,生物还非常顽强:不管是海洋底部,大气层顶端,还是活火山口,几千米厚的北极冰下的古老湖水中,我们都发现了生命。比如,你想知道湖水对酸雨的反应酶,你就可以释放用于调查的大肠杆菌菌株,并在下过几场雨后的几周以后回来 ,然后你就可以搜集样本,滤出微生物并对其DNA测序,并对样本中几千个基因组进行统计分析,对每个基因组列出详细的报告,说明其宿主微生物释放以后的酸度情况。
比环境科学更重要的则是医药科学。既然生命会存在于其他生命中,我们将来或许就会用可编程细菌从病人血流中获取他体内的生物化学情况,而且,与构建微型机器人执行医疗操作相比,这种方法造成的人体抵抗性更少。
但总的来说,细胞与计算机完全不同。没人知道有些一开始就要使用几百万个甚至几十亿个简单互联的计算机的算法,那些高瞻远瞩的编码人员到底想用它们做什么。单个计算机虽然相对较慢或受限,但这项技术仍为我们提供了独特而高效的方式,跨越了之前我们认为困难和不可逾越的障碍,比如高效路由美国境内的几百万个数据包,或者蛮力攻击高度加密的算法等。
前路虽然漫漫,但生物科技研究者已朝向目标迈出至关重要的一步,为证明这个概念他们已构建了老式真空管计算机的活体版本。没人知道这些简单的生物机器将来是否会像计算机一样产生深远的影响,但它仍有无限前景。