有史以来,计算机第一次不依靠人类的任何帮助,仅仅通过人工智能独立发现了一个新的科学理论。
来自塔夫斯大学的计算和生物领域的科学家们编码了这样一套程序,它能够让计算机在面对一个新的科学问题的时候,独立地发展出一套解释这个问题的理论。他们选择的是一个在生物领域里困惑科学家们120年之久的现象:涡虫(Planaria)被切开之后是有能力进行再生,形成一个新的个体的。这个奇怪的现象很久之前就被发现了,但至于为什么会发生,目前还没有明确的答案。
然而,当把这个问题交给计算机的时候,它就能通过逆向工程(reverse engineer)来找出一个能够解释这个过程背后机制的理论。具体的细节以及人工智能的方法被发表在最近的PLOS Computational Biology上。
研究者们表示,他们真正想要发现的并非一个新的器官是如何再生的,而是机体如何指导这个新生的器官长成需要的样子和大小。这些神秘的信息就隐藏在基因之中。
"现在,从遗传实验中得到的大部分再生模型都是些充满了箭头的图表,告诉你这个基因调控那个基因,这当然没什么问题,但是,它并不能告诉你器官最终会发育成什么样子,你也不能从这些遗传调控通路模型中去得知这个机体最终是会长成一棵树呢,还是一只章鱼。或者是最终变成人类。"研究者之一的Levin这样表示。"那些模型只是能够告诉你再生发生的时候哪些成分是必不可少的,但它无法展示给你这个再生的过程是如何一步步发生的。"
所以,研究者想要用算法建立一个新的再生模型,它能够告诉我们,给予生物体怎样的刺激就能够导致一个特定的成分再生。为了解决这一难题,研究者们利用进化计算的思想发展了一个算法,这个算法能够实现"自我进化",并且能够精准预测研究人员在涡虫再生实验中所获得的研究数据。他们希望通过这个算法找到一个能够解释所有已发表实验数据的调控网络。
那么这个调控网络具体是怎样找到的呢?
也许你已经想到了,一开始的时候,"未进化"的随机产生的调控网络一般是不会产生任何与真实实验相同的结果的。新的候选调控网络的产生是结合之前已经存在的调控网络,并在此基础上做随机的删减增加。所有的候选网络都会在模拟试验中进行检测,算法会把那些通过这个候选调控网络发育出来的结果和数据库里真实的实验数据作对比。在这个"进化"过程中,就会逐渐产生新的能够解释更多实验数据的候选调控网络。
研究者们最终把这个算法应用到由涡虫再生的16个关键实验数据所构成的数据库中,希望找到一个能够全面解释涡虫再生的调控网络。42小时之后,这个算法给出了一个能够精准模拟出16个关键实验全部实验数据的调控网络模型,这个新的调控网络包含了其中已知的重要调控分子以及两个还未发现的蛋白。
对于这样一个振奋人心的实验结果,研究人员们表示:"这个项目最大的意义在于,我们所获得是并不是一个异常复杂、无法理解的调控网络,相反,结果表明人工智能是可以帮助我们来发现一个简洁的、易于理解的模型。这意味着人工智能可以渗透到现代研究的任何一个领域,不仅仅是对实验中产生的大数据进行数据挖掘,同时还可以帮助我们去理解这些复杂数据背后的简洁原理。"