社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

在基因的眼里,万物皆可ChatGPT

格上财富 • 2 年前 • 299 次点击  



作者:罗小舟,中科院深圳先进技术研究院研究员、合成生物化学中心执行主任

来源:华夏基石e洞察(ID:chnstonewx)


导读:2023年4月20、21日,由深圳市前海管理局指导、基石资本主办的“2023中国前海企业家峰会”在深圳蛇口成功举行。此次峰会以“再谈创新之道:国家和企业的未来”为主题,围绕创新环境、创新精神与创新实践,多位重量级的企业家、科学家、学者和投资家进行了精彩演讲与深入讨论。中科院深圳先进技术研究院研究员、合成生物化学中心执行主任、合成生物研究重大科技基础设施副总工艺师罗小舟发表了“进化的力量”的主题演讲。


大家好!我是来自中科院深圳先进技术研究院的罗小舟。今天,很荣幸受到主办方的邀请,来给大家介绍一下关于合成生物学及其相关的一些内容。


在座各位都是投资界、企业界的精英,要怎样讲才能让大家感到有趣呢?还得讲我的老本行。过去十几年,我一直在做关于进化方面的研究,下面就逐步介绍一下我们在这个领域所做的一些努力。


首先,究竟什么是进化。相信在座的各位都已经很熟悉进化论了,听到进化这个词想到的第一点,即人都是猴子变来的。再想想,可能还有物竞天择、适者生存这类思考。但实际上,进化是不是只有这一点点能力?是不是只进化出来我们人类一种高智能动物?实际上,进化远远不止这些非常表象的信息。


先给大家介绍一本书,我后面讲的内容很多来自这本书:《自私的基因》,该书出版于1976年,作者是英国的演化生物学家理查德·道金斯。这是一本全球畅销书,作者本人也是英国皇家学会会士、牛津大学的教授。他在这本书里提出了一个非常重要的观点,即基因是进化的主要选择单位,基因有其自私的特性,基因存在唯一的目的就是确保自身的生存和复制。


生存和复制,相信企业家们都能理解。刚开始创业的时候,企业最关键的问题是如何活下去,而如何变大,实际上就是生存和复制。


在《自私的基因》一书里,有一些比较有意思的观点。


首先,它抛出了一个概念是“基因的机器”。这是什么意思呢?大家认为,我们日常生活中的病毒和细菌、家里面养的花、外面的树、宠物狗和猫、水里面游的鱼等等,都是大自然创造的万事万物之一。而这本书的作者却认为,它们都是机器,是基因制造出来帮助自己繁殖、散播的机器。比如说鸟,作为一个机器,它能帮助其携带的基因飞到天上去探索更广阔的空间。而鱼这样的机器被造出来,就是可以将其携带的基因深入到大海里面……也就是说,万物作为机器,都只是帮助自己携带的基因,去利用别的物种利用不到的资源去繁殖自己。


造这样的机器,该如何赋予它智能呢?当然,大自然不可能告诉机器,遇到障碍物该怎样跳过去,这是不现实的。包括人类在内,所有物种的所有行为,实际上都是有基因编码的。而基因编码都有预先设置好的程序,但这个程序不可能告诉你,10岁那年,会有个树枝掉下来,你要躲开。


那么,基因程序要怎样编写?这本书认为,必须通过形成一定的策略,由这些策略,来应对我们所拥有的生活和面对的各种事物,最终保证我们作为基因的工具更好地在这个世界上生存、繁殖。


既然说到了策略,我们就会想,人与人之间的竞争,国与国之间的竞争,任何一个物种之间之内都存在竞争。最简单的一个物种不同策略的竞争在现实中是广泛存在的。比如,美国大选里面,有人支持川普,有人支持拜登。在经济学领域,有人支持自由派,有人支持政府……这样简单的一物种内部的竞争比比皆是。


比如,我画了一只鸽子、一只鹰,它不代表鸽子和鹰的竞争,而是代表一个物种里面的鸽派和鹰派。当同物种的两个派别碰在了一起,为了得到一个食物或者一个水源,它们互相对峙。这时,两派会有什么不同的策略呢?鸽派倾向于对峙,但如果一旦开打就逃跑,因此不会受伤。鹰派则全力以赴地战斗到底,无论输赢。


推演一下两种不同策略带来的物种进化。假设一个条件是环境的压力,因为进化一定是在环境的压力下才会产生的。两者竞争,赢者得到50分,获得一些新的食物或者一些新的水源。而输的只能得到0分,即什么都没有。而如果输家应为争斗受伤了,它可能在之后的两三天甚至10天都没有食物来源,则会被扣100分,而因为对峙浪费了时间、损失了寻找其他食物的机会被扣掉10分。那我们假设一个情况,该物种里面都是鸽派,那么,当两者相遇时,就会形成对峙,最终一方累了、跑了,另一方得到了食物,得了50分。双方都浪费了时间各扣掉10分,就只有30分了。这样这些鸽派的成员在这个世界上生存下来都能得到15的平均分,当群体里面突然出现了一只鹰,也就是出现了一个新的策略,那么这个鹰就会存在巨大的竞争优势,因为它的每一个竞争对象都是鸽子,每一场争斗都可以得到50分。在这种情况下,它的基因将会在整个进化当中得到极大的扩张。


由此看来,全是鸽子状态的基因肯定是不稳定的。同理,全是鹰的物种,因为两败俱伤,使平均得分可能是负数,简单计算后是-25。这时,一旦突变出来一只鸽子,那么这个鸽子在整个进化当也会有巨大的优势。尽管它可能什么都得不到,但不会受伤。


通过计算这些数学问题我们知道,无论是一只鸽子突变成一只鹰,还是一只鹰突变成一只鸽子,如果达到一个进化上的稳定策略,它都不会再变化了。当鸽子与鹰或者鸽派与鹰派是5:7的比例时,整个基因系统在进化上是稳定的状态。


这种稳定的状态下,个体平均得分是6.25分,跟刚才那些分数比较,6.25分其实不高,相当于个体只能得到6.25分的实物。这时,如果全是鸽子,每一只能够得到15分。个体要得到最高分该怎么做?如果群体进化到5只鸽子和1只鹰的比例,个体就能得到16.67分。


这证明,我们每一个个体在进化层面都是非常自私的,只管自己,丝毫不会考虑整个群体的利益。要如何才能让每一个个体最大化自己的利益?就要通过外部的调节来选择一个压力,也就是刚才说的那些分数,我们可以逐步使进化趋于最优解。


在我们的日常生活中,政府官员制定新的政策、投资人投入于一些特定的方向、科学家研发一些新的技术等等,都能改变我们这个环境,使得整个群体达到最优水平。


以上只是介绍了最简单的进化策略:一个是打不过就跑策略,一个是战斗到底策略。如果还想要更多的进化,则需要更加复杂的策略或者说更加根深蒂固的策略。


接下来,我想介绍一下生育和抚养。每次我们去国外交流,就有人问我们国家是不是实行了计划生育,我说是的。事实上,在进化学家眼中,自然界其实早就已经开始实现计划生育了。这是什么意思呢?大家看到,作为哺乳动物的猫、狗没有出现过一次生100个的情况,这不可能,对不对?


这不是一个母亲能够决定的,生育的数量实际上是通过漫长的进化得出来的最优解。它隐含了什么?但凡是生100个或者生育极少量的基因已经消失在漫长的历史长河中了,因为它不能适应环境。从基因本身来讲,它是希望越传越多,越多越好,但为什么会产生这样一个生育数量?因为个体繁殖过多,如果遇到第二年年景不好,发生饥荒等情况,可能整个物种都会饿死。于是,进化就会把该基因进行淘汰,最终完美地执行了接近“计划生育”的一种策略。


进化还有什么策略?实际上,我们所有的抚养行为也是一个策略。就像北极熊生下了两个宝宝,在年景不好的时候,它只能养活一个。那么在自然界中,它会怎么做?这就是一个母亲的投资策略。它究竟分给两个小北极熊同样的食物?还是只能给其中一个更多而给另一个更少?经过长期的观察以及数学的计算,遇到只能养活一只的情况,母亲普遍会选择放弃小一些的个体。为什么?因为对大的的投资已经远远要大于对小的的投资,沉没成本更高,所以自然界已经进化出来一个策略,即当一个投资比另外一个投资大时,放弃投入更少的个体,更有利于基因的繁殖。而在物质不那么匮乏的时期,则会投入更多在小的个体上,因为这也不一定会导致大的个体的死亡,最多只是有些营养不良或者吃的少一些而已。


这种情况其实在人类社会中也是非常明显的。比方说,在照顾小宝宝时,照顾到一定的月份或一定的年纪就会断奶。为什么要断奶?省下资源可以去照顾更下一代,照顾下一个个体,这样会增加基因传播下去的概率。我们的姥姥、姥爷、爷爷、奶奶会主动承担起照顾第三代的责任,因为第三代依然有母本25%的基因。通过照顾第三代,实际上能够更加促进基因的延续。我们现在看到生育的个数一定不是一个固定的数值,大家周围还有双胞胎、三胞胎,从进化学的角度看,这也是母亲的一种投资策略,就好比买期货。期货的条件是什么?是预测明年的年景可能会更好,或者我感知明年的年景可能会更好,这样我生下来两个宝宝都能够得到非常好的照料,都能够繁衍壮大。如果第二年确实是一个很好的年景,期货就买值了。如果不好,会有一个自然的选择,作为母亲可能就会放弃一个的生育和抚养。如此,经过上万年到现在,就进化出来了一些策略。


接下来,我想谈一谈大家都看到过的植物。大家心目中最成功的植物是什么?喜欢花的会认为,最成功的是一株最好最美丽的花朵。喜欢树的可能认为,最成功的是长得最高的那一类树。但是从进化的角度,最成功的植物是以下三种:小麦、玉米和水稻。现在,这三种植物在地球上的数量最多,经营、传播最广,甚至连我们的空间站里面都有它们的身影。可能有些人会说,这些东西都是人类为了吃才帮忙种出来的呀!但是在《自私的基因》里,作者提出,基因不仅可以影响本身的个体,还可以通过个体去影响其他个体。我们也可以这样理解:小麦、水稻和玉米的基因造出的工具成功地利用了我们人类的口腹之欲,使得它们的基因得以无限地延续下去,并且得到最大规模的散布。


针对一个物种可以影响另外的个体,作者又提出了一个叫“模因”的新概念。它仿照基因来命名,有些翻译里面直接用英文名Meme。什么意思呢?就是说,事物本身是一个文化的载体,比方说我们看的书报,我们听的流行音乐都携带了自身的一个基因,而这个基因是可以从一个头脑传递到另外一个头脑的。对模因的研究可以套用基因,模因是基因在文化上面的一个类比,可以自己复制、变异,并且可以根据压力的选择来作出不同的回应。比方说,我左边的两本书有几千年的历史了,它们在几千年里一点都没有变吗?至少我们会发现,现在的书已经变成简体字了。为什么要变成简体字?实际上是它本身的基因或者它的模因为了适应这个社会进行的本质的变化。因为,它也是符合这样一个遗传规律的。


我们的手中有一张图,是2010年有人随机拍了发到网上的。到了2012年,网终上出现了它的复制版,最后,经过病毒式的传播,到了2013年,它就变成了一个文化现象。这说明,它的基因为了自己的生存,把自己变成了一个Doge币。过了几年,Doge币大火,它的基因又得到了更广泛的散播。原来一些并不关注网络文化的人可能不知道,在2015年或者2016年,我们微信上还有一个Doge脸的图标,至少在中国范围内,它得到了广泛的传播。


这些文化现象的背后,都有进化的策略和规律,尽管我们看不见、摸不着。


除了我举的这些例子,大家在网络上看到的各种挑战赛,听到的各种流行歌曲也充分证明了模因的存在。有一些流行歌曲可能今年爆红,明年我们就听不到了,说明它的策略很短暂,只能够在短时间内得到爆发,没有长久性。有些歌曲可能历经了10年20年还是经典,这也是基因或者模因采取的策略。


刚才主持人介绍了,我的单位是合成生物学研究所。合成生物学究竟在研究什么呢?可能有人说,合成生物学就是用微生物去合成一些东西,这其实不是我们真正研究并最终关注的内容。用一个微生物去做一个东西只能说是合成生物学在研究过程中产生的附带效果,尽管这个效果足以支撑几家上市公司和很多初创企业,但我们合成生物学实际研究的是多物种经过多年进化,体内究竟产生了什么样的东西,以及什么样的策略?我们的生命本质上作为一个功能是如何涌现出来的?


什么叫做涌现?举例说明。电脑只有一个显示器、一个键盘或者一个硬盘是不能播放PPT的;汽车单独一个轮子或一个车框是没有办法奔跑的。但这些小的实体组装到一起形成一个大的实体就能展现小实体所不存在的特性或功能,如:电脑可以做PPT了,汽车可以跑了。这个过程就叫做涌现。


我们研究生命,对于人类来说,生命过程本身就是一个涌现,这些策略本身也是一种涌现。什么意思?我们其实就是一堆的化学物质。无论我们的DNA还是蛋白质,都是最简单的化学物质。这些最简单的化学物质为什么组合在一起之后自己就可以繁殖了,甚至像我都可以上台来讲PPT了。这个功能是怎么涌现出来的?它的这些策略是怎么来的?是通过最底层的基因编码来架构的,这就是合成生物学。整个社群就是全球合成生物学,所有的合成生物学家都想要去探究这些内容。探究这些内容我们提出了两个方法,第一个是自上而下,就像拆一个电脑拆一个汽车,拆成一块一块的,然后去对每一块进行研究和鉴定。


刚才,方志刚老师也提到了,知其然不知其所以然。我们希望用自下而上的方法去探究去测量,用数学来描述物质之间的关系,从数学的本质上去理解,然后从0开始地造就一个这样的生命,才可能真正理解生命进化的策略是怎么产生的,以及生命是怎么涌现出来的。


要拆分一个计算机已经很难了,那么要去拆解一个生命只会更难,步骤更多,方法更复杂。而我们要去研究它的很多内容,或者说从下面把它制造出来,需要很多重复性地劳作,还需要有很多知识做辅助。


2018年,深圳市投资了七个多亿,让我们做一个软件结合硬件的平台。利用这个平台,我们可以做大量的标准化的实验,可以自下而上地从零开始,构建一些生命的元件。我们希望最终实现构建生命,也希望能够通过自上而下的对生命一步一步的拆分,进一步地理解生命。


接下来讲一讲我们这几年在深圳做的一些事情。


刚才几位老师都提到了软件的重要性。在芯片领域,我们已经被卡脖子了,希望在生物设计领域不要再一次被卡脖子,所以设计了一个基于用户的BioCAD来覆盖我们整个合成生物学,也就是设计、构建、测试、学习的闭环。这个闭环很好理解,就像折一个纸飞机,先把草图画出来,再去构建它,再把它折出来去试飞,也就是测试。如果飞得远,就要了解它为什么飞得远,这个就叫学习。任何一个简单的符合逻辑的工程领域都需要一个软件帮助我们去实现这个过程。


合成生物的研究实在是太复杂了,我们希望能够整合公共的数据资源,实现研究的数据闭环,这样才可能产生更多数据驱动的研究。我们已经以用户为中心开发了一整套生物设计软件对接云实验室的接口,云实验室会操作我们的硬件平台,去做所有的实验。我们也已经实现了一站式的设计来构建测试学习的闭环。


我们在软件方面已经成功地开发出了基础数据库,它集合了现在几乎所有和生物学相关的信息。我们开发了一个元件库,就是我们做出来的每一个生命元件都可以按图索骥地去储存,去分发。我们做了一个装置设计软件,可以从0开始去设计、制造生命的一个菌株。


未来,我们希望各位都可以设计一个菌株,用一个拖拽式就可以把一个生命给设计出来。


我们还做了一个基因组的编辑。因为基因组是所有物种最大的一个遗传单位,可以进行直接编辑,需要有软件去设计,再由自动化去执行。现在,除了有多组学分析的软件协助分析海量数据外,还有很多专业化的软件能够基本保证我们在生物的CAD领域不会被卡脖子,甚至能够做一些领先于世界的研究。


除了软件,当然还开发硬件。我们不仅会自主开发一些硬件的仪器,做一些原来我们做不了的生物实验,还要开发相对应的工艺、工程。仪器做出来还不够,我们还要开发与之配套的实验方法,才能最终使用机器去做实验。


目前,我们运行的这个大型平台尽管还在建设期,但也做了不少内容。比如,我们用微生物合成了一些有价值的化合物。大家都知道,人的肠道里有很多细菌,通过人工维持或者加速它的进化可以治疗高尿酸引起的痛风。我们用老鼠模型完成了这个实验。我们希望把这项研究推广到临床,进而造福于社会。我们还要继续研究细菌在肠道内部是怎样对话的,这些致病菌为什么能够去杀掉其他一些菌,而益生菌又为什么能够帮助并保护我们的健康?


一个物种的基因组实在太大了,包含了很多冗余的信息。由于整体地研究它的策略太过复杂,所以我们又做了基因组最小化的底盘细胞。同时,我们也做了一些像抗生素类化合物这样高效的表达平台,帮我们开发更多药物候选的分子。结合 AI、GPT等工具,我们还可以去拟合、预测一些实验中难以测量的数据。


我们现在开发出来的工具比原来的工具提高了20%的准确率,并且已经实实在在地运用到生物学的研究当中了。


最后总结一下。我们在研究进化以及合成生物学生命是如何产生的同时,我本人也在努力地迎合这样的进化。我用到的这个PPT大纲是用Chat-GPT帮我写的,是用。所有的配图都是Chat-GPT给我建议的,然后midjourney根据ChatGPT建议的内容画的。如果大家都没有看出来的话,就说明我们现在的人工智能真的是智能了。


谢谢大家。


版权声明:部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。

格上财富:十五年深度研究,甄选阳光私募、PE/VC、海外基金等高端理财产品,为您的资产增值保驾护航!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/154995
 
299 次点击