这页说基于海南琼州大学曾世界领先的哈密顿图的DNA计算机(即一种生物形式的计算机,并已被公认为DNA计算机的出现将给人类文明带来一个质的飞跃,给整个世界带来巨大的变化,可见这是一个会迎来巨大发展的领域。刚见我国生物计算机领军人物北京大学一级教授许进写的文章“张老师,您没有离开我们”,北京大学一级教授应是最顶级了,而张老师就是在人类百年更是千年交替之际-联合我国最伟大的大师权威们在海南琼大召开世纪大会的宗师)。
最近也见“21世纪是生命科学的世纪,但是千万不要进生物系”---专访北京大学欧阳颀院士(这北大院士对做为生物学世纪的二十一世纪竟做如此论言是否够惊人?)--不过,现在有如此数学横刀跃马,前景是光明的--在此我们只说组合数学的作用,如这里当今世界第一最具影响力的生物医学家是跟组合数学家攻读的组合数学博士--并他俩都是海南琼州大学师爷的徒孙。再如曾给我们海南琼大来信希望我去的大师-他的博士是世界上第一个将“数量”、“信息”、“计算”引入到基因生物学中的科学家兼美国核心基因公司创办人万宏辉并万宏辉的博士学位论文做的就是我们的“组合数学和图论中的一些矩阵方法”。这页要说的主要是DNA计算机,特别是组合数学对其的推动作用,可参考下面-但目前很多最好进展都只在预期中并伴随许多艰难瓶颈-仍使许多人过于乐观。现在再刚见一个新消息说-加州理工刚在《自然》杂志的成果表明“科学家研发出DNA计算机:未来程序员拿试管“写”代码?”中说对最优哈密尔顿路问题-当路点数很少时计算机在短时间能解决,但当点数仅多至100个时当前最好的计算机都需要数百年才能算出来)
我们知道DNA双螺旋结构的发现是20世纪最为重大的科学发现之一,和相对论、量子力学一起被誉为20世纪最重要三大科学发现,如此发现者沃森被美国《时代周刊》杂志评选为美国历史上最具影响力的20大人物之一,这DNA之父沃森的最近已出版到第六版的历史名著《基因的分子生物学》的第183页“遗传图论与DNA分子上的对应距离一致”一节说“如果是用正常的+链和带有缺失的—链进行复性,与—链上缺失那一般互补的+链,就不再形成氢键,这样就会形成一个单链的圈,从大部分是双股的分子上突出出来。从电子显微镜下很容易认出这个圈…”(这话是我从以前的他独立撰写第三版上抄录的,最近的几版都已是他和多人合写的),(许多生物学家都认为,生物是从沃森发现双螺旋起,才成为科学的。就如一般的生物学课程都有高达80%的知识与此有关,也就难怪沃森这本书写到第六版仍有极为强大旺盛的生命力,一直在生物学中扮演极其重要的奠基性和基本促进性),而遗传图论等都与圈结构有关,这就是做为研究圈结构的哈密顿圈哈密顿图登上革命性的历史舞台如在DNA存储编码…以及下面与我们海南琼州大学一起从事哈密尔顿图的专家撰写的《图与组合优化中的DNA计算》专著等,当然我也还有沃森的《DNA:生命的秘密》、《重组DNA简明教程》,以及Gheorghe Paun和European Association for
Theoretical Computer Science欧洲理论计算机科学协会第4、第3届主席Grzegorz Rozenberg、Arto Salomaa合写的《DNA计算:一种新的计算模式》(这书由“背景与动机”和“数学理论”共2部分组成-并第2部分“数学理论”从第61页至最后328页。其值得看就如译者说本译作得到华中科技大学4任校长杨叔子院士、周济院士、李培根院士、丁烈云院士的支持和关心。作者Grzegorz Rozenberg的导师Pawlak的博士论文是做“Graph Theory图论”的并开创Rough sets,Grzegorz Rozenberg也和这协会第一届主席Maurice Nivat联合创办《Theoretical Computer Science》杂志-而这Maurice Nivat的博士Philippe Flajolet就是解析组合数学之父)。在此顺说这个European Association for Theoretical Computer
Science欧洲理论计算机科学协会-它的主席几乎都是我们图论组合数学专家如最近但任主席的Paul Spirakis在1982年的哈佛大学的博士论文是做组合数学结构方面的(他的导师1977年在哈佛大学的博士论文也是做组合数学方面的)、也担任这计算机协会主席的汉堡大学博士Burkhard Monien在美国数学评论见他的几十篇图论论文、更早些担任主席的意大利最大的罗马大学Giorgio Ausiello可在数学评论见他的几十篇图论论文(并1981年写《组合数学优化算法的分析与设计》一数)、也担任主席的Mogens
Nielsen是第3届主席Arto Salomaa的博士(他独立发表许多图论论文如这篇以及这篇还有和第4届主席合作的这篇等很多图论论文,此外也有许多组合数学论文)、第6任主席的Josep Diaz可在数学评论见他的几十篇图论论文、第5任Wilfried Brauer信息太少(在数学评论见他只有20多篇论文并有好几篇Petri网论文-即他也做90年代初邀请海南琼州大学去北京大学做Petri网的北京大学计算机系袁崇义教授的领域),可见图论组合数学是计算机科学发展的重要推进力,这也是就难怪海南琼州大学曾世界领先的哈密顿图是DNA计算机诞生的推动力。
人类基因组计划的目的是测定人类基因组的全部DNA序列(而DNA就是组合数学中的一个序列结构,图论又是组合数学的主要部分。我们又即将进入“后基因组学”时代,其主要基本实质范畴是生物信息学。可看复旦大学生命科学研究中心主任郝柏林院士畅谈离散数学在生物信息学中的应用-[这里是郝院士对不大相干又是人工智能时代的中科院唯一智能研究所的系列讲座之一],而看说到海南琼州大学和人类史上十大天才之一的Erdős担任离散数学杂志副主编的这页见Erdős就是离散数学之父并离散数学又称为组合数学。
这页要说DNA计算:它是图论、计算机科学和分子生物学相结合而发展起来的新型研究领域。最近国外报道“有待突破的十大领域”之一就有DNA计算机。它诞生于1994年-即下面论文标志着DNA计算机雏形的诞生,因它是基于有海南琼州大学曾世界领先的有一千多年悠久历史的哈密顿图所以它在《科学》杂志一发表就引起世界各国哈密顿图专家们的极大兴趣(这论文作者创立者Adleman的导师和一堆师兄弟都做图论哈密顿图)。如此在这学科的诞生中,哈密顿图的哈密顿路图(Hamiltonian path)在其发展和设计中扮演极其重要的角色(现已有DNA计算机将横空出世, 硅芯片会被淘汰?近年来,美国、以色列、日本等相继透露或公开宣称已取得重大进展,特别是以色列等宣称他们已用在试验阶段诊断和治疗前列腺癌、肺癌、膀胱癌等及一些疑难杂症--如人民网报道诊治癌症的DNA计算机模型/以及DNA计算机将在癌症诊治中大显身手,这因在诊断一个人是否患有某种疾病之前,必须测量体内特定抗体(免疫球蛋白)的浓度等,如此可将纳米尺度的“DNA分子计算机”作为分子级“合成生物器件”应用于各种疑难杂症疾病、癌症以及罕见病等的识别与控制,这个不到头发大约直径1/105大小的纳米计算机,被输送入相应组织,它主要在细胞分子层面上工作,利用自身携带的“生物传感器”监测多种癌生物标志物,在肿瘤特殊环境下根据命令执行逻辑操作。这样,就可以在人体产生任何症状之前提前发现癌细胞。同时,重新组装“基因回路”迫使肿瘤细胞自我毁灭,而不损伤周围正常细胞。具体到各种独特程序也有所不同如有些可感知肿瘤等任何异常分子的存在,并同时与下游多个抑癌分子组成一个新的“信号转导网络”,进而“重新编程”肿瘤细胞的分子信息程序,逆转其恶性生物学行为,或诱导其进入自杀程序。目前已在多个癌症模型等中进行测试,充分证实了其在分子水平上的抗癌能力,为各种疑难杂症疾病、癌症以及罕见病等的精准治疗提供了一个新方案,等等(巧的是-这里见1994年另一图论专家也做出革命性突破而奠基雏型的量子计算机--它的计算速度超过传统计算机的亿倍),下面附这1994年的开创性论文:
论文标题:Molecular computation of solutions to combinatorial
problems(百科里只说这一篇论文)
作者:Leonard M. Adleman(这篇论文就是这里说的“伦纳德·阿德曼通过DNA序列的方法来解决著名的Hamilton
Graph”),而这Hamilton Graph就是海南琼州大学居于世界领先的哈密尔顿图(也简称哈密顿图)
单位:Department
of Computer Science, University of Southern California, Los Angeles 90089,USA.
论文摘要:The tools of molecular biology were used to solve an instance of the
directed Hamiltonian path problem. A small graph was
encoded in molecules of DNA, and the "operations" of the computation
were performed with standard protocols and enzymes. This experiment
demonstrates the feasibility of carrying out computations at the molecular
level.
发表期刊卷号页码:Science. 1994 Nov 11;266(5187):1021-1024..
论文链接网页:http://www.sciencemag.org/content/266/5187/1021) (也如百度网也只说这一篇论文,这篇论文说“伦纳德·阿德曼通过DNA序列的方法来解决著名的Hamilton Graph即哈密尔顿图”)
就如评价海南琼州大学的“哈密顿图”是国内外一流水平的刘振宏大师指导下博士学位论文做哈密顿图的李国君在毕业后的大部分工作都做生物学(另一导师许国志院士因年高且有重要职务,如钱学森院士给他的信说“什么是第五次产业革命的推动力?除电子技术和计算机技术之外,我认为还有系统科学”“您是理事长,当然要负责组织力量回答上述问题”,如此他需要组织解决许多问题和回信)--李国君教授也已成为山东省人大常委会副主任出席的“山东大学首批聘任12名泰山学者特聘教授”中李国君教授排名第一(这12人中还有任山东大学副校长兼中国文艺理论学会副会长陈炎教授和中国宗教学会副会长兼山东大学学术学位委员会副主任傅有德等),李国君教授还担任山东省人民政府参事等
在这方面中国大陆中科院生物信息中心和台湾耶鲁老乡也为哈密顿图用于其的推进贡献力量…。就如这里见现代世界第一最具影响力的生物医学科学家Eric Lander院士就是从事哈密顿图代数图论组合数学的海南琼州大学师爷叔的博士 …
最近我国生物计算机第一人北京大学一级教授许进撰写的“生物计算机时代即将来临”的生物计算机和分子计算机、DNA计算机也许思想的偏向有点不同-但大体上实质上思想上就是同一类东西而且就算想各突出不同重点特点在目前仍都似乎无法做到有意义的实现,读研时还有热闹一阵的“光神经计算机”如见这篇和这一篇以及这里倒数第2段见当时1992年的书的一章已专讲光神经计算机等等
美国《生物信息学算法导论》就一直贯穿于图论组合-主体部分主要贯穿于哈密顿图…
1.
还有许多生物学领域也涉及如这书《Bioinformatics for Biologists生物学家的生物信息学》的3.1 Genome assembly as a hamiltonian cycles problem以及3.2 Fragment assembly as a Eulerian cycles problem,当然还有许多标题不含哈密顿圈和欧拉圈但内容讲到它们的,涉及图论的其它方面的就更多了
迄今,DNA计算机被国外列为“全球有待突破的十大领域”之一。总之,DNA计算当前仍处在婴儿时期,但如果DNA计算能够趋于完美,采用这种技术的计算机所能存储的信息量将是按照当前标准所无法想象的。如此DNA计算机是当前极富吸引力又充满严峻挑战的领域。这领域1994年才宣告诞生,但就因有强大广泛美好的前景而似乎已是权威专家辈出,可DNA计算方面的著作包括从国外翻译引进的却仅几本,其中国内专家撰写的书只有哈密顿图专家上海工程技术大学殷志祥院长的专著《图与组合优化中的DNA计算》和东华大学最年轻的博导丁永生教授的共2本。殷志祥教授在DNA计算方面的突出贡献或许源于他头十几年一直从事哈密顿图研究而打下的厚实基础,即殷志祥教授研究DNA计算之前的论文全部都是如下的哈密顿图论文:一类无爪泛圈图,泛圈图的一个充分条件,一类泛圈图,线图泛圈性的一个充分条件,一类Hamilton图 ,无爪图的泛圈性,泛连通图的一个充分条件 ,无爪图的Hamilton性,一类泛连通无爪图,一类泛连通的无爪图 ,无K_3图的Hamilton性 ,一类泛圈图 ,无爪图的泛连通性 ,哈密顿连通图的一个充分条件,基于DNA计算的无向赋权图哈密顿路径问题。刚见以哈密吨图起家的殷志祥教授做为年轻专家竟唯一获得拥有5个博士后流动站的该大学科技贡献个人奖(海南大学至今仍仅有1个博士后流动站)。刚见到说一个实验室里与DNA相关的工作还获得12个诺贝尔生物学或医学奖(图论同在这1994年萌芽的量子计算机也被认为将掀起一场划时代革命)
可参考“进化图论”(即图论可以用来代表各种具有空间结构的群,例如细菌、动植物、组织结构、多细胞器官和社交网络。在进化过程中,每个个体依据自身的适应程度,进行繁殖病侵占到邻近顶点。图的拓扑反映了基因的演化——变异和选择的平衡…)。图论具有这些重大作用就如在世界上最大的学术演讲视频网--计算机科学的演讲视频最多-物理/化学/环境/建筑/哲学等的演讲视频也仅2百多、而Graph Theory即“图论”竟有3百多,并除了运筹学1百多-其余如控制论、概率统计学、博弈论、优化论特别是其它数学学科的演讲视频都不到1百!
上面论文是“Molecular computation”分子计算,其目标是实现类似分子计算机的甚至更广泛的功能,也可说是分子机器的一种,而这里首页说在受聘于我的母校华师大的刚获诺贝尔化学奖的Bernard L. Feringa的分子机器“将是一场无处不在的革命”但仍暂时局限于某类并象上面一样试图在此基础上建造出一个可以抓取并连接氨基酸的分子机器人,这些微型机器人因为体积微小能够进入人体,能自动检测人体癌症细胞,还可以用将药物直接送到病患的病灶之处,这就和上面分子计算机从制造到功能都有许多共通或类似之处。区别主要只在于电子器件或信息处理构件基本尺度、材料和需要设置怎样的包括操作目标功能如此可有DNA分子机和RNA分子机等等,如北京大学一级教授许进的论文说基于上面Adleman的DNA理念设计制造的计算机称为DNA计算机Ì生物计算机Ì甚至称为更广的分子计算机也都是正确的
阿德勒曼就是思索着不断尝试解决最优哈密顿路问题,才发展研制出解决它的武器-DNA计算机。因就是仅求百个点顶的哈密顿路问题,即使目前最快的计算机也“望洋兴叹”--几百年也解决不了。但利用DNA计算,就可能迎来曙光
至今,研制出的DNA计算机的体积象水滴一样小,DNA计算机的输入、输出和软件等都由DNA构成,硬件则由DNA操纵的酶构成。DNA计算机已尝试用于评估特殊RNA分子的浓度等。当人体细胞出现癌变时,充当蛋白质生成媒介和传递遗传信息的信使核糖核酸RNA分子,会出现异常增多或减少的现象。由于癌症种类的不同,肌体中RNA分子的浓度也不一样,有的过大,有的可能过小。而计算机可根据事先编制好的医学程序,通过检测RNA分子浓度大小进而进行癌症诊断,它也能够识别与癌症相关的多种分子。
生物计算机还可对诊断出来的癌症进行治疗,即运用计算机输出装置,控制那些被认为受到癌细胞活动干扰的单链DNA分子的释放,并且还能释放出多种药物,使癌细胞自我销毁。现已设计出的试验性阶段的DNA计算机可鉴别表示患前列腺癌的RNA分子,并根据这一诊断,释放出长度较短的DNA链杀死癌细胞。也能够利用这种计算机,在试管中鉴别出一种肺癌的征兆。可预期将来(大约在将来十年至二十年间)能够在活体细胞中培养一名“医生”,这样不仅可以及时发现病情,而且能在人体出现外部病情症状前,采用必要的治疗措施。
目前,DNA计算机的研制尚处于起步阶段,它只能在特殊的盐溶液中发挥作用。要把它应用于活体细胞,还必须解决许多难题。可以预期,未来的DNA计算机将充当“细胞医生”的角色。
基因发现频率就是指对某种细胞中哪种基因正在活动进行分析,有助于确定疾病的种类。这种“基因诊断”过去需要3天的时间,而利用DNA计算机则只需6个小时左右。另外,在医疗领域以外,通过对分子排列进行操作来开发新材料的“纳米科技”领域也在探讨DNA计算机的应用。如果使用DNA计算机,就能够有效地配置分子,生产出新材料。
因此,DNA计算机正在不断朝着与原来的计算机不同的方向进化。也许将来在各个领域,我们的生活中都将离不开DNA计算机。
DNA计算机起源于人们对并行计算的研究和追求,以传统的图灵机(Turing Machine)为原型的现代电子计算机很难从真正意义上实现并行算。于是人们将目光投向了其它领域,以求获得完全不同的计算方式和计算理念。上个世纪90年代中期,以Adleman和Lipton为首的一批科学家在DNA分子化学反应中找到了一条似乎可以解决并行计算的新路子。上面1994年发表在Science杂志上的论文就是第一篇有关DNA计算机的论文,主要是用DNA化学反应的方法解决了六个节点的哈密尔顿回路(Hamiltonian
Path)问题。在此后至今的十年间,有关DNA计算机的论文虽不多,但只要能提出完整的解决问题的方法,并用实验加以实现,一般都可以在国际顶尖的杂志上发表,如Science和Nature。
DNA计算机由于受到理论模型和实验条件的双重阻碍,至今未有突破性进展,只能解决一些特定的NP问题(不确定图灵机多项式可解问题),而不能朝通用(General Purpose)计算机的方向发展。然而困难与机遇并存,谁能提出通用计算机的模型,并用DNA分子实验加以实现,谁必将留名青史;退一步,如果能设计出更为简便的DNA计算机模型来解决NP问题也可以在规格很高的杂志上发表论文。DNA计算机之所以不能迅速前进的另一个原因是懂数学特别组合优化和理论计算机的人对生物实验知之甚少,而懂生物实验的人又对数学和理论计算机缺乏了解。
DNA计算机应用前景
未来的DNA计算机在研究逻辑、破译密码、基因编程、疑难病症防治以及航空航天等领域应用的独特优势,现在电子计算机是望尘莫及,应用前景十分乐观。比如,DNA计算机的出现,使在人体内、在细胞内运行的计算机研制成为可能,它能够充当监控装置,发现潜在的致病变化,还可以在人体内合成所需的药物,治疗癌症、心脏病、动脉硬化等各种疑难病症,甚至在恢复盲人视觉方面,也将大显身手。
完全可以想象,一旦DNA计算技术全面成熟,那么真正的“人机合一”就会实现。因为大脑本身就是一台自然的DNA计算机,只要有一个接口,DNA计算机通过接口可以直接接受人脑的指挥,成为人脑的外延或扩充部分,而且它以从人体细胞吸收营养的方式来补充能量,不用外界的能量供应。像科幻小学中向大脑植入以DNA为基础的人造智能芯片,未来就像现象接种疫苗一样简单。无疑,DNA计算机的出现将给人类文明带来一个质的飞跃,给整个世界带来巨大的变化,有着无限美好的应用前景。
不过,由于受目前生物技术水平的限制,DNA计算过程中,前期DNA分子链的创造和后期DNA分子链的挑选,要耗费相当的工作量。比如,阿德勒曼的“试管电脑”在几秒钟内就得出结果,但是他却花掉数周的时间去挑选正确的结果。还有,如果实验中城市数目增加到200个,那么计算所需的DNA重量将会超过地球的重量。而且数以亿计的DNA分子非常复杂,在反应过程中很容易发生变质和损伤,甚至试管壁吸附残留都可能发生致命错误。因此,DNA计算机真正进入现实生活尚需时日。
当前,世界许多国家包括我国的科学家正在积极克服和解决上述难题,预计10至20年后,DNA计算机将进入实用阶段。
上面方向已成为计算生物学和生物信息学的一个重要核心。
而关于这两者,最近年轻敏锐的华中科大三级教授薛宇说“Casey Bergman 博士指出虽然计算生物学 (Computational
Biology) 和生物信息学 (Bioinformatics)有重大区别,但他不做区分,两者在概念上可以等价”。“Casey表示,虽然他写的“应该做生信/计生的博士或博后的前N条理由”主要是为了忽悠分子生物学背景的学生转做生信,但其实也适用于忽悠其他方向比如生态学和神经科学等方向的学生或学者”。关于区别,从两者的名字上也可知道有所侧重点,但发展到现在应该是可融会贯通。至于他要把一直是生物学中心的“分子生物学”也忽悠过来,那是否生物学的中心要变?当然短期内还会呈现胶着状态。但竟然也要把生态学和神经科学等也忽悠过来。也如这里最后见我国清华大学自动化系唯一的中科院院士也创建生物信息学研究所,并成为我国首家生物信息学教育部重点实验室。
计算生物学或生物信息学世界最权威中心应该是南加州大学,该校不仅有上面诺贝尔奖得主Leonard Adleman伦纳德·阿德曼(Adleman的导师是图灵奖得主Manuel Blum并也从事图论即组合数学的研究,我们海南琼州大学就毕业于中国第一个组合数学研究室),南加州大学还有被誉为“生物信息学之父”的美国三院院士Michael Waterman就主要是开创组合数学与RNA二级结构分子最小自由能之间的研究,并撰写著名的《计算生物学导论》)。此外,加州的加州大学伯克利分校搞计算生物学及生物信息学的大牛Lior Pachter最近竟连续三天写了三篇博客矛头直指网络皇帝Barabási和新大牛Kellis,加州大学圣地亚哥分校Pavel Pevzner教授也写了一本很有名的《计算分子生物学》。这些计算生物学权威大师们的一个共同点是他们以及他们的部分博士生的学位论文也做组合数学图论,如这2个大师的前面2本著名很大部分都是讲图论的理论方法和技术等的(图论在计算生物学和生物信息学的作用已非常广泛如国际数学联盟主席Laszlo Lovasz获得诺贝尔奖的当年就主编Graph Theory and Combinatorial Biology)。附赛亚基因科技,生物芯片上海国家工程研究中心,博奥生物暨生物芯片北京国家工程研究中心,华大基因中心,国家人类基因组北方研究中心,国家人类基因组南方研究中心。