这页简介计算机视觉(Computer Vision)。正如我国计算机视觉先驱/科技部常务部长马颂德在下面第2本书的序说“几乎所有应用数学分支都要到计算机视觉领域来一显身手,…,事实上,这反映了当前的许多数学工具还不能有效解决…鲁棒性。然而,基于几何的视觉方法,在90年代发展到了几乎完美的程度”。如此,下面第1本中国计算机学会理事长的《计算机视觉》书就引用海南琼州大学的导师钟集教授的名著《高等几何》(中国自考委全国3个主任丁石孙、王斯雷、钟集教授就分别从事代数、分析、几何---数学常划分为这三大类)。
在国外被视为计算机视觉发端的事件是:在1966年MIT的Marvin
Minsky让他的本科生Gerald Jay Sussman“在暑假将摄像机连到计算机上…(这Gerald Jay Sussman在1985年合写世界名著《Structure and Interpretation of
Computer Programs计算机程序的构造和解释》,他最近又合写《Functional Differential Geometry泛函微分几何》,并Sussman的2个导师是Seymour Papert和人工智能之父明斯基--这2个导师在1969年合作出版在人工智能等具有划时代意义的《Perceptrons: An Introduction to Computational Geometry感知器:计算几何导论》(象数学类的《美国数学会公报》也评论这书),这第一导师Seymour Papert就是和我们海南琼州大学的导师钟集教授共2人合创中国组合数学学会的徐利治教授的师弟-不过徐利治教授在我国一解放就赶紧从剑桥大学回国没待读完博士--即我研究生毕业时也曾来信邀请我去合作的徐利治教授的这个师弟Seymour Papert不仅是数学家也是人工智能先驱;另外和谷歌研究总监Norvig在1995年一经出版的《Artificial Intelligence: A Modern
Approach人工智能:一种现代的方法》就成各国名校人工智能首选用书的Stuart Russell-其导师Genesereth的导师Joel
Moses也是徐利治教授的师弟和明斯基共同的博士;再说Google创始人Larry
Page佩奇的导师就如其在本科母校演讲说到他的导师是Terry Winograd-而Google创始人的这导师也是徐利治教授的师弟Seymour Papert独立指导的博士[并这徒孙 Page读博士生的宿舍基本上变成了Google的运营中心,最终Google诞生在宿舍,而且Google发家法宝的PageRank就以Page名之的Rank(排序),其实从这里可知PageRank是Page(佩奇)改进的一个在此之前海南琼州大学曾世界领先的图论算法--可见世界第一企业Google的创立几乎只靠徐利治教授的师弟的徒孙Page一人--就如这页最后部分见世界第一的谷歌公司等就是靠排序起家的]--再附美国国家公共电视台主持人Ira Flatow最近2014年主持的“关于徐利治教授的师弟Seymour
Papert的思考”第1个讲话的是Flatow、第2个介绍Papert的是日本人Joi Ito、第3个是家人、第4个是尼葛洛庞帝、第5个是Scratch之父、第6批是创客教父等4人座论、第7个是演员Sherry Turkle、第8个是美国参议员Angus
King、第9批4人、第10个是2003年图灵奖得主Alan
Kay、第11批全国杰出数学教学中心总裁Celia
Hoyles也是ICMI首届获得者等4人、第12个是全球六大疯狂计划的Danny Hillis等共5个多小时:);当然,我们学科图论也对其有重要做用如最近会议和论文集“图论在计算机视觉和模式识别中的应用”2006年以及2007年等
近些年来计算机视觉产业链全局已渐庞大-可搜计算机视觉公司/图像识别公司/人脸识别公司--更具体地给出它们在这里。就此,下面列出我身边有的十几本国内外有影响的计算机视觉图像处理书籍:
1、国内的-清华大学出版社出版的高文院士的《计算机视觉》(这书引用华人的参考文献只有8个-其中有海南琼州大学的导师钟集教授独立撰写的名著《高等几何》且是高文院士这书的唯一数学参考书--如除钟集教授的数学书外其它7个引文是荆其诚院士的《人类的视觉》一书,控制论创刊主编们合写的书,和江泽民/杨振宁的老师合作的前辈合写的书,复旦大学的滤波图像书,还有我国AI创始人之一的我国主编的第一部书[他的AI一书1980年被许多大学传抄时我国AI学会还没成立],以及高文院士的全国唯一计算机应用重点学科的2篇博士论文,而这本图像理解书是日本的),这《计算机视觉》的作者高文院士除了担任中国科学院研究生院常务院长/中国科技大学副校长外还是中国计算机学会理事长,陈熙霖
2、国外的-《计算机视觉中的多视图几何》,作者是Richard
Hartley和Andrew
Zisserman(Richard
Hartley是澳大利亚科学院院士;Andrew
Zisserman在计算机科学被引中高排名第9居全球计算机视觉专家之首,他的3个博士之一M.
Pawan Kumar就做计算机视觉的组合最优化(如浙工大说计算机视觉图论模型推理的论文得到牛津大学M.
Pawan Kumar副教授的悉心指导)。Zisserman更在“最具影响力计算机科学作者”前50名榜单-即搜狐网的这前50名榜单居第3位-即除了前2个主要做机器学习外的第3人就是这计算机视觉大师Andrew
Zisserman, 他还被称为欧洲计算机科学家第一人,在当今全球前10的计算机科学家中他居第4--前3人是全都主要做机器学习的图灵奖得主,这些也许仅是某些方面的统计结果或看法。但他在计算机视觉的视觉几何、目标识别、可视化搜索等做出先驱性的伟大工作)
3、《Three-dimensional
computer vision: A geometric viewpoint (计算机视觉的几何观点)》,作者:Olivier Faugeras(他是上面科技部副部长马颂德的博士导师,其重要如中国首富马化腾的腾讯人工智能实验室主任张正友说:几何视觉刚开始兴起。有两位代表人物,一位是法国的
Olivier Faugeras,另一位是下面我说有他主编的几本书的黄煦涛)。我就有Olivier Faugeras的导师的导师-现代电路理论鼻祖即对电子电工电路贡献最大的人Ernst
A. Guillemin吉耶曼的世界名著《电路理论引论》和《电路分析的数学》-这数学主要是图论-因电路几乎就是图论的抽象
4、《Robot
Vision机器人视觉》,作者:Berthold K. P. Horn(Horn是人工智能之父明斯基的博士,Horn的博士Marc Raibert是全球领先机器人公司-波士顿动力公司创办人)
5、《Motion
and Structure from Image Sequences》,作者:Juyang Weng翁巨扬和他的2个博士导师Thomas S.
Huang(黄煦涛), Narendra Ahuja合写(华人计算机视觉宗师Thomas S. Huang黄煦涛的导师William F. Schreiber的导师Harry Rowe Mimno就是我曾百次去学的“东方麻省理工”的实际统帅冯秉铨教授的师兄弟)
6、《The
Geometry of Multiple Images》,作者:上面科技部副部长马颂德的博士导师Olivier
Faugeras和Quang-Tuan Luong.
最近出版的下面几本也已很有影响:
7、《计算机视觉:一种现代方法》,作者:David
A. Forsyth和Jean
Ponce,林学訚等译(好象最近已出版第2版)。
8、《计算机视觉:算法与应用》,作者是Richard
Szeliski(其被引居第62,他读博时Geoffrey Hinton正在该系并据说是其导师之一)
9、《An
Invitation to 3-D Vision: From Images to Geometric Models》,作者:Yi
Ma即马毅入选《科学》杂志排名的“最具影响力计算机科学作者”前50名榜单--这榜单的第3人是上面计算机视觉大师Andrew Zisserman,排在第一位的是独立撰写世界名著《图论模型学习》的这里人工智能部分说的Michael I. Jordan和第二是后起之秀Andrew Ng吴恩达-并近年来都主要做机器学习特别是深度学习,第4是做自然语言处理的Christopher Manning,第5是做计算机视觉的Jitendra
Malik,第6是刚获诺贝尔奖的Geoffrey
Hinton,第7是和几个组合最优化大师都合作的Scott
Shenker,第8是德国专家Bernhard Scholkopf,第9是这里‘1’的图论博士Jon Kleinberg,另一华人David
Tse谢雅正排名11--显然这仅是一家之言-当然它有它的角度-即它是《科学》(Science)杂志依据Semantic Scholar排出-并感到也有一定的代表性), 和马毅合写这书的另3人是:Stefano Soatto(其是在边缘检测、图像分割和形状匹配做出关键工作的上面第5的Jitendra
Malik的徒孙), Jana Kosecká(人工智能之父McCarthy麦卡锡的徒孙), Shankar Sastry博士论文做电路和系统并也是上面Ernst A. Guillemin的徒孙(Sastry在CS被引排名第50多,他的华人博士有马毅/李泽湘/白尔维/傅立成/邓新燕等)。
10、还有这书也非常著名[已出第4还是第5版]的《图像处理,分析与机器视觉》的其中2作者Milan Sonka, Vaclav Hlavac在MGP查不到他俩, 但另一作者Roger Boyle是图论博士。 也可参考很好的基础书《Pattern
Recognition and Machine Learning》,Christopher
Bishop。
11-19、从上面高文院士的书的引文也知“数字信号与图像处理”是计算机视觉的重要基础且不少是主要内容,如此,我有许多“数字信号与图像处理”书籍-如我有排在第180的美国工程院院士Alan
S. Willsky的2本书(一本由常迵院士翻译,我也有程民德院士主编的《图象识别导论》-他俩同任中国图象图形学学会首届理事长)/Alan
V. Oppenheim的2本并其中一本他俩合写/黄煦涛院士主编的2本图像处理书/以及排名第28的H. Vincent Poor的,也有Anil K. Jain的《数字图像处理基础》和Sanjit
K. Mitra院士的《数字信号处理》/上面翁巨扬的第2导师的导师Azriel Rosenfeld和Avinash Kak的《数字图像处理》,等等, 这领域也几乎就是数学即其大量地讲各类傅里叶变换/拉普拉斯变换/Z变换等等
评价海南琼州大学国际一流的林诒勋教授翻译的Bernhard Korte的这里说当今世界第一名著《组合最优化:理论与算法》之作用如见比尔·盖茨和谷歌的论文只唯一做这领域--还如这Bernhard Korte的2005年刚毕业的Christian Szegedy的博士论文就做它的加权组合数学拉普拉斯谱算子且已在这个“人工智能”全球最具影响力学者中居世界第5(他的几个师兄更厉害)-Christian Szegedy的CV论文如Rethinking
the Inception Architecture for Computer Vision是当今最有影响的论文之一/他的这篇论文Going
Deeper with Convolutions影响更大等等),可见有空还要多攻读其它更多相关领域特别是他的导师的《组合最优化》的某些领域可能具有独特的作用(也如这个“人工智能”全球最具影响力学者中居世界第2的Alexander
J. Smola在1998年才毕业又他的博士Le Song宋乐于2008年才毕业但宋乐在2017 NIPS大会发文数全球前3/2018 ICML发表8篇论文可能是世界第一/宋乐是2019 ICLR七位特邀发言人之一(且发言人也有韩家炜主霸的数据挖掘已是第一人的Jure Leskovec并也就做图论神经网络)/刚又见宋乐并列 2020 ICLR世界第二--而在百度搜索宋乐教授见他全做图论,且宋乐的在“人工智能”居世界第2的上面导师Alexander J. Smola的导师Shawe-Taylor的博士论文就做图论。正如这里说图论神经网络也许是人工智能的未来)。 参看AAAI Fellow。 附:近些年来出现的我国部分计算机视觉公司和领军人才