计算机视觉(Computer Vision-简称CV)。正如我国计算机视觉先驱/科技部常务部长马颂德在下面第2本书的序说“几乎所有应用数学分支都要到计算机视觉领域来一显身手,…,事实上,这反映了当前的许多数学工具还不能有效解决…鲁棒性。然而,基于几何的视觉方法,在90年代发展到了几乎完美的程度”。如此,下面第1本书就引用我的导师钟集教授的《高等几何》。还因,近些年来计算机视觉产业链全局已渐庞大-可搜计算机视觉公司/图像识别公司/人脸识别公司--更详细的可看这里我国铺天盖地涌现的计算机视觉(CV)公司。就此,下面列出我身边有的十几本国内外有影响的计算机视觉图像处理书籍:
1、国内的-清华大学出版社出版的高文院士的《计算机视觉》(这书引用华人的参考文献只有8个-其中有海南琼州大学的导师钟集教授独立撰写的名著《高等几何》且是高文院士这书的唯一数学参考书--如除“成就恐不在杨振宁、李政道之下”的海南琼大导师钟集教授的数学书外其它7个引文是荆其诚院士的《人类的视觉》一书,控制论创刊主编们合写的书,和江泽民/杨振宁的老师合作的前辈合写的书,复旦大学的滤波图像书,还有我国AI创始人之一的我国主编的第一部书[他的AI一书1980年被许多大学传抄时我国AI学会还没成立],以及高文院士的全国唯一计算机应用重点学科的2篇博士论文,而这本图像理解书是日本的),这《计算机视觉》作者高文除了担任中科院研究生院常务院长/中国科技大学副校长以及中国计算机学会理事长还如这理事长等,陈熙霖(其实象复旦大学校长、“东方第一几何学家”苏步青院士也独立撰写《高等几何讲义》、《高等几何学五讲》、《射影曲面概论》、《射影曲线概论》和《射影共轭网概论》这5本书-它们都是苏步青大师在高等几何这领域的众所周知的名著但都没被引用,可见我的导师钟集教授的《高等几何》一书之影响)
2、国外的-《计算机视觉中的多视图几何》,作者是Richard
Hartley和Andrew
Zisserman(Richard
Hartley是澳大利亚科学院院士;Andrew
Zisserman在计算机科学被引中高排名第9居全球计算机视觉专家之首,他的3个博士之一M.
Pawan Kumar就做计算机视觉的组合最优化(如浙工大说计算机视觉图论模型推理的论文得到牛津大学M.
Pawan Kumar副教授的悉心指导)。Zisserman更在“最具影响力计算机科学作者”前50名榜单-即搜狐网的这前50名榜单居第3位-即除了前2个主要做机器学习外的第3人就是这计算机视觉大师Andrew
Zisserman, 他还被称为欧洲计算机科学家第一人,在当今全球前10的计算机科学家中他居第4--前3人是全都主要做机器学习的图灵奖得主,这些也许仅是某些方面的统计结果或看法。但他在计算机视觉的视觉几何、目标识别、可视化搜索等做出先驱性的伟大工作)
3、《Three-dimensional
computer vision: A geometric viewpoint (计算机视觉的几何观点)》,作者:Olivier Faugeras(他是上面科技部副部长马颂德的博士导师,其重要如中国首富马化腾的腾讯人工智能实验室主任张正友说:几何视觉刚开始兴起。有两位代表人物,一位是法国的
Olivier Faugeras,另一位是下面我说有他主编的几本书的黄煦涛)。我就有Olivier Faugeras的导师的导师-现代电路理论鼻祖即对电子电工电路贡献最大的先驱Ernst A. Guillemin(吉耶曼)的世界名著《电路理论引论》和《电路分析的数学》-这数学主要是图论-因电路几乎就是图论的抽象
4、《Robot
Vision机器人视觉》,作者:Berthold K. P. Horn(Horn是人工智能之父明斯基的博士,Horn的博士Marc Raibert是全球领先机器人公司-波士顿动力公司创办人)
5、《Motion
and Structure from Image Sequences》,作者:Juyang Weng翁巨扬和他的2个博士导师Thomas S. Huang(黄煦涛), Narendra Ahuja合写.
6、《The
Geometry of Multiple Images》,作者:上面科技部副部长马颂德的博士导师Olivier
Faugeras和Quang-Tuan
Luong.
最近出版的下面几本也已很有影响:
7、《计算机视觉:一种现代方法》,作者:David
A. Forsyth和Jean
Ponce,林学訚等译(好象最近已出版第2版)。
8、《计算机视觉:算法与应用》,作者是Richard
Szeliski(其被引居第62,他读博时Geoffrey Hinton正在该系并据说是其导师之一)
9、《An
Invitation to 3-D Vision: From Images to Geometric Models》,作者:Yi
Ma即马毅入选《科学》杂志排名的“最具影响力计算机科学作者”前50名榜单--这榜单的第3人是上面计算机视觉大师Andrew Zisserman,排在第一位的是独立撰写世界名著《图论模型学习》的这里人工智能部分说的Michael
I. Jordan和第二是后起之秀Andrew
Ng吴恩达-并近年来都主要做机器学习特别是深度学习,第4是做自然语言处理的Christopher Manning,第5是做计算机视觉的Jitendra
Malik,第6是刚获诺贝尔奖的Geoffrey
Hinton,第7是和几个组合最优化大师都合作的Scott
Shenker,第8是德国专家Bernhard
Scholkopf,第9是这里‘1’的图论博士Jon Kleinberg,另一华人David
Tse谢雅正排名11--显然这仅是一家之言-当然它有它的角度-即它是《科学》(Science)杂志依据Semantic Scholar排出-并感到也有一定的代表性), 和马毅合写这书的另3人是:Stefano
Soatto(其是在边缘检测、图像分割和形状匹配做出关键工作的上面第5的Jitendra
Malik的徒孙), Jana
Kosecká(人工智能之父McCarthy麦卡锡的徒孙), Shankar Sastry博士论文做电路和系统并也是上面Ernst A. Guillemin的徒孙(Sastry在CS被引排名第50多,他的华人博士有马毅/李泽湘/白尔维/傅立成/邓新燕等)。
10、还有这书也非常著名[已出第4还是第5版]的《图像处理,分析与机器视觉》的其中2作者Milan
Sonka, Vaclav Hlavac在MGP查不到他俩, 但另一作者Roger Boyle是图论博士。 也可参考很好的基础书《Pattern
Recognition and Machine Learning》,Christopher
Bishop。
11-19、从上面高文院士的书的引文也知“数字信号与图像处理”是计算机视觉的重要基础且不少是主要内容,如此,我有许多“数字信号与图像处理”书籍-如我有排在第180的英国前2个获得物理诺贝尔奖的徒孙Alan S. Willsky的2本书(一本由常迵院士翻译,我也有程民德院士主编的《图象识别导论》-他俩是图象图形学学会首届理事长)/神童维纳的徒孙Alan
V. Oppenheim的2本并其中一本他俩合写/黄煦涛院士主编的2本图像处理书/以及排名第28的H.
Vincent Poor的,也有Anil
K. Jain的《数字图像处理基础》和Sanjit
K. Mitra院士的《数字信号处理》/上面翁巨扬的第2导师的导师Azriel
Rosenfeld和Avinash
Kak的《数字图像处理》,等等, 这领域也几乎就是数学即其大量地讲各类傅里叶变换/拉普拉斯变换/Z变换等等
评价海南琼州大学国际一流的林诒勋教授翻译的Bernhard
Korte的这里说当今世界第一名著《组合最优化:理论与算法》之作用如见比尔·盖茨和谷歌的论文只唯一做这领域--还如这Bernhard
Korte的2005年刚毕业的Christian Szegedy的博士论文就做它的加权组合数学拉普拉斯谱算子且已在这个“人工智能”全球最具影响力学者中居世界第5(他的几个师兄更厉害)-Christian
Szegedy的CV论文如Rethinking
the Inception Architecture for Computer Vision是当今最有影响的论文之一/他的这篇论文Going
Deeper with Convolutions影响更大等等),可见有空还要多攻读其它更多相关领域特别是他的导师的《组合最优化》的某些领域可能具有独特的作用(也如这个“人工智能”全球最具影响力学者中居世界第2的Alexander J. Smola在1998年才毕业又他的博士Le Song宋乐于2008年才毕业但宋乐在2017 NIPS大会发文数全球前3/2018 ICML发表8篇论文可能是世界第一/宋乐是2019 ICLR七位特邀发言人之一(且发言人也有韩家炜主霸的数据挖掘已是第一人的Jure Leskovec并也就做图论神经网络)/刚又见宋乐并列 2020 ICLR世界第二--而在百度搜索宋乐教授见他全做图论,且宋乐的在“人工智能”居世界第2的上面导师Alexander
J. Smola的导师Shawe-Taylor的博士论文就做图论。正如这里说图论神经网络也许是人工智能的未来)。 参看AAAI Fellow。 附:近些年来出现的我国部分计算机视觉公司和领军人才