著名华人科学家黄煦涛逝世,华人AI视觉群星闪耀背后的关键人物

美东时间 4 月 25 日夜间,著名华人科学家黄煦涛教授(Thomas S. Huang)在美国印第安纳州逝世,享年 84 岁。

作为公认的计算机视觉华人鼻祖,他是中国工程院外籍院士、中国科学院外籍院士、中国台湾“中研院” 院士以及美国国家工程院院士,曾任美国伊利诺依大学(香槟分校)Beckman 研究院图像实验室主任,不仅有着奠基性的学术成果,更是在其近半个世纪的教学生涯中实现 “桃李满天下” 的境界,如今中国计算机视觉领域群星闪耀,其中不少学者、创业者都曾是黄煦涛的学生。

勤耕不辍的学术人生,今年 3 月仍发表论文

黄煦涛,1936 年出生于上海,1949 年移居台湾,1956 年从台湾大学毕业后赴美留学,先后于 1960 年、1963 年获麻省理工学院电机系硕士、博士学位。毕业后留校任教,历任助理教授、副教授,是继傅京孙之后, 在计算机视觉、模式识别、多媒体等领域最资深的华人科学家。1973-1980 年曾任普渡大学电子工程学院信息处理实验室主任、教授。1980 年,黄煦涛离开普渡大学来到伊利诺伊大学厄巴纳 - 香槟分校(UIUC)任教。

黄煦涛本人主要从事信息和信号处理方面的研究工作,涉及计算机视觉、模式识别、多媒体等多个领域。

他的早期重要工作主要集中在图像压缩上,后来扩展到对图像的增强、修复和智能分析等。例如,由他发明的预测差分量化(PDQ)的两维传真(文档)压缩方法,已是国际 G3/G4FAX 压缩标准;在数字信号处理方面,他提出关于递归滤波器的稳定性理论,建立了从二维图像序列中预估三维运动的基础,为图像处理和计算机视觉的发展做出了开创性的贡献。

不仅在图像领域,黄煦涛认为图像和语音处理在本质上有类似之处,因此他也输出了一部分语音识别、声音处理的研究。他和他的学生曾创建了一个语音数据库,可用作测试视听语音识别算法的基准 ,另外还开发了用于检测引起人类注意的潜在声音元素的方法。黄煦涛还是最早结合基于音频和视频的技术来识别人类情感状态的研究者之一。

(来源:illinois.edu)

在人机交互上,黄煦涛的研究方向包括视觉手部跟踪和手势识别,使用视觉唇读来增强音频语音识别的准确性,同时还致力于性别、年龄和情感的视觉识别。有一次,当他利用计算机视觉来处理名画《蒙娜丽莎》时,算法居然能读出蒙娜丽莎的笑容背后,情绪更接近悲伤而非快乐,该结果在当时受到了行业和媒体的广泛关注。

在 2015 年,黄煦涛与 Ann Willemsen-Dunlap 博士合作开展一个跨学科项目,开发了一种 3D 计算机生成的虚拟化身,能够显示适当的情绪,可用于线上场景向患者传达医疗信息。

随着计算机视觉不断得到应用,他还探索了使用高性能计算和大数据来开发更好的深度学习 ,这个方向正是当下计算机视觉领域最热门的问题之一。

直到 2020 年 3 月 30 日,还有一篇他参与署名的论文在预印本平台发布,这是一项探索计算机视觉如何摆脱大数据的桎梏更好地实现无监督学习的研究,关注的同样是计算机视觉领域眼下最关键的技术挑战之一(论文地址:https://arxiv.org/abs/2003.13623)。

群星闪耀的教育版图

在计算机视觉领域,许多人都习惯称他为 Tom。如今,黄煦涛在计算机视觉领域积累的学术成果,正在由他的学生们接下新的一棒,特别是诸多华人子弟,正在推动中国计算机视觉的发展。

例如,中国 AI 创业公司的 “计算机视觉 4 小龙” 商汤、旷视、云从、依图中,云从和依图都与他有关,云从科技创始人周曦、依图 CTO 颜水成,都曾师承于他。而且,据了解,黄煦涛不但会给予学术研究上的指引,当学生选择走出实验室的一亩三分地去创业时,他也会提供重要支持帮其铺路。

国内许多人工智能企业的领导者、技术负责人都曾跟随黄煦涛学习。得克萨斯大学圣安东尼奥分校计算机系教授、华为诺亚方舟计算机视觉首席科学家田奇,联想集团首席技术官、高级副总裁芮勇,无人车科技公司文远知行的 CEO 韩旭及其感知团队执行总监宁华中,奇点汽车的黄浴和文安智能的陶海等。

图丨 Guide2Research 排名中,黄煦涛谷歌 H-index 指数高达 155,世界排名第十二名,美国排名第 9(来源:Guide2Research)

除了工业界的创业新星们,黄煦涛的学生们也已遍布全球各大高校。他们作为中国早期在计算视觉领域的研究人员,在黄煦涛实验室中的所见所学,进一步帮助其为中国在该领域的研究进步及教书育人铺垫出良好的开端。

中电科技集团公司第十五研究所研究院,曾任包括 “通用指挥工作台”、“953” 工程总设计师”和 “通用信息处理平台” 在内的中国大型研发项目总设计师、副总设计师等职务的方家骐,在 1981 年至 1983 年曾前往美国伊利诺伊大学进修图像处理。此外,上世纪九十年代时任浙大副校长、原信电系系主任的顾伟康教授同样也曾在黄煦涛实验室中学习。

他还曾与现任罗彻斯特理工学院(RIT)校长大卫 · 芒森(David C. Munson)共同指导艾伦 · 布维克(Alan Bovik)。艾伦随后在得克萨斯大学奥斯汀分校担任教职,目前是图像和视频工程实验室主任。艾伦也已带出了众多博士生,其中最为出名的华人学者包括 SSIM 算法发明人、加拿大工程院与皇家科学院两院院士、滑铁卢大学的教授王舟。SSIM 算法是衡量两幅图像相似度指标的经典算法,广泛应用于工业界。此外,王舟也在 2019 年回归本科母校,成为了华中科技大学的顾问教授。

同样帮助 UIUC 黄煦涛实验室一门进一步 “开枝散叶” 的,还有密歇根州立大学计算机科学与工程专业的翁巨扬教授,以及美国西北大学的吴郢教授。

翁巨杨在 1982 年从复旦大学本科毕业,他是黄煦涛最早在国内招收的博士生。翁巨杨与黄煦涛共同编著出版过《Motion and Structure from Image Sequences》一书,随后他转向 “计算自主心智发育” 与机器人领域,并在 1992 年提出的 “数据增强” 和“最大化池”两个被广泛应用至今的技巧,对 CNN 的演化起到了积极作用。他在 2001 年于《科学》杂志上发表了自主心智发育的文章,提出机器人自主心智发育理论;同样也成为了这一领域 “祖师级” 的人物。

吴郢的本科与王舟一样,都毕业于华中科技大学,随后在伊利诺伊大学香槟分校师从黄煦涛并取得博士学位。他毕业后在美国西北大学任教并培养出了包括前微软亚洲研究院首席研究员华刚在内的多名学生。

(来源:麻省理工科技评论)

值得一提的是,吴郢和华刚分别在 2017 年和 2019 年担任过计算机视觉顶会 CVPR 的程序主席(PC)。虽然华人在计算机视觉领域的影响力现已举足轻重,但在早前担任过 CVPR PC 一职的华人不过寥寥数人。黄煦涛则是第一位担任 CVPR 程序主席(1992 年)的华人。第四位担任 CVPR 程序主席(2012 年)的华人是罗切斯特大学的罗杰波,而他也属于黄煦涛门下。罗杰波在纽约大学水牛城分校读博时的导师是他在中科大的学长、黄煦涛的另一位学生、现香港中文大学(深圳)理工学院院长陈长汶。

除此之外,黄煦涛还积极提携后辈,李飞飞的第一份 UIUC 教职就来自黄煦涛的积极推荐;上海科技大学信息科学与技术学院教授、IEEE Fellow 马毅博士毕业后也曾在 UIUC 与黄煦涛共事,并合作发表数篇高影响力的学术论文。

从事教育以来,黄煦涛直接培养的研究生百余人,随着众多学生继续在该领域 “开枝散叶”,还有数不清的受过他教诲与提携的学者,他对中国计算机视觉领域的影响已非“关键” 二字所能概括。

斯人已逝,黄煦涛在计算机视觉领域将依然是一座灯塔,其光芒会继续照亮计算机视觉人前进。