8月15日,ACM SIGKDD 国际会议(简称KDD)颁布了若干奖项,来自密歇根州立大学数据科学与工程实验室(Data Science and Engineering Laboratory)的汤继良教授荣获新设立的第一届KDD年度新星奖(Rising Star Award)。
该奖项的设立旨在表彰KDD社区里在博士毕业五年内便获得卓越科研成就的年轻学者,汤教授获得该荣誉的原因在于他在特征学习(尤其是图和图在网络、社交媒体和智能教育上的应用)领域所取得的杰出成就。
汤老师的学术成果卓著,在影响因子期刊与多个顶级学术会议发表过上百篇研究成果。他的研究贡献具有开创性,探索了数据挖掘领域的新思想或新方向,因此被其他研究人员广泛引用。他论文引用量突破12000次,h-index 52, 超过30篇论文的单篇引用量超过100,并屡获学科领域大奖,其中包括美国自然科学基金杰出青年奖 (NSF Career Award),KDD最佳博士论文奖亚军和顶会如KDD与WSDM上获得7次最佳论文奖(包括提名)。
汤老师的研究课题主要围绕两方面:一是算法研究,二是如何应用算法解决业界实际问题,比如与京东合作优化购物网站的推荐系统,与好未来合作如何将AI应用于教学设计。
在私下的来往中,我们发现汤老师是一位性格随和、低调谦虚又满怀感恩的人,自称“智商一般”,但却有着勤奋与踏实的行事风格。AI科技评论有幸对汤继良老师进行专访,并与汤老师交流他的科研故事,希望能为青年学子、尤其是正在迷茫中不知出路的年轻人树立一个榜样。
尽管北京理工大学是全国名列前茅的优秀院校,但对当年的汤老师来说,他与母校和计算机专业结缘,源于“高考失利”。
在2008年本科毕业之际发表于北京理工大学期刊上的文章《大学的符号》里,汤老师曾记载自己在大一上学期的颓废与迷茫:“最初的理想没有了,斗志没有了,连人生的信念都没有了。”没有对大学的美好憧憬,每天的生活就像“行尸走肉”一般。用汤老师的话说,就是《被嫌弃的松子的一生》里的经典台词:“我感觉我的人生完了。”
汤老师最初的理想专业是数学与物理学等基础学科,因此在上第一门计算机专业课时,他甚至是“痛恨”、后悔选择计算机,因为他对计算机专业几乎一无所知:在上大学前,他与计算机为数不多的交集只是用计算机玩过几次一款当年很火的游戏——《传奇》。
颓废了一个学期之后,汤老师决定重拾高中时代的学习热情。大一第二个学期便开始刻苦学习专业课程,并开始阅读大量计算机专业知识,大一刚开始接触C语言便挑战最难的大作业——编写俄罗斯方块。当时没有自己的电脑,他便抓紧在机房学习的每一分钟,提前在纸上写好程序,等到上机时便只做那些觉得有问题的题,每日奔跑于机房与图书馆之间。
等到上了大三,汤老师的代码量已经突破10万行,他开始接触自然语言处理,并在老师的委任下负责项目里的核心代码开发。尽管英语能力一般,但汤老师大三期间坚持阅读了10本以上的计算机英文专著。由于一直保持着优异的学习成绩,他被免试保送至本系继续攻读计算机软件硕士。
本科期间,汤老师曾沉迷《史记》,总结出一个人生哲理:“高尚的人有高尚的灵魂,成功的人总走一条坚持不懈的路。”在之后的读博、就业与科研生涯里,他也一直坚信,乐观向上、勤奋隐忍、坚持梦想并为之付出百分百的努力,是进步的不二法则。
研究生毕业后,汤老师便去了美国亚利桑那州立大学攻读计算机博士,并有幸师从著名的数据挖掘专家刘欢教授。说起申请博士的面试经验,汤老师回忆,他在出国之前的英语能力就相当于“菜鸡”,连面试官(一位印度师兄)的英文提问都听不懂。但是,机智的汤老师提前准备了一些面试问题并写好了答案,虽然听不懂面试官的问题,但面试官一停顿,他就想应该是问完问题了,然后对照念自己的答案,没想到居然顺利通过了。
回忆读博的历程,汤老师感慨:“那是一段痛苦又快乐的经历。”几乎每天工作10多小时,一周7天,天天如此。他用PHD三个字母总结自己的读博生涯:Push(不断逼迫自己)、High aim(不仅是求顺利毕业,还要有更高的目标,比如成为该领域的专家)、Dedicate(要聚焦于某个方向,克服芝麻与西瓜两手抓的心理)。
直到读博,汤老师才发表了第一篇国际顶会论文,由导师刘欢老师指导。汤老师形容自己“智商一般、基础比较差”,比如在美国考驾照考了3年19次才通过考试,在北京学习生活了6年普通话也没有变好。
汤老师自认为是一个能力在平均水平的人,但他觉得,这并不是坏事,“作为平均人有一个好处就是,我们的心态特别好,我们不需要时时刻刻保持做到最好,只需要做到比过去的自己更好就很高兴;同时我们还不怕失败特别能够坚持不懈,就像我考驾照,失败了18次,那就再考第19次。”
“我能有今日成绩,主要是在对的时间,遇到对的人 (导师和小伙伴),并入对了行(研究方向)。同时也归功于自己的清晰的认识到自己一般的基础和水平;让我做事情更加有耐性和毅力。”2017年,汤老师所发表的论文在Google Scholar上的引用次数为2000+,直到今天,仅仅三年,引用次数已达到12000+。
从“小地方”到大天地
最近,“小镇做题家”的概念在豆瓣与知乎上很流行,指的是来自农村地区的贫寒学子依靠题海战术与高压学业训练考进一流高校,但在读大学期间乃至毕业后变得泯然众人,甚至面临“毕业即失业”的风险。
从小地方来到大城市,无论对初出茅庐的青年学生还是工作打拼的社会人,对大城市里俨然不同的人情世故感到陌生与不适应,是很正常的。有人会因为自卑而消沉、一蹶不振,也有的人能够及时调整好自己的心态,把握见识的机会,不断提升自己,寻找更广阔的天地。
“我是小地方出来的。”时隔16年,汤老师回忆起高考后刚到北京时的心情,有不适应但期待更多,这与他处理高考不如意的结果时采取的态度是相似的。
如果按“小镇做题家”们对自己处境的自嘲式提法,可以说汤老师与“小镇做题家”们有着一个类似的起点。但不同的是,汤老师并没有像他们一样依然沉迷于中学时期形成的做题世界,而是在新环境中经历了短暂的失落和迷茫之后能正视自己的“平庸”,并勇于走出自己的舒适区域,用实际行动去撕掉曾经困扰自己的一个个标签,走出了与“小镇做题家”们不一样的道路。
谈及高考失败对自己的改变,汤老师认为,“负面影响只是短暂的,正面影响才是长久的。”虽然我们永远也不可能知道高考成功后的人生是否更精彩,但我们可以看到,汤老师在今日所取得的成就是可人的。
汤老师谈到,在上大学之前,他可能只是擅长做题与考试。直到高考“落榜”,他第一次体会到:原来人生是有挫折的,人生是会失败的。原先在小地方总考第一名,便理所当然地对自己有很高的定位,后来才发现在这个世界上“山外有山,人外有人”。至于高考失利的压力,与后来的人生难题、大学学习和科研过程相比,更是无足轻重。
他还提到,以前自己的脾气特别差,“但上了大学之后,脾气变得特别好。”感觉人成长了不少。对自己有了一个更全面的了解后,汤老师总结,在资质一般的情况下,自己只能努力追赶、付出更多的时间,才有可能取得更高的成就。也正是因为汤老师对自我的觉悟,即使如今要一边照顾刚出生的小女儿、一边带领学生做实验与研究,他始终对自己的科研工作保持着极高的热情。
值得一提的是,高考结果的不如意也让汤老师收获了美满的幸福。汤老师与太太是高中同学,太太的考试成绩不如汤老师,但由于汤老师的高考分数比平日考试的分数低了,因此与太太在同一年进了北理工,继续成为校友,后来又同年去美国留学。在本科时汤老师一度打算毕业后离开北京去其他城市打拼,当时的准女友、后来的太太的态度成为了汤老师留下来的最重要因素;而在之后艰难的科研生涯里,太太的支持一直是汤老师的后盾。
乐观迎接挑战,使汤老师不仅能克服短暂的高考阴影,也不断突破自己的视野。
虽然一开始对大城市的生活很懵懂,但他的心态很好。遇到优秀的人与事,他不会看低自己,而是会思考:“我能不能变得跟他们一样强?或者是,有哪些方面我可以向他们学习?”他很乐观,就像高考前一个月压力大到每天晚上都失眠、差点都以为自己抑郁了,但高考结束当天,马上睡了一个好觉。“去到大城市,让我们看到更大的世界和更强的人,让我们萌生更加多的想法和梦想。”
大城市更注重素质教育,小地方的学生更多时候只会做做题,但汤老师认为会做题也是一种优势,因为大学学习也需要做题。如果你会做题,相对容易考到一个好分数,然后有时间学习他们的长处,弥补自己的短板,“既要看到别人的长处,也要肯定自己的长处 ,不要还没尝试就否定自己。”汤老师感觉自己的眼光与各方面的追求在北京呆了几年后也提升了许多,这是毋庸置疑的。“想去更多的地方看看。”再后来,汤老师从北京去美国读书,对世界的见识也更广阔了。
“至少先去看看更大的世界,能不能融合是另一回事。如果看完了觉得压力大,不适合自己,那可以再回去,但你也长见识了,还是有很多额外的收获。”勇敢与豁达穿梭着汤老师的奋斗。无论是面对艰辛的学业、陌生的环境、差距悬殊的实力,还是异国截然不同的生活方式和科研环境,汤老师都以一种“敢想”与“敢做”的积极心态去面对:
回忆起大学的读书时光,汤老师唯一感到遗憾的是自己在课余时间没有多参加课外活动、体验青春生活。直到读博,才开始给自己多找点乐子。“其实丰富的课余活动对专业学习是有帮助的。”
亚利桑那州立大学所在的凤凰城是个非常舒服的城市,生活环境对华人非常友好。汤老师表示自己一开始是有社交恐惧症,不太喜欢做社交。读博士的时候,汤老师在这方面彻底改过来了,现在大家都看不出来他曾经是一个非常内向的人。他说道,“在一个陌生的环境里,不主动去社交的话,真的交不到朋友。”
汤老师回忆称,他在美国交了四类朋友。第一类朋友是实验室的同学和师兄弟,他们相互之间的相处氛围特别好,经常一起参加活动,比如爬山和自驾游等。他们做到了科研和娱乐两不误,科研的时候就专心一致,玩的时候也放得很开。
汤老师实验室2019年北密之旅(我们玩也是很认真的)
第二类朋友是最开始到美国的时候一起住的室友。去美国的第一年,他们6个人一起住一个house,并约定一起做饭。“当时我们每天都带饭去学校,早晚两顿饭,相当于我每晚要做12个人的饭菜。”在这段时间里,汤老师的厨艺可谓突飞猛进。有很多舍友都比汤老师年轻,有着各种奇奇怪怪的想法,和这些舍友的相处让他大开眼界。
第三类朋友是住在同一个小区里的华人,汤老师原本很内向,但是在异国他乡,只要见到华人就会很兴奋,每次去过一个小区就能认识很多的朋友。
第四类朋友是在学术会议里认识的同道中人。汤老师读博士期间每年大约要参加四到五个会议,位置遍布全世界,包括亚洲、北美洲、南美洲和欧洲的许多国家,每次开会都能认识很多朋友。在本科期间还是技术宅的他,在读博期间克服了社交恐惧症,生活变得丰富多彩。
汤老师说,这种经历为他打开了新天地,并且不但没有影响他的科研工作,反而为他带来了更多的机会,开阔了视野,认识了学术界和产业界的各路人才。
回想起自己的大学生活,汤老师不免有一丝遗憾。虽然也有几个很铁的朋友,但都局限在同一个实验室一起做项目的同学,但是原本大学才是拓展圈子的最好时候。在读博期间,汤老师不得不逼迫自己在一个陌生环境中走向外部世界,才使得那段时期的生活开始变得精彩。
汤老师自我分析道,在本科期间的状态,首先是因为自己没有争取,其次是因为确实自身存在一些障碍,第三是当时只一心想着学习和找工作的事情。但其实,人在不同的平台时,想法都是不一样的。也是后来不断深入学术界的经历,让汤老师的想法变得越来越大胆。
鱼与熊掌不可兼得
汤老师曾经在雅虎和IBM实习,在雅虎工作了一年半的时间,并且还取得了不错的成果,“或许正是因为自己的基础和资历都不突出的关系,我做任何事情时心态都非常好,态度很踏实,能做到干一行爱一行。”
“最初到雅虎工作的主要原因是想结束和女友的异地恋,”汤老师解释道,“同时也想看看,做科研项目和企业项目之间的差别。”
在雅虎工作期间,汤老师也没有中断科研。汤老师每天早上5点起床,然后利用上班前五点到九点之间的空余时间做科研,下班后又继续钻研自己的课题。
汤老师发现,企业与高校之间工作还是有差异的。如何选择,就看哪种更加适合自己。在企业呆了一段时间后,汤老师还是觉得自己更加喜欢高校。高校可以自己做主,根据自己的兴趣决定研究课题;企业内的研究课题是根据企业的市场定位、发展规划等诸多因素决定的。如果想做研究,企业模式下,很多个人感兴趣的研究是无法进行的,因为涉及隐私、专利等诸多限制。
高校的科研工作,取决于自身研究兴趣,而且还可以培养学生,组建研究团队。相比而言,企业界的科研没有高校这么自由。公司项目大都是比较短暂的,完成一个就换另一个,市场导向明显。高校学术研究可以根据兴趣和学术热点,进行未来5-10年长期项目的研究。
高校里导师可以跟一批年轻人工作,年轻人可以带来许多新的东西。例如,虽然我们不太了解90后人群,但是因为我们的学生是90后,通过接触,也就慢慢理解他们的想法与特点了。由此,一个人就不会失去活力,而且还可以去影响他人。比如帮助本科生找到好的工作,帮助博士生从知之甚少到逐渐成为这个领域的专家,这个在高校是可以做到的。相反,企业不可能给你时间让你逐步成长;但在高校,教授愿意投入精力把学生打造成符合社会需要的人才。
“鱼与熊掌不可兼得。”出于对科研的热爱,在企业与高校间,汤老师最终选择了后者。很多人可能觉得科研很苦很枯燥,但对汤老师而言,科研是一件快乐的事,尽管工作上很刻苦,但是精神上很享受。汤老师透露,从硅谷转向高校,自己的收入只有原来的三分之一,但是在科研中带来的精神享受远远超越了物质上的回报。
“培养一个人比开发一个产品,能给我带来更大的成就感。”汤老师提到了自己的一个学生,最初接触到对方的时候,对方还什么都不懂,之后在四年的时间里,汤老师将其培养成了行业专家。汤老师看着这位学生,就像看到了当初迷茫的自己一样,他希望自己也能像自己的导师一样,完成导师的职责,实现精神的传承。
实验室2019年合影
科研之路漫漫,吾将上下而求索
汤老师过去十年一直做图上的特征学习以及相关应用。在博士期间做图上的特征选择,是该研究方向的开创者之一。在博士后期到现在做图上的表征学习方面的研究。表征学习和特征选择不一样的地方在于,特征选择是在原有的特征中进行挑选,而表征是学习新的表达和特征。同时,汤老师还将研究扩展到社交媒体,电商和智能教育的应用中。
这三年来,汤老师的Google学术引用数从2000多一直很快的增加到12000多,一方面是因为汤老师和导师刘欢是研究特征选择方面的专家,所以他们的关于特征选择的论文都是最前沿的,都能够得到很多的关注。
另一方面,汤老师是早期将深度学习用在图上做表征的研究者。此外,他也把在图上做表征学习和特征选择的算法进行了实际应用(比如说推荐系统,社交媒体)。而近几年来随着深度学习受到越来越多的关注,在图上做表征学习也成为研究的热点。所以汤老师的相关工作得到的关注度也比较多。
汤老师对此打趣道:“就像雷军说的一样,猪在风口上也可以飞。”
汤老师表示他们马上会出一本图深度学习的书,过去10年的领域做的事都会总结在这本书上。该书中英文将同时出版。英文原版由剑桥出版社出版,作者包括马耀和汤继良。英文翻译版将由电子工业出版社出版,作者包括王怡琦、金卫、马耀和汤继良。
除此之外,汤老师实验室其他研究包括开发高效率的,隐私保护的和具有鲁棒性的机器学习算法。汤老师组开发的关于机器学习对抗学习的工具包deeprobust,也得到了行业很多关注。
汤老师与KDD的第一次交集在2012年的北京。当时汤老师投了两篇一作论文,两篇都被选上了。在之后的2015年曾获得KDD最佳博士论文的亚军,2016年还曾获得KDD最佳应用论文奖。因为感恩KDD所给予的机会,所以汤老师从2015年起便一直为KDD会议做一些力所能及的志愿者工作,如担任会议组织者与协调会议举办等。
关于获得今年KDD新星奖,汤老师感触良多,将这份荣誉归因于一路陪伴自己、帮助自己成长的亲友、前辈与学生。
“首先就是感谢我的导师把我带入这个领域,也教我怎么去做研究。我自己本身还有很多的合作伙伴,包括刘欢老师实验室的一些小伙伴。还有我实习时候的一些导师,包括 Charu Aggarwal,Charu是数据挖掘的一个大牛,他是我在 IBM 14年实习的导师,我们一直合作到现在,他给了我很多帮助;还有常毅是我在雅虎实习的导师,他现在是吉林大学人工智能学院的院长,他当时也给了我很大的帮助。当然我还要感谢我现在的学生(Tyler Derr,王志威,赵翔宇,马耀,刘孝睿,Hamid Karimi,刘皓宸,许涵,Jamell Decon,范文琦,王文韬,金卫,王怡琦,李雅欣,刘华和李娟慧等),很多研究主题没有他们的帮助和合作,我一个人是不可能做到的。”
传承师风,教书育人
汤老师的导师给他带来了很大的影响,他从导师那里学到了如何引导学生,即要充分信任、了解、帮助和鼓励学生,毫无保留地教导学生,导师自己也要以身作则,营造融洽的团队氛围。谈起这次的评选,汤老师认为离不开恩师与多位前辈的提携,如提名他为候选人的刘欢老师,为他写推荐信的Charu Aggarwal、Anil Jain以及著名的社会学家H.Russell Bernard,和奖项的主席裴健老师和奖项评选委员会。
“作为导师,最重要的使命,就是要打造一个平台,让学生可以充分发挥自己的能力,自由地表达和发展。”汤老师认为,导师和学生之间不是上下级或者老板员工的关系,而是合作者和朋友的关系,在他的团队里,学生和他都是以名字相称,像朋友一样直呼他“JT”。
在汤老师当上老师的第一年,由于缺乏经费,实验室发不起自己和学生暑假的工资。但是如今,汤老师带领的DSB Lab已然成为人员齐备的团队。汤老师说道,主要还是靠“敢想敢做”这四个字。
在当时实验室没有任何经费的情况下,汤老师也硬着头皮请了四个学生,这是非常冒险的行为。如果实验室后面也没有拿到经费的话,第二年是不可能再运营下去的,这对于学生而言风险也很大。
“在一个实验室里,最重要的是人,而不是经费。只有人才能作为良性循环的开始,启动科研项目,最后才能让项目获得承认,取得经费。所以即使经费不够,也要先招人。实际上,我经常会招超出经费预算的学生,一方面是给我自己压力,一方面也让我更加重视学生本身。虽然第一年压力很大,但最怕的事情不是失败,而是不敢走出第一步。”好消息是,汤老师在第一年就获得了接近一百万研究经费。
汤老师的第一位博士生Tyler Derr已加入具有南方哈佛之称的范德堡大学计算机系担任助理教授,并开始招收第一个博士生。今年,在Tyler准备入职面试时,汤老师原准备回国国春节,但因为与Tyler面试时间冲突,汤老师选择推迟行程,帮助Tyler一起准备。“我什么时候都能回家,推迟几天或者明年也行,但如果你面试不成功,可能会影响你一辈子。”
“学生要勇敢地表达自己的想法,而不是一味地觉得导师说的都对。”汤老师说道,“假如一个学生说我说的什么都对的话,我一般都不会喜欢这个学生,这样的学生最多就只能成为部分的我,而我希望我的学生能超越我,做的比我更好。”
所以,汤老师在面试学生的时候,有自己独到的方法。他一般不会问技术性的问题,而是问一些在学术研究过程中会遇到的一些原则性问题,以此来评判学生的学术品质。比如,他会问学生,“假如有A、B、C、D四位学生,你是A,实验室要投论文,因为时间紧急,只能投B、C、D的文章,你的论文就不能投了,你会怎么办?”雷锋网
汤老师解释自己的用意,“如果是真正在论文上花了时间和精力的,就会坚持要投自己的论文,或者至少让我说出足够的理由,才能同意不投自己的论文。这样的学生有主动学习的动力和不服的精神,我也更加看重这种学生。”在汤老师这种不按套路出牌的面试中,学生都会表现得很放松,“当学生放松的时候,我才能更加了解他们真实的一面。很多时候我并不是选学生,而是选可以做一辈子的朋友”雷锋网
“到目前为止,该面试学生的方法还蛮奏效。招到的学生学习主动性强,敢想敢做敢拼“。高年级的博士生如Tyler、志威、翔宇和马耀在顶会如KDD、AAAI和SIGIR多次组织研讨班(workshops)和讲习班(tutorials)并开始在行业的暂露头角。许涵,李雅欣,金卫和刘孝睿主动的开发了用于对抗学习的工具包deeprobust并设计了详细的文档。马耀、金卫和王怡琦编写了第一本详细的介绍图深度学习的书。雷锋网(公众号:雷锋网)
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/138393.html