2019年,陈恺入选商汤“AI先锋”计划,在商汤开启新征程。成为OpenMMLab负责人后,他带领团队在GitHub(目前全球最主流的开源项目托管平台)拿下60000+Star,促进开源共享文化,助力商汤推动人工智能普惠化。
从校园到AI公司,从学术研究到团队管理,他如何在商汤全新出发?如何携手公司共同进步?当越来越多的AI新青年加入商汤,陈恺的成长故事也许能给我们一些启发。
商汤AI先锋陈恺
心有热爱,乘风而来,去追光
“小时候我就喜欢动手折腾家里的东西,会拆一拆、装一装小家电,也会去做一些小玩具。”回忆起童年时代,陈恺的动手能力就很强了。
他一直非常清楚自己想要什么,“我高中的时候就喜欢理科,选专业也是偏向理工科,在自动化系学习了很多方面的知识。”入读清华大学自动化系的前两年,陈恺主要将功夫花在基础课程的学习中,大三时,他开始接触科研项目,随着认知的逐渐深入,他对计算机视觉的兴趣愈发浓厚。
同样是这一年,商汤科技创始人汤晓鸥到清华大学举办了一场讲座,“那次讲座给我的印象很深刻,当时就觉得香港中文大学多媒体实验室特别厉害”。也正是这次契机,陈恺在大三暑期跟随汤老师的团队实习了2个月,对计算机视觉领域更加充满兴趣,他决定到香港中文大学申请直博,主要做目标检测方面的研究。
至此,陈恺一头扎进了计算机视觉研究的世界。
回忆起在香港中文大学求学的前两年,“那时候其实我主要与导师一起做科研”,陈恺在CVPR、ECCV、ICCV等计算机视觉顶级会议和期刊上发表了多篇论文。博三,陈恺开始参与更多学术实践,并带队参加了目标检测领域国际权威学术COCO竞赛,第一名的成绩让他与团队在圈内有了知名度。
陈恺在2017年CVPR会议上做报告
“希望为大家撑起一片荫凉。”
“当我们去发论文或开展一些非保密性质的项目时,很多人会将代码开源公开出来。”开源是一个公益性质的行为,也是一个促进知识交流的行为。但在前几年,开源还没有像现在这样流行开来。
“之前很多论文没有源代码,想要去复现一篇论文,其实并不容易,要付出很多时间和精力。”每一篇论文代码复现的背后,道尽了研究者的艰辛。
陈恺和团队想要解决这个问题。“我们既然已经做了这么多的努力,其实没必要让更多人再去走重复的路。”
工作中的陈恺
参与COCO竞赛之后,陈恺就萌生了想要将代码公开的想法,“我们把比赛期间复现的各种论文代码,以及自己的创新成果代码都公开出来了,MMCV和MMDetection两个开源库就做起来了。”这也是陈恺最开始主导的开源项目,他希望用开源的力量,让更多的人受益。
2018年,MMCV和MMDetection两个库开源后,在网络社区大受欢迎,“领域内做目标检测的一些比较知名的学者、研究组,都对我们的工作表示了肯定。”
这次有意义的尝试让陈恺和导师受到了鼓舞,他们发动更多同学参与进来,不断拓展和丰富开源项目。
成为AI先锋,开启新征程
2019年,陈恺博士毕业,众多企业向他抛出了橄榄枝,但他选择加入商汤。“我看到了商汤的发展潜力。”他成为了商汤第一批AI先锋。
彼时商汤已成立四年,处在高速发展时期。与已经较为成熟的公司相比,商汤为他提供了快速成长的机会。“我能够独自负责一块事情,随着公司的发展得以快速进步,个人能力也在迅速提高。”陈恺在商汤第一份工作是为业务团队建立算法中台,同时负责OpenMMLab的运营。
商汤提供的不仅仅是机会,还有多元化的资源。与技术、产品等不同岗位的同事协作,他培养了多样化的思维,也学习到了很多新技能。“商汤人才云集,大家都很有创业家精神,在这样的氛围下我会不断去完善和精进自己。”
知其然,更要知其所以然。“读书的时候,我只需要去研究怎样把一个算法精度调得更高,但是商汤教给我的第一课就是落地,要从源头去关心这个数据是怎么来的。”接触到实际的项目后,陈恺意识到自己还有很大的成长空间。在一个个的项目实践中,他始终高标准要求自己,快速成长着。
陈恺在GOTC 2021全球开源技术峰会上做分享
促进开源共享文化,降低AI研发门槛
在AI领域,开源同样是算法迭代与创新的主要驱动力。商汤近年来一直在AI开源过程中扮演积极角色,贡献了国产人工智能视觉算法框架OpenMMLab,并基于此与众多科研人员和行业参与者建立了密切联系,促进开源共享文化,降低AI研发的门槛,持续推动AI社区乃至产业的繁荣。
近两年,OpenMMLab发展迅速,陈恺与团队一直在扩大其影响力。“前几年,我们做了一些像MMDetection这样比较知名的项目,但现在,做到单个项目知名是远远不够的,我们还要去打造整个体系。”
道阻且难,但只要坚持,必有回响。2019年11月,OpenMMLab陆续开放了多个开源算法工具箱;2020年,商汤在世界人工智能大会上发布了重要升级,进一步构建出“人工智能算法开放体系”;2021年,团队又发布了不少新的算法库,包括MMGeneration、MMOCR、MMTracking等……目前,OpenMMLab已经是深度学习时代最完整的计算机视觉开源算法体系。
截至目前,OpenMMLab已经在GitHub获得60000+ star,“可以把star理解为点赞,表示用户对这个项目的支持,60000+ star在整个人工智能领域也是顶级影响力的项目。”这一数据也代表着陈恺和团队在开发者中有比较广泛的影响力。陈恺及其团队将OpenMMLab发展到了崭新的高度。
OpenMMLab团队获得商汤2020年杰出团队奖
目前OpenMMLab提供了覆盖大部分视觉方向的算法,使用起来非常方便,也有很多公司采用OpenMMLab作为内部研发工具。商汤努力降低人工智能对中小企业的准入门槛,致力于推动人工智能技术普惠化。
“谢谢你们,改变了我的人生轨迹。”
“其实有些开源项目把代码放出来之后就不再管了,大家也称为‘KPI’开源,但是我们会持续地会为这个项目做努力。”付出总是有回报,说到这几年的收获,最触动陈恺的其实是一些真实用户的感谢。
“恺哥您好,我是mmdet老用户了。本科的时候贪玩没好好学习,后来,我在mmdet基础上去打比赛,拿了两个亚军,得了不少奖金,也通过项目换来了读博的机会。我的父母也为感到开心。非常感谢恺哥能开源mmdet,感恩!在我看来,也许在冥冥之中改变了我的人生轨迹吧……”
OpenMMLab用户们发来的感谢信节选
这是陈恺收到的众多感谢信之一。
莎菲德拉曾说过,理想并不是一种空虚的东西,也并不玄奇,它既非幻想,更非野心,而是一种追求真美的意识。“有用户说OpenMMLab改变了他的人生轨迹,其实这件事情,也给我们很大的激励。我们的成果和努力不是虚的,它能够真实地影响一些人。我想,这就是我们一直坚持的意义与价值。”陈恺说。
管理团队需要“谋事”和“聚人”
随着团队规模的扩大,陈恺慢慢摸索出一套管理团队的方法与心得。他认为带团队首先自身能力一定要过硬,特别是在带小团队的时候,经常要和大家做很多一线的工作,大家解决不了的问题,自己一定要有能力来帮助他们解决。“我现在主要的工作是‘谋事’和‘聚人’。”
陈恺与团队成员们的合照
在“谋事”方面,他将不同研发方向分成不同小组,每个小组培养一个leader,他分享道:“我会制定全年度的工作安排与计划,与各个方向的leader讨论目标具体的实现,也给与他们自由度和成长空间。”
在“聚人”方面,除了吸引人才,陈恺也在思考团队的培养。“怎样将他们留住,帮助他们更好地发展也是我需要思考的。目前公司也有比较完善的人才培养机制,都做得比较系统了。”陈恺在部门内部也逐步形成了一些经验,目前已经积累了至少10万字的新人培训文档,体系越来越健全。
从100到1000,探索之路无穷
“从0到1再到100我们知道应该怎么做,但是从100做到1000,这条路如何走我们还需要不断探索。”还不到30岁的他,脸上还保留着年轻人的纯真眼神,却拥有着远超同龄人的眼界和认知。
谈及对未来的规划,陈恺提到两个方向,“现在OpenMMLab已经有比较大的影响力了,如何把框架做得更好、提高框架的领先性,并且改善用户体验,是接下来我们要努力的目标。”
OpenMMLab团队获得商汤原创奖提名
“现在我们不仅仅做开源框架,还会做一些开放性平台。”这也是陈恺及团队的另一个探索方向。之前的框架对用户要求比较高,需要用户懂代码,并熟悉这一领域。而现在,陈恺团队想要做的平台产品,会更方便大家获取算法能力,“比如在浏览器中,大家鼠标点一点就可以完成一些事情,这个也是下一阶段比较重要的一项工作。”
成长不设限,多仰望星空
对于年轻人来说,每一步探索,都独具意义。从学术研究到团队管理,数年人生旅途,陈恺看起来一路顺畅,背后却是他日复一日的坚持与自律,在学业和工作中的拼搏进取。
看到越来越多的AI新青年加入商汤,陈恺也分享了自己的心得,“给自己少设一些边界,去接触更多的知识与技能,不要只着眼于现在,多仰望星空,做一些长远的打算。”
陈恺是知名开源框架MMDetection作者,至今在CVPR、ECCV、ICCV等计算机视觉顶级会议和期刊上发表二十余篇论文,谷歌学术引用超过4000次;两次获得目标检测领域国际权威的COCO学术竞赛第一名。
开源赋予了陈恺不断学习的自发动力,他怀揣着人文关怀和社会责任,在激烈的社会竞争中变得更加出彩。每一个有理想的人,只要脚下有行动,便能在时代发展中发光发热。我们有理由相信,这个年少有为的年轻人,前方还有更加精彩的未来,正等着他。