logo
登录 / 注册

刘斌:行走于算法世界和现实世界之间

头像
之江实验室
2022-05-11 · 人力资源(HR)/人事

在成为之江实验室PI之前,刘斌在产业界和学术界之间进行了多次切换。

在他看来,这样的跨界切换符合算法策略——基于已有经验寻找局部最优点,然后向外探索收集更多观测,去尝试跳出当前局部最优,进而发现更好的局部最优甚至全局最优。

从事理论与算法研究多年,算法思想已深入刘斌的思维方式和人生选择,也引领他解决了多个领域的实际应用问题。

追随兴趣指引的方向

在加入之江实验室之前,刘斌的研究生涯看起来有些跨界。

博士期间师从中国科学院院士侯朝焕研究员,从事目标跟踪算法研究。2009年,赴美国杜克大学从事博士后研究,跟随美国国家科学院院士James Berger教授深耕贝叶斯统计学,尤其是贝叶斯计算方法。与杜克大学统计学家以及康奈尔大学天文学家合作,设计出先进的统计计算方法,搜索太阳系外类地行星。

刘斌在深圳工作期间

回国后,刘斌先后在新型研发机构和头部通信企业工作,将过往所学应用于企业现实问题求解。在业界工作两年多后,刘斌选择进入高校,开展统计建模、机器学习、最优化方法等方向的基础学术研究。七年后,刘斌选择跳出高校,进入知名头部互联网企业,探索工业级实际问题的AI算法解决方案。

“不论是在产业界还是在学术界,每一段经历都会给我一些启发和思考。最终,一个个的点是可以串联成线的。”刘斌说,过往的经历看似丰富,实则有一条十分朴素的主线,就是听从自己内心的声音,跟随兴趣不断去开拓、加深自己的研究视野和认知深度。

刘斌对于贝叶斯统计学的研究兴趣始于读博期间。“当时,我选择了一种比较先进的算法思想来研究博士课题,这个算法思想就来自于贝叶斯统计学。”在美国做博士后期间,与世界范围内最顶尖的贝叶斯统计学家面对面交流,让他对这一领域的兴趣和认知得到了深化。

托马斯·贝叶斯,一位18世纪英国数学家,以其在概率统计领域的研究闻名于世,他提出的贝叶斯定理对于现代概率论和数理统计的发展有重要影响。

“贝叶斯定理很简洁,和其它形式简洁的物理定律一样,它刻画了宇宙中存在的本质规律。”刘斌说。

人类的发展阶段可以用统计学模型里的概念/术语来描述。这5个阶段分别是:建模(找到合适的参数来构建模型),进行观测并收集数据,基于模型描述数据的生成过程,建立模型参数和数据的联合概率分布,通过分析数据来进行反向推理、探求规律。

贝叶斯定理描述的是一种认知规律,它建模的对象是人对某一事件的“信念”,这个“信念”会随着收集到的数据的增多而发生变化。

“就像一个婴儿一样,他刚开始看起来茫然无知,但随着不断观察收集、处理数据,他开始变得‘有知’。每次有新数据进来,其认知就会发生一次更新。”刘斌解释说,这个动态的认知更新过程就可以用贝叶斯来刻画。贝叶斯方法在人工智能、生物学、工程、认知与神经科学等很多领域都有应用。

贝叶斯方法的力量

贝叶斯定理的简洁有力让刘斌醉心其中,也影响了他过去十多年的研究生涯。

刘斌在美国工作期间

在互联网企业时,刘斌基于贝叶斯动态多模型集成理论设计了新型智能推荐算法并落地该公司产品线,使其核心业务指标提升10%以上。

依靠算法模型,企业APP向用户推荐产品,然而由于用户喜好可能随着时间改变,算法模型的推荐有时显得不太精准。基于贝叶斯动态多模型集成理论,可以使多个模型在时间维度上共同协作,当数据反映出的用户行为表现跟其中某个模型假设更为贴近时,系统会自动加大这个模型的权重,使得算法给出的产品推荐更符合用户当下的偏好和需求。

刘斌介绍说,模型就像一个专家,能够进行预测或者辅助人类决策。当仅依赖一个专家的时候,人们只能接受他输出的结果,无法评估其所给出结论的不确定性和鲁棒性。而引入多个专家,每个专家都有其擅长的方面,让他们在不同的时间点上给出决策,再利用贝叶斯法则动态实时地给他们的决策分配权重,能够让最终的结论更加准确和稳定。

贝叶斯动态多模型集成理论为针对动态系统的鲁棒学习预测问题提供了一种强有力的建模与算法设计框架。除了上述互联网商业场景,该理论的另一个典型应用案例是植入式脑机接口。

在植入式脑机接口系统中,计算机通过解码在脑内植入的Utah阵列电极输出的脑电信号来判断人的意图,进而帮助人控制假肢等设备完成目标操作。由于运动控制期间大脑活动的即时噪音和神经可塑性变化,所采集到的脑电信号往往具有不稳定特征,这导致了译码模型难以长期有效。

将贝叶斯动态多模型集成方法应用于上述非稳态神经译码问题后,利用贝叶斯信念更新机制动态选择和组合多个候选模型,能够快速适应脑电信号变化,相比以往的译码方法在译码性能上具有明显优势。

挖掘深度学习的富矿

不难发现,不管是在产业界还是学术界,探究各种理论算法背后的工作机制和科学原理是刘斌研究工作的长期驱动力。

在互联网公司时,刘斌发现深度学习方法在产业界的应用已十分广泛,但它背后的工作原理仍然令人困惑。

“深度学习处理的对象是海量数据,一个深度模型有十几亿参数。对于这类模型,模型设计者们往往只是搭建一个框架,之后就退了出来,模型中的参数连接,每个参数的权重设置,都通过算法辅以大算力来求出。从输入原始数据端到端输出预测结果,深度学习的工作过程像是一个‘黑盒’”刘斌指出。

由于这种“黑盒”特性,当前的深度学习算法依赖高质量、带标记的大数据和强大的算力,具有鲁棒性差、不可解释,以及不太可靠等瓶颈问题。

“作为一个研究者,在使用深度学习工具的过程中,我很自然地会打很多问号,想要把问题弄得更透彻一些。比如深度学习模型告诉我明天会下雨,那我会希望更准确地知道是以99%还是60%的可能性下雨。尤其是在做安全攸关的决策时,人们需要了解算法输出结果的可信度和不确定性。”

刘斌希望,针对深度学习方法的现有不足,提供一些新的思考和解决方案,比如把贝叶斯动态多模型集成理论的优势和深度学习的优势结合起来,让深度学习框架具有不确定性推理能力,让深度学习的输出结果更可靠。

这也是刘斌再次选择离开产业界加入之江实验室的原因。在这里,可以从事前沿的基础理论算法研究,进行更加深入系统的思考,用一些深刻的数学工具、严谨的数学语言,按照科学的方式探索世界,挖掘深度学习和人工智能的富矿。

刘斌的团队也吸引了越来越多有志于基础前沿研究的人士加盟,从互联网企业算法专家岗位上辞职加入刘斌团队的王乐乐博士便是其中一员。

“在企业时,如果某项业务对算法精度的要求是95%,一旦达到,便不会再投入资源做进一步提升,也不会再去深究背后的原因,而是迅速将资源投向另一项业务。但实际上,通过挖掘背后的根本性原因,产生新的洞见,便有机会将指标从95%做到96%甚至更高。在之江实验室,能够专心地做研究,沿着一个方向,不断深入。”王乐乐说。

应用数学与机器智能研究中心组会,团队成员分享技术思考

撰稿 | 肖乐

编辑 | 陈航


刘斌:行走于算法世界和现实世界之间脉脉
阅读 53
声明:本文内容由脉脉用户自发贡献,部分内容可能整编自互联网,版权归原作者所有,脉脉不拥有其著作权,亦不承担相应法律责任。如果您发现有涉嫌抄袭的内容,请发邮件至maimai@taou.com,一经查实,将立刻删除涉嫌侵权内容。
相关推荐
最新发布
大家都在看
热门人脉圈
    头像
    我来说几句...
    脉脉App内打开