入职MIT,中国科学家揭秘大脑,阐述大脑如何从A任务切换到B任务

“神经科学以前在国内是一个很小众的领域,十年前我在北京王府井大厦购买相关书籍,也只买到了区区几本,” 谈及自己的研究领域,刚刚入职麻省理工学院(MIT)的 31 岁学者杨光宇告诉 DeepTech,不过虽然小众但却无法拦阻他的热爱。

图 | 杨光宇(来源:受访者)

事实上,神经科学正在繁荣发展,在神经科学数据的采集方面,它的发展速度比摩尔定律还要快,并呈现出指数级增加。比如,马斯克的脑机接口公司 Neuralink 是神经科学大领域的代表性公司之一,谷歌旗下的 DeepMind 公司也做神经科学。

2021 年 5 月,当期 Nature 封面论文介绍了一项意念打字的成果,斯坦福大学神经假肢转化实验室的里希纳谢诺伊(Krishna Shenoy)教授参与了该研究,而谢诺伊正是神经科学领域的代表性学者之一。

在 Nature 子刊发文,“揭秘”人类大脑神经元如何从A任务切换到B任务

几个世纪以来,人类对于大脑的探索从未停止。在神经网络被作为大脑研究方法之前,科学家研究大脑时一般使用较为固定的方法,比如让小白鼠等动物作为被试者去做某个任务,然后观察它在做任务时大脑里的神经元活动情况。

但这也造成一个缺陷,即很难训练动物做多种任务,而人类大脑经常会进行多任务思考。这也是为何在神经网络诞生之前,科学家对神经元如何从 A 任务转换到 B 任务的研究较少的原因之一。

此前科学家已经获悉,大脑前额叶皮层对诸多认知功能都起着重要作用,并在任务表示中起到核心作用 。在动物行为学的实验中,人们发现前额叶神经元在给定任务方面起着功能混合的作用,但目前尚未从神经元层面得到解释。

(来源:受访者)

想象一下,如果你的大脑要处理许多不同任务,处理的时候是每个任务都由专属神经元来完成?还是多项任务同时共用神经元?亦或是介于专属和共享之间?

2019 年,杨光宇和合作者曾使用神经网络深入研究了上述问题,相关论文以训练完成许多认知任务的神经网络中的任务表示(Task representations in neural networks trained to perform many cognitive tasks)为题发表在 Nature Neuroscience。

该论文的成果,是训练一个神经网络去做 20 个认知科学中比较常见的认知任务,这些任务依赖于记忆、决策、和抑制控制等。

图 | 相关论文(来源:受访者)

杨光宇告诉 DeepTech:“经研究发现,神经网络会涌现出很多模块,每个模块负责某一种特殊的计算功能,当这个网络完成一个任务,它会把不同模块组合起来,而一个模块还可参与到多种任务。”

为继续探究这一问题,杨光宇和团队使用训练循环神经网络(RNN)的方法,去训练一个循环神经网络来执行 20 个互相关联的认知任务。其中的大多数任务,都经常被用于非人类动物的神经生理学研究中,因此它们是了解认知神经机制的非常经典的任务。

选定的任务集包括:记忆引导的反应、简单的感知决策、上下文相关的决策、多感官整合、参数工作记忆、抑制控制(例如坚持不要眨眼)、延迟取样匹配等。

(来源:受访者)

而杨光宇所设计的神经网络架构,既可以通用地执行以上所有任务,又能简单地进行分析。其中,对于每项任务,神经网络都会接收三种类型的输入:固定、刺激和规则。

固定输入会告诉网络到底是该定住、还是要做出例如扫视的响应。因此固定输入的减少,意味着能让神经网络向前进。刺激输入有两种模态,每种模态都由一圈输入单元表示,这些输入单元可表示不同的一维变量信息,例如前进方向、以及色彩转盘颜色。

每一次试验中,规则输入都会被激活一次,来指示神经网络当前该执行的任务。神经网络会将这些输入映射为一个固定输出单元和一组运动单元,它们可把响应方向编码成输出环上的一维变量,比如扫视方向和到达方向。

图 | 循环神经网络及其输入与输出的实例(来源:受访者)

值得注意的是,在该神经网络在被训练之前,它无法独自执行任何任务。而训练它的方法是监督学习,该方法会把所有输入、循环和输出的权重进行连接,从而不断缩小神经网络输出与目标输出之间的差异。

需要指出的是,在训练期间,神经网络的任务训练顺序是随机交错的。在下图中即可看到经过 256 个循环单元的后神经网络训练的结果。由图可知,对这一规模的神经网络来说,训练结果是足够稳健的。经过训练后,神经网络模型在执行 20 个任务中的每一种任务,都表现出了高行为性能。

图 | 经过训练之后,神经网络在执行每一种任务中都表现了高性能水平(来源:受访者)

在同时训练神经网络执行多项任务后,多项任务的表示会以聚合方式来呈现。为了模拟人类学习过程,杨光宇又训练神经网络去连续执行多项任务。最终发现,连续训练与同时训练多项任务之后的神经网络完全不同。

此外,杨光宇还通过系列测试,展现了神经网络的行为特征与动物研究所得出的结果一致。甚至在感知决策任务中,神经网络表现出更好的连贯性,还能处理来自不同来源的信息从而形成决策。其中,在工作记忆任务中,神经网络能够保存信息长达 5 秒(单个单位时间常数的 50 倍)的时间。

(来源:受访者)

最新成果是用神经网络去模拟嗅觉

杨光宇于近期上传至预印本网站 BioRxiv上的成果,是用神经网络去训练果蝇。具体来说,大脑中有很多神经元,这些神经元组成一个神经网络。此前人们觉得大脑中的神经网络和深度学习中的神经网络没有关系,即便有关系也只是大脑神经网络对于工程神经网络的启发,而事实上深度学习也会用到神经网络。

目前,他的主要工作是为大脑建立模型,最终想达到让人工神经网络实现嗅觉任务。经过训练之后,神经网络之间的神经元可建立相互连接,这和果蝇嗅觉的神经网络之间的神经元连接非常类似,甚至呈现出了定量性的类似,而这是非常罕见的发现。

在神经科学领域,给大脑建模是一项重要的研究方法,它可以弥补理论物理的一些局限性。简单的说,理论物理要通过总结公式来解释各种现象。

但只通过简单的公式,有时无法解释大脑的复杂现象,这时就可建立模型去模拟一些复杂现象,模拟并不需要精确度很高,主要是为了找到关键因素,然后将关键因素放入模型中进行进一步模拟。

此外,在神经科学领域进行的模拟,是通过写代码去对比神经元的连接方式,这和模拟行星运动、甚至模拟化学反应也有相似之处。

说到选择这一研究命题的原因,杨光宇告诉 DeepTech:“此前科学家并没有掌握太多大脑神经元互相连接的数据,这些数据都是最近几年才慢慢出现。另外之前也没有研究显示,通过训练一个人工神经网络,达到和实际的神经网络有实现定量契合。”

自高中起,就立志研究神经科学

今年7月,杨光宇已经正式入职 MIT 。但从高中起,他就立下了做神经科学的志向。其认为,搞清楚大脑运作方式必将是很重要的研究。高三就被保送北大的他,在选择专业时也曾陷入犹豫,由于当时北大没有神经科学专业,最终他还是选择了物理系。但在本科期间,杨光宇就一直在自学神经科学的知识。

直博期间,他先就读于耶鲁大学,后随其导师汪小京老师转学至纽约大学。杨光宇博士毕业后,一心追求科研教职,并收到了 MIT 的 offer。

谈及面试 MIT 的过程,杨光宇表示首先需要交一个工作报告,之后要向其他教授做黑板报告,此后还有一对一的面试。其实早在 2020 年,他就收到了 MIT 的入职通知,而在过去一年中,他也一直在家做研究、写代码、做大脑建模。

而之所以选择就职 MIT,是因为该校在神经科学领域比较领先。对于工作单位,他现阶段没有很强烈的地域倾向,哪里合适就去哪里。在基础科学研究领域并没有国界,很多成果涉及的核心代码都是公开的,每个人都能查到。因此,杨光宇认为虽然自己人在美国,但也是在给全人类的科研做贡献。

TT牛仔:这人算中国人还是美国人?

一蓑烟雨任平生Uh:又来了?!

唐门大老爷:科技感觉这些年就会有突破啊,奇点临近。

狠人51:这么多年过去了都没见有什么厉害的人站出来挑战这类表达框架

狠人51:人类总喜欢把观察总结到的认识用复杂深奥的语言来表达,要开创出力求简化的符号语言来表达,现在的知识表达体系太过于繁杂

科学解读人生与社会:志向远大,穷思苦想,但好象还是没有研究出实用切实的成果。

虚无_境界:美国人

你可能也喜欢