培养皿里的人脑细胞学会打游戏，还比AI学得快

Arcman · 发表于 2021-12-25 22:11

培养皿里的人脑细胞学会打游戏，还比AI学得快：黑客帝国要成真了？

中科院物理所
[color=rgba(0, 0, 0, 0.3)]2021-12-25 14:50
[color=rgba(0, 0, 0, 0.3)]

登录/注册后可看大图

《心理测量者》西比拉系统，由许多离体的大脑组成（图片来源：Production I.G）

两千多年前，庄子讲了一个自己变成蝴蝶的梦，说梦醒后竟难以判断自己到底是庄周还是蝴蝶。他想告诉我们，人类无法确切地区分真实和虚幻。而直到今天，人们依然在思考这个命题……

撰文 | 栗子

审校 | 二七

22世纪，人类在与人工智能的战争中惨败，被囚禁在维持生命的胶囊里，动弹不得。但为了保证人类脑部正常活动，AI设计了一套程序，用特定的方式刺激人脑，让人以为自己还在20世纪末，过着上班下班的普通生活，浑然不知已被禁锢的现实。

这是《黑客帝国》电影的设定，而它背后的依托，是哲学家希拉里·普特南（Hilary Putnam）在1981年提出的一个思想实验：

如果把人脑取出体外放进缸里，用营养液维持它的生理活性，并且在脑部发出信号时，给它一如往常的信号反馈，打造一个虚拟现实，它能不能意识到自己处在虚拟现实中？或者说，若“缸中之脑”发出和收到的信号都和日常走路时一样，它会不会相信自己真的在走路？

登录/注册后可看大图

当“缸中之脑”接收到“走路”的信号反馈（图片来源：Alexander Wivel）

当然，从现有的技术来看，离体的人脑能不能产生意识还很难说。假如我们现在的体验都是真实的，想要制造与真实体验一样的神经信号，可能也还有很长的路要走。

不过最近，有一群来自澳大利亚的科学家，教会了离体的脑细胞打游戏。这些细胞没有什么现实生活的经历，只是日复一日地接受和游戏有关的神经刺激。某种程度上，它们可能“以为”自己就是游戏里的那个球拍。

游戏世界里，训练是生活的全部

科学家制造了名叫“DishBrain”的体外神经网络，姑且译为“盘中之脑”。所谓的“盘”就是培养皿，每个培养皿内盛有80万-100万个活的脑细胞，这个规模与蟑螂的脑部很接近，也可以称作“迷你大脑”（mini-brain）。

登录/注册后可看大图

WeChat Image_20211225211346.jpg (33.94 KB, 下载次数: 2058)

下载附件保存到相册

2021-12-25 22:14 上传

DishBrain，盘中之脑（图片来源：Cortical Labs）

有的“盘中之脑”，是小鼠胚胎的脑部取出的细胞；另外一些“盘中之脑”，则是人类干细胞诱导分化而成的脑细胞。当然，这是人们从外部视角描绘的景象，而那些脑细胞本身，大概不会知道自己活在培养皿里。

“盘中之脑”对这个世界的体验，几乎完全来自科学家给的神经刺激：脑细胞下面排列着密密麻麻的微电极，负责刺激它们。这些刺激并不随机，而是根据雅达利乒乓球游戏（Pong）生成的。乒乓球与球拍的相对位置，决定了“盘中之脑”的8个刺激位点中，哪一处要被刺激。

登录/注册后可看大图

乒乓球游戏Pong的单人版本，由一个球、一把球拍以及三面墙组成（图片来源：TheBrainGames）

自此，这些迷你大脑的游戏训练就开始了。在科学家眼里，那个游戏便是脑细胞们的黑客帝国。

脑细胞收到刺激后，也会发出信号来移动球拍，而负责读取信号的依然是那些电极。科学家给“盘中之脑”划定了两片游戏操作区，1区代表左，2区代表右，像操纵杆一样。对比两个区域的脑细胞发出的信号，1区更活跃便左移球拍，2区更活跃便右移球拍。

既然是训练，就要有奖惩机制，帮玩家了解规则，并促使玩家朝着更多的奖励进发。假如玩家是人类，那么接到球后，游戏继续就是奖励，没接到球时，GG（游戏结束）就是惩罚。可如果玩家只是一群脑细胞，还不理解游戏里的逻辑关系，怎样的奖惩才能对它们起效？

登录/注册后可看大图

红色闪电代表没接到球的惩罚，即不可预测的随机刺激；绿色闪电代表接到球的奖励，即可预测的信号反馈（图片来源：原论文）

一种“自由能原理”（Free Energy Principle）认为，大脑喜欢事物往自己预测的方向发展，不喜欢意外或惊喜。所以，科学家设定的奖惩机制是，接到球时向迷你大脑发出可预测的信号反馈，作为奖励；没接到球时发出不可预测的随机刺激，作为惩罚。

至于迷你大脑是不是真的“讨厌”惊喜，会不会努力减少意外的发生，看训练成果就知道了。

比AI学得快，快很多

起初，每个迷你大脑都不容易接到球。但随着训练进行，“玩家”的游戏技能在明显提升，不论盘中是小鼠的脑细胞，还是人脑细胞，都能坚持更多回合了。虽然科学家也发现，人脑细胞比小鼠脑细胞表现好得多。

在研究团队看来，这意味着连“盘中之脑”也会为外面的世界建立一个模型，用来预测将会发生什么，它们不喜欢意料之外的事。这些迷你大脑并不是自己想打游戏，只是要避免收到那些不可预测的随机刺激，才被动接受了游戏训练。

看上去不情不愿，训练过程却惊人地高效。“盘中之脑”只需经历5分钟训练，游玩10-15次，就学会了规则。相比之下，DeepMind有一款能打败真实人类玩家的AI，花了90分钟，游玩大约5000次，才达到类似的程度。

登录/注册后可看大图

不止雅达利乒乓球游戏，DeepMind开发的AI已攻破57款雅达利游戏（图片来源：Two Minute Papers）

当然，掌握规则不等于成为高手。等到“盘中之脑”和AI都经过充分训练，脑细胞们的游戏成绩还是远远不及AI。

毕竟，脑细胞发出信号后，要靠电脑来分析这些脑电活动，再转化成游戏里移动球拍的操作。像这样由脑细胞与计算机组合而成的“赛博格”，在游戏熟练程度上，可能还很难与纯硅基的AI相匹敌。

但即便如此，“盘中之脑”学习规则的速度，仍然令科学家感到奇妙。或许，这就是生物学才能做到的事。如果有一天，人们知道了为什么脑细胞比AI学得快，也可能让机器学习的速度突飞猛进。

科学家说，从前也有不少团队研究培养皿里的神经元，把它们培养成类脑器官。不过这场乒乓球游戏训练，应该是第一次有迷你大脑学会了目标导向的任务。

而这个新成果也表示，迷你大脑拥有感觉能力（sentience），知道自己的内在状态和外部环境是如何互相影响的，还能从目前的状态推断出要采取什么行动。要问迷你大脑为何有这样的能力，培养皿里的每个脑细胞都不是孤立的个体，在培养过程中，它们之间已经建立起复杂的神经连接。

登录/注册后可看大图

图片来源：MIT

虽然，如今“盘中之脑”表现出的智能，远不如人类智能或人工智能那样复杂，但仿佛还是让我们看到了某种不可思议的未来。

假如真到了那一天，你要选红药丸还是蓝药丸？

原论文：

https://www.biorxiv.org/content/10.1101/2021.12.02.471005v2

参考链接：

https://www.newscientist.com/article/2301500-human-brain-cells-in-a-dish-learn-to-play-pong-faster-than-an-ai/

https://spikestream.corticallabs.com/

https://gitlab.com/PaperReview/NCOMMS-21-41265

		自动登录	找回密码
密码			立即注册

培养皿里的人脑细胞学会打游戏，还比AI学得快

浏览过的版块