Arcman 发表于 2021-12-25 22:11

培养皿里的人脑细胞学会打游戏,还比AI学得快

培养皿里的人脑细胞学会打游戏,还比AI学得快:黑客帝国要成真了?

中科院物理所
2021-12-25 14:50


https://mmbiz.qpic.cn/mmbiz_png/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwzxJtedKND6HmfzEj0eWjshsFabCj4d2lJic0n5YKYe3dKO3IlUsaawg/640?wx_fmt=png《心理测量者》西比拉系统,由许多离体的大脑组成(图片来源:Production I.G)
两千多年前,庄子讲了一个自己变成蝴蝶的梦,说梦醒后竟难以判断自己到底是庄周还是蝴蝶。他想告诉我们,人类无法确切地区分真实和虚幻。而直到今天,人们依然在思考这个命题……

撰文 | 栗子审校 | 二七
22世纪,人类在与人工智能的战争中惨败,被囚禁在维持生命的胶囊里,动弹不得。但为了保证人类脑部正常活动,AI设计了一套程序,用特定的方式刺激人脑,让人以为自己还在20世纪末,过着上班下班的普通生活,浑然不知已被禁锢的现实。
这是《黑客帝国》电影的设定,而它背后的依托,是哲学家希拉里·普特南(Hilary Putnam)在1981年提出的一个思想实验:
如果把人脑取出体外放进缸里,用营养液维持它的生理活性,并且在脑部发出信号时,给它一如往常的信号反馈,打造一个虚拟现实,它能不能意识到自己处在虚拟现实中?或者说,若“缸中之脑”发出和收到的信号都和日常走路时一样,它会不会相信自己真的在走路?
https://mmbiz.qpic.cn/mmbiz_jpg/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwArdibV0pSaK9FzwpPia57icp9N5w13PeKyZBmILAOZL3H4nvES2wLWdCQ/640?wx_fmt=jpeg当“缸中之脑”接收到“走路”的信号反馈(图片来源:Alexander Wivel)
当然,从现有的技术来看,离体的人脑能不能产生意识还很难说。假如我们现在的体验都是真实的,想要制造与真实体验一样的神经信号,可能也还有很长的路要走。
不过最近,有一群来自澳大利亚的科学家,教会了离体的脑细胞打游戏。这些细胞没有什么现实生活的经历,只是日复一日地接受和游戏有关的神经刺激。某种程度上,它们可能“以为”自己就是游戏里的那个球拍。

游戏世界里,训练是生活的全部
科学家制造了名叫“DishBrain”的体外神经网络,姑且译为“盘中之脑”。所谓的“盘”就是培养皿,每个培养皿内盛有80万-100万个活的脑细胞,这个规模与蟑螂的脑部很接近,也可以称作“迷你大脑”(mini-brain)。
DishBrain,盘中之脑(图片来源:Cortical Labs)
有的“盘中之脑”,是小鼠胚胎的脑部取出的细胞;另外一些“盘中之脑”,则是人类干细胞诱导分化而成的脑细胞。当然,这是人们从外部视角描绘的景象,而那些脑细胞本身,大概不会知道自己活在培养皿里。
“盘中之脑”对这个世界的体验,几乎完全来自科学家给的神经刺激:脑细胞下面排列着密密麻麻的微电极,负责刺激它们。这些刺激并不随机,而是根据雅达利乒乓球游戏(Pong)生成的。乒乓球与球拍的相对位置,决定了“盘中之脑”的8个刺激位点中,哪一处要被刺激。
https://mmbiz.qpic.cn/mmbiz_gif/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwRIwcgFkGg7kvY6Dibc6M5wcWTdJqp54icCNxReroQx617afPerXxiaGjw/640?wx_fmt=gif乒乓球游戏Pong的单人版本,由一个球、一把球拍以及三面墙组成(图片来源:TheBrainGames)
自此,这些迷你大脑的游戏训练就开始了。在科学家眼里,那个游戏便是脑细胞们的黑客帝国。
脑细胞收到刺激后,也会发出信号来移动球拍,而负责读取信号的依然是那些电极。科学家给“盘中之脑”划定了两片游戏操作区,1区代表左,2区代表右,像操纵杆一样。对比两个区域的脑细胞发出的信号,1区更活跃便左移球拍,2区更活跃便右移球拍。
既然是训练,就要有奖惩机制,帮玩家了解规则,并促使玩家朝着更多的奖励进发。假如玩家是人类,那么接到球后,游戏继续就是奖励,没接到球时,GG(游戏结束)就是惩罚。可如果玩家只是一群脑细胞,还不理解游戏里的逻辑关系,怎样的奖惩才能对它们起效?
https://mmbiz.qpic.cn/mmbiz_png/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwtlwrZ5bsmf6iaPTibL6kuaZ7ZY4OBBR4VXJN9VBtvYicRaNarPzHfyb0w/640?wx_fmt=png红色闪电代表没接到球的惩罚,即不可预测的随机刺激;绿色闪电代表接到球的奖励,即可预测的信号反馈(图片来源:原论文)
一种“自由能原理”(Free Energy Principle)认为,大脑喜欢事物往自己预测的方向发展,不喜欢意外或惊喜。所以,科学家设定的奖惩机制是,接到球时向迷你大脑发出可预测的信号反馈,作为奖励;没接到球时发出不可预测的随机刺激,作为惩罚。
至于迷你大脑是不是真的“讨厌”惊喜,会不会努力减少意外的发生,看训练成果就知道了。

比AI学得快,快很多
起初,每个迷你大脑都不容易接到球。但随着训练进行,“玩家”的游戏技能在明显提升,不论盘中是小鼠的脑细胞,还是人脑细胞,都能坚持更多回合了。虽然科学家也发现,人脑细胞比小鼠脑细胞表现好得多。
在研究团队看来,这意味着连“盘中之脑”也会为外面的世界建立一个模型,用来预测将会发生什么,它们不喜欢意料之外的事。这些迷你大脑并不是自己想打游戏,只是要避免收到那些不可预测的随机刺激,才被动接受了游戏训练。
看上去不情不愿,训练过程却惊人地高效。“盘中之脑”只需经历5分钟训练,游玩10-15次,就学会了规则。相比之下,DeepMind有一款能打败真实人类玩家的AI,花了90分钟,游玩大约5000次,才达到类似的程度。
https://mmbiz.qpic.cn/mmbiz_jpg/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwWTkgfANd0DCvOzPloymiarZSqzX22EiaQ0cct6Xg2XFfUR8A78K631rA/640?wx_fmt=jpeg不止雅达利乒乓球游戏,DeepMind开发的AI已攻破57款雅达利游戏(图片来源:Two Minute Papers)
当然,掌握规则不等于成为高手。等到“盘中之脑”和AI都经过充分训练,脑细胞们的游戏成绩还是远远不及AI。
毕竟,脑细胞发出信号后,要靠电脑来分析这些脑电活动,再转化成游戏里移动球拍的操作。像这样由脑细胞与计算机组合而成的“赛博格”,在游戏熟练程度上,可能还很难与纯硅基的AI相匹敌。
但即便如此,“盘中之脑”学习规则的速度,仍然令科学家感到奇妙。或许,这就是生物学才能做到的事。如果有一天,人们知道了为什么脑细胞比AI学得快,也可能让机器学习的速度突飞猛进。
科学家说,从前也有不少团队研究培养皿里的神经元,把它们培养成类脑器官。不过这场乒乓球游戏训练,应该是第一次有迷你大脑学会了目标导向的任务。
而这个新成果也表示,迷你大脑拥有感觉能力(sentience),知道自己的内在状态和外部环境是如何互相影响的,还能从目前的状态推断出要采取什么行动。要问迷你大脑为何有这样的能力,培养皿里的每个脑细胞都不是孤立的个体,在培养过程中,它们之间已经建立起复杂的神经连接。
https://mmbiz.qpic.cn/mmbiz_jpg/MjY4A5YVEoclVXNb7WymBZAPn3kn0FdwIibh9ibicxlmfRr8FdDDNXIUibSkI0r6qExKxcAcjX4mRTl8JwWoVMffvA/640?wx_fmt=jpeg图片来源:MIT
虽然,如今“盘中之脑”表现出的智能,远不如人类智能或人工智能那样复杂,但仿佛还是让我们看到了某种不可思议的未来。
假如真到了那一天,你要选红药丸还是蓝药丸?
原论文:https://www.biorxiv.org/content/10.1101/2021.12.02.471005v2
参考链接:https://www.newscientist.com/article/2301500-human-brain-cells-in-a-dish-learn-to-play-pong-faster-than-an-ai/https://spikestream.corticallabs.com/https://gitlab.com/PaperReview/NCOMMS-21-41265


页: [1]
查看完整版本: 培养皿里的人脑细胞学会打游戏,还比AI学得快