撰文丨张宇识 最近有个新闻很多朋友都关注到了,说咱们国家的科研团队首次证实,人工智能可能自发形成人类级认知。这项研究是中国科学院自动化研究所神经计算与脑机交互团队、中国科学院脑科学与智能技术卓越创新中心团队还有一些其他单位联合完成,他们的研究是结合行为实验与神经影像分析,首次证实了多模态大语言模型能自发形成和人类高度相似的物体概念表征系统(用素材展示这个信息:相关研究成果最近也在《自然·机器智能》发表了)。
那有朋友就问了,说人工智能可能自发形成人类级认知?是怎么个意思啊?指的是人工智能会像人类一样有自我意识吗?一个叫“人工”,一个叫“人类”,到底有什么区别呀?
其实确实有个词叫“人类智能”,应该说算是一个人类学的术语,指的是什么呢?概括地说就是人类认识世界和改造世界的才智和本领。那人类智能的核心,一般认为是人类对自然界中的物体进行概念化的认知能力。
什么叫概念化认知能力啊?就比如说,当我们看到一个杯子,我们不仅能识别这个杯子的颜色、尺寸、形状这些,还知道这个杯子是喝水的,知道送别人一个杯子作为礼物表示“一辈子”,当然后来随着谐音梗的发展也不流行送杯子了,因为说这表示“是个悲剧”,这里面的情感价值、历史发展和文化意义你也知道。再比如说你看到一朵花,你认识这是梅花,你知道梅花的文化意义,还能想起来“梅花香自苦寒来,宝剑锋自磨砺出”。
那就有人提出疑问了,人工智能理不理解这些呀?现在大语言模型爆发式发展,这些大模型能不能从语言和图片、视频多种形式的数据里面,发展出和人类相似的对物体概念的理解呢?也就是说当人工智能看到“狗”“汽车”或“苹果”的时候,到底是只能知道它们的尺寸、颜色、形状这些物理特征,还是类似于人类,也能理解这里面的一些功能、情感、历史、文化、价值、意义等等呢?
所以为了搞清楚这个问题,他们这个研究设计叫“三选一异类识别任务”,什么意思呢?就是让人和AI一起做一些选择题,其实这种咱们从小就做过,就是有一类题叫“选出哪个不是同类的”,比如手机、电脑和茶杯,大家都知道选茶杯,另两个都是电器。咱们考公务员行测也有类似的题,但是会难一些,比如苹果、香蕉、橙子、菠萝,让你选一个不是同类的,答案是菠萝,因为苹果、香蕉、橙子都是单果,单一子房发育的,而菠萝是聚花果,由多个子房及花序轴结合形成,在结构上和其他三项不同。那研究人员让 AI 与人类都答这类问题,当然不能太难,就比如狗、汽车、苹果,选出语义最不相关的选项,咱们人类可能一般会选汽车。但是只看这一组词汇的选择不行,因为面对同一组词汇,人也可能有不同的理解,比如狗、汽车、苹果,有的人觉得狗和汽车都能移动,苹果不能自己移动,还有的看到苹果这个词理解成了手机,可能他就选狗。所以得有大量的数据才能进行对比,他们这个研究,是从 1854 种日常概念组成的三个词组里面,通过分析470万次判断数据,然后再把人和AI选择的进行对比,来研究AI是怎么理解的。
从这些大量的大模型行为数据里面,他们提取出66个可以解释的“心智维度”,说白了,就是想看看AI这些判断行为是怎么做出来的,AI为什么这么选,分析分析它们是怎么想的,把他们这种选择行为归归类,有什么共同特点。发现这些维度都可以标签化的,具有高度的可解释性,比如AI选择的这些数据,通过分析提炼,有的维度可以归为“物理属性”,有的可以归为“功能用途”,有的是“情感关联”,这些维度和人类大脑的一些神经活动模式还是比较像的,说明AI看见一个苹果,不只是识别这是一个什么颜色什么形状的东西,它也能形成类似人类的概念表征系统。所以这个研究表明,大语言模型内部存在着类似人类对现实世界概念的理解,人工智能的“心智维度”与人类的认知模式是相近的。
同时也说明,只通过多模态数据训练,神经网络就可以自发涌现类似人类的概念表征,这也为构建更通用的智能系统奠定了理论基础,实现从“机器识别”到“机器理解”跨越。也有专家评价说:“这是从‘人工’智能向‘自然’智能迈出的关键一步。”当然了,其实这个研究并不能说明人工智能具有自我意识,只能说大语言模型的认知模式从某个角度来说和人类认知的模式相似度比较高。
那关于人工智能能不能有自我意识,一直是一个话题,我曾经和一位著名科幻作家吃饭的时候,听他说,他觉得机器人会有自我意识。他说你看人也是分子原子构成的,进行有序排列就能产生自我意识,计算机也是啊,所以在一定有序排列的状态下,在一些特殊条件下,有自我意识也是有可能的。当然对于这个问题,每个人可能有自己的观点。到底会不会有自我意识,我们现在谁也不知道,只能是拭目以待,或许未来会给我们答案。