第04版: 上一版3  
 
标题导航
中国商飞官网 | 手机版 | 版面导航 | 标题导航
   
上一版3 2025年2月19日 星期 放大 缩小 默认
从推动科研到赋能制造,AI的潜力不可估量
□ 李飞飞

编者按:

DeepSeek的横空出世,再次将人工智能推到了时代发展的聚光灯下。近期,享誉全球的人工智能顶尖华人专家、美国国家工程院院士、斯坦福大学教授李飞飞在巴黎人工智能行动峰会上发表了开幕演讲。她将人工智能的发展历史放到了“生物进化”的宏大脉络中,探讨了从“感知智能”迈向“行动智能”的转型路径、AI发展的伦理观与治理原则。这些深刻思考,为我们理解人工智能提供了一个独特视角。让我们一起回顾她在这次演讲中的精彩内容。

智能的历史可追溯到生命起源

对我们许多人来说,人工智能通常被视为一个关于技术和现代世界的故事,当然也是一个关于未来的故事。但对我而言,这更是一个可以追溯到生命起源的故事,一个开始于5亿年前的故事。那是极其遥远的时代,“视觉”的概念甚至还不存在。事实上,眼睛尚未进化,没有任何生物亲眼目睹过这个世界,所有生命都处在黑暗之中。

当进化赋予简单的生物感知周围世界并做出反应的能力时,哪怕这种感知非常微弱,一场进化“军备竞赛”便拉开了序幕。最初,这还只是一种被动的体验,即简单地让光线进入,但很快就变得更加丰富和活跃。神经系统开始进化,视觉发展为洞察力,“看到”演变为“理解”,理解力进而催生行动,所有这些共同孕育了智能。而这一切,将永远地重塑地球生命的本质。

快进到5亿年后,人类的智慧已经引导我们去构想和塑造工作和生活的方方面面。我们不再满足于仅仅拥有大自然赋予的智能。现在,好奇心驱使我们去创造像人类一样智能,甚至超越人类的机器。

这项开创性技术的探索之旅,始于20世纪中期。英国伟大的数学家艾伦·图灵(Alan Turing)极具远见卓识,甚至在计算机诞生之前,他已经开始思考如何赋予计算机媲美人类的认知能力。同样的好奇心和雄心也深深吸引着早期的美国计算机科学家。他们不仅发起了首个探索智能机器可能性的研究项目,更在1956年那个闷热的夏天,提出了“人工智能”这一术语,比这个概念被大众所熟知还要早几十年。

有趣的是,他们当时认为只需两个月就能解决这个问题的绝大部分,甚至揭开智能之谜。如今,这个“两个月项目”已经过去了820个月,但我们确实也取得了显著的进展。

算法、数据和算力催生现代AI

我们当今所处的现代AI时代,正是3项极其重要又各自独立的技术与科学进步汇聚而成的成果。

第一项是对感知算法的研究——即生物(包括动物乃至人类)如何理解周围世界,并最终创造出让机器也能具备类似能力的数学模型。在达特茅斯AI夏季研讨会上延续了图灵的大胆假设之后,神经生理学家戴维·休伯尔(David Hubel)和托斯坦·维厄瑟尔(Torsten Wiesel)率先揭示了哺乳动物视觉皮层中神经处理的层次结构,这为他们赢得了诺贝尔奖,也彻底改变了我们对视觉处理的认知。大约在同一时期,心理学家弗兰克·罗森布拉特(Frank Rosenblatt)搭建了最早的神经网络原型之一——感知器。这项工作启发了数十年后无数计算机科学家,尤其是早期先驱者,去设计愈发先进的模型,最终形成了我们今天所熟知的深度学习神经网络算法,让机器拥有了自身近乎神奇的感知和分析能力。

与此同时,第二条研究脉络也开始出现——认知科学家转而研究人类自身的大脑,揭示我们对周围环境进行感知时所拥有的惊人深度和复杂性。他们的研究明确指出,无法将我们的脑与其所处的进化环境分割开来。大脑不过是一个被禁锢在颅骨黑暗之中的机器,却又从生命最初时刻开始,就急切地向外部学习,通过每一次光线的照射、每一次触觉刺激、每一声细语来获取信息。

对我个人而言,作为在21世纪初成长起来的科学家,当时感知算法几乎是我所在领域的唯一关注点,而认知科学带给我的启示在于“规模”。演化与发育能如此有效地塑造人类智慧,是因为它们能利用大量数据来驱动我们的学习。我和我的合作者、学生们推测,同样的规律也适用于机器,只不过这一次,数据来自现代数字设备和互联网,而不再是依靠生物感官。由此激发了我所在实验室发起的ImageNet项目。我们提出了一个关键假设:数据是让神经网络等高容量算法真正“活起来”的关键。这个理念让神经网络焕发新生,开启了利用海量数据来推动AI进步的全球趋势,也成为如今所说的AI“规模定律”(scaling law)的一部分。

最后,如果没有极其强大的运算能力来支撑,以上所有成就都不会发生,或者根本连起点都无法跨越。最初的里程碑包括冯·诺依曼(von Neumann)在20世纪40年代提出的计算机体系结构理论,它一直沿用至今,并在上世纪70年代初催生了第一批微处理器。可有趣的是,真正让硅芯片原始运算速度获得飞跃的,竟是电子游戏。为追求更逼真的游戏画面,上世纪90年代初诞生了一个小型产业,但在短短20年迅速膨胀为全球巨头——以英伟达(NVIDIA)等公司为代表,开发出了越来越强大的图形处理器(GPU)。结果证明,这恰恰是让神经网络算法得以利用互联网规模大数据进行学习的最后一块拼图。

更“主动”的AI正在到来

2012年,在ImageNet挑战赛上,我的实验室率先将算法、数据和计算这三大要素首次大规模结合在一起,几乎在一夜之间就改变了我们整个领域。那是机器首次能够理解并准确地描述海量图像——成百上千万张之多。如今我们对此已经习以为常,但在当时,这是一项前所未有的壮举,甚至有些像科幻小说里的场景。它就像推倒了第一块多米诺骨牌,随后的一系列突破接连不断,并且来得越来越快。

毫无疑问,历史学家今后一定会把这段时间称作“真正的第一个AI时代”。从任何一个能想到的指标来看,AI都是一场在深度和广度上不断扩大的革命。过去几年里,人工智能又迎来了更惊人的跃进——也就是大型语言模型的出现。

这些大型语言模型把现代AI所依赖的算法、数据和计算力三大要素都推向了更极致的规模。它们采用了一种名为“Transformer”的新型模型架构,训练数据几乎覆盖了整个互联网,并在数量惊人的最新、最强大芯片上运行。正如我们所见,其结果是在机器能力上比过去10年来的任何一次突破都更为迅猛。

而且,这些能力并不只是表面上看着“会说话”而已。现在AI模型在各种基准测试(从手写识别到博士水平的科学问答)上的表现近几年都在飞速攀升;其中一些难度极高、对人类来说具有挑战性的任务,AI的成绩简直像坐火箭一样往上蹿,几乎呈垂直上升的趋势。

不仅如此,从能够流畅使用语言开始,大型语言模型还在朝更具“主动性”的方向发展——它们学会了将复杂任务分解成若干步骤,并逐步规划如何实现目标。人们目前将这种趋势称作“具备代理能力(agentic)的AI”。对许多用户和企业而言,这些能力已经非常实用,而它们还远不止于此,后续的发展潜力更是不可估量。

我们目前所讨论的还大多停留在“语言智能”层面,但人类之所以为人,是因为我们拥有更全面、更完整的智能。从“被动感知”到“主动行动”的新阶段正在到来。在我自己的研究领域——涉及摄像头和机器人时,我看到AI正逐渐具备“创造、理解、推理和交互”这些维度,进而在数字或物理的三维空间里与人和环境相互作用。我们称之为“空间智能(spatial intelligence)”和“具身智能(embodied intelligence)”。

实际上,就连我一直崇拜的图灵先生,他对于未来的预见在这一点上也可能有些“过于狭隘”或“向内看”了。因为进化本身已经一再告诉我们:智能的真正强大之处,不仅仅在于“思考”,而在于让思考能驱动行动。

构建以人为本的AI

如果AI不仅能思考,更能行动,成为真正的“行动机器”,那么我们引导这项技术的集体责任就变得更加紧迫和重要。这一切已将我们带到一个具有划时代意义的时刻。那么,我们该如何应对人工智能发展带来的挑战?

这个问题其实一直在指引我的研究工作。虽然我肯定,想要找到简单答案几乎不可能,但有一个主线在我多年的探索中始终贯穿,那就是我所说的“以人为本的AI”,并且它包含3个核心价值:尊严、能动性和社区。

首先是尊严。当面对越来越强大的技术时,我们人类常常会反思:到底是什么在定义“我们是谁”?如果把我们能做的所有事情都一一剥离,剩下的那份能够自主决策并亲自行动的尊严感,依然是我们作为人的本质之一。如果AI这项技术能帮助我们守护并且“找回”这份尊严,尤其是能帮助到最脆弱的人群,那将是让我最激动的事情。

其次是能动性。我所在的实验室多年来的核心理念,就是探索如何让AI“增强”人类的能力,而不是取代人类。毫无疑问,每一次重大的技术变革都会对劳动力市场产生冲击,AI也不例外。然而,我相信AI可以帮助我们从创造力到医疗保健、从科研到制造业,在方方面面获得新的能力。因为在许多方面,AI的技能与人类的技能其实是互补关系。我们完全可以利用这个“数字或物理上的合作者”来强化自身能力。

最后是社区。过去10年里,科技也常常被诟病“把人们越拉越远”,催生了各种“信息茧房”和“狂热话题诱饵”等。如今,AI又一次走到了十字路口:一条路是让AI主导很多社交体验,甚至为每个人极度定制并强化他们原本的偏见;另一条路则可能帮助我们构建更健康、更强大并具有包容性的社区。

下一篇 4 放大 缩小 默认
 

中国商用飞机有限责任公司 版权所有 沪ICP备12042517号

地址:上海市浦东新区世博大道1919号 邮编:200126 电话:86-021-20888888 传真:86-021-68882919

使用帮助 | 网站使用条款和隐私声明 | 联系我们

沪公网安备 31011502002390号