人工智能:乌托邦还是反乌托邦?
摘要
菲尔兹奖得主塞德里克·维拉尼以其独特的叙事风格,回顾人工智能从寒冬到盛夏的发展历程。从20世纪90年代算法与社会的初啼,到1997年卡斯帕罗夫对阵深蓝的史诗对决,再到2012年深度学习的复兴与2022年ChatGPT的横空出世,他带领听众穿越AI的历史长河,探讨技术进步背后的社会挑战、伦理困境与人类未来。
核心概念及解读
AI寒冬:指人工智能研究经历的低谷期,研究停滞、资金匮乏,20世纪70年代和90年代各出现一次,神经网络等方法未能兑现早期承诺
深蓝:IBM开发的国际象棋计算机,1997年击败世界冠军卡斯帕罗夫,标志着计算能力在特定领域超越人类智慧的里程碑事件
深度学习:基于多层神经网络的机器学习方法,2012年在图像识别领域取得突破性进展,通过反向传播算法自动优化网络参数,推动AI从春天迈入夏天
图灵测试:由艾伦·图灵提出的判断机器是否具备智能的标准,即对话算法能否逼真到让人类无法将其与真人对话区分开来
算法偏见与社会影响:人工智能不仅是技术问题,更涉及虚假信息传播、民主信任瓦解、权力集中等深层社会挑战,算法专家未必是预测其社会影响的最佳人选
主播:塞德里克·维拉尼
引言:与塞德里克·维拉尼一同漫步人工智能的历史
“AI”,这两个字母,仿佛带着未来世界的神秘回响,萦绕在我们耳畔。它们既是科技前沿的闪亮徽章,又是潜藏着未知风险的潘多拉魔盒。从手机里那个言听计从的虚拟助手,到新闻里风驰电掣的无人驾驶汽车,人工智能似乎无处不在,却又难以捉摸。它究竟是会引领我们走向繁花似锦的乌托邦,还是会将我们推入暗影幢幢的反乌托邦?
现在,请跟随法国数学界的“摇滚明星”——菲尔兹奖得主塞德里克·维拉尼,一同踏上一场穿越时空的思想漫游。这不是枯燥的学术报告,而是一场充满智慧火花的“故事会”。维拉尼将以他标志性的、略带诗意的叙述方式,为你揭开人工智能的神秘面纱,讲述那些鲜为人知的历史、激动人心的突破,以及令人深思的挑战。
我们将从寒冬走向盛夏,再到那迷雾笼罩的未来:
“算法与社会”的初啼: 维拉尼将带你回到30年前的一个喧嚣派对,那里,一群年轻的艺术系学生,竟然预言了算法对未来的深远影响!这出人意料的开场,如同命运的伏笔,暗示着人工智能将如何颠覆我们的认知,甚至威胁到民主的基石。我们将一同回顾“AI寒冬”的萧瑟,思考:为何算法专家有时反而对社会变革的浪潮视而不见?
“卡斯帕罗夫对阵深蓝”的史诗对决: 1997年,纽约,一场人机大战震撼全球。棋盘之上,是人类智慧的巅峰与机器算力的较量;棋盘之外,则是时代巨变的序曲。维拉尼将带你重温那扣人心弦的对局,感受计算能力突飞猛进带来的冲击,以及人类在面对“非人”对手时的复杂情感。这场对决,究竟是人类的失败,还是新纪元的开端?
“深度学习”的凤凰涅槃: 2012年,斯坦福大学的讲台上,一位名不见经传的年轻人,用他的算法颠覆了整个图像识别领域。这是“深度学习”的复兴时刻,也是人工智能从“春天”迈向“夏天”的关键一步。我们将跟随维拉尼,探寻神经网络的奥秘,见证“反向传播”算法的神奇力量,感受“炼金术士”们如何将看似简单的数学公式,转化为改变世界的技术。
“聊天机器人”的喧嚣与反思: 2022年,ChatGPT横空出世,引发了一场全球狂欢。这个能说会道的“聊天机器人”,究竟是人类智慧的结晶,还是虚张声势的“数字鹦鹉”?维拉尼将以他犀利的洞察力,剖析大型语言模型背后的技术原理,揭示其潜在的风险:虚假信息、社会操纵、权力集中……我们将一同思考:在算法编织的“数字迷宫”中,人类该如何保持清醒的头脑,守护我们珍视的价值?
主要看点:
- 数学家的浪漫情怀: 维拉尼不仅是一位杰出的科学家,更是一位充满人文关怀的思想者。他的讲述,既有科学的严谨,又有诗人的浪漫,将复杂的概念化为生动的比喻,让深奥的理论变得触手可及。
- 历史的尘埃与星光: 从图灵的悲剧命运,到神经网络的几度沉浮,维拉尼将带你穿越人工智能的历史长河,感受那些先驱者的智慧与激情,见证那些被遗忘的梦想和未竟的事业。
- 技术迷宫的“寻路人”: 算法、神经网络、反向传播、Transformer……这些听起来令人望而生畏的术语,在维拉尼的娓娓道来中,将变得清晰而有趣。他将像一位经验丰富的向导,带领你在技术的迷宫中穿行,找到理解人工智能的关键线索。
- 社会镜鉴的“反光镜”: 人工智能不仅仅是技术,更是社会的一面镜子。维拉尼将引导我们反思:算法的偏见、数字鸿沟、隐私泄露、就业危机……这些挑战,既是技术的副产品,也是人类社会自身问题的映射。
- 未来的迷雾与希望: 面对人工智能的未来,维拉尼既不盲目乐观,也不过度悲观。他像一位智者,提醒我们警惕技术的潜在风险,同时鼓励我们拥抱变革,共同塑造一个更加公正、包容、可持续的未来。
人工智能,是这个时代最激动人心、也最令人不安的议题。它如同一把双刃剑,既能创造奇迹,也可能带来灾难。让我们跟随塞德里克·维拉尼的脚步,一同走进这场“AI迷思”,聆听那些关于智慧、创造、挑战和未来的故事。这不仅是一次知识的探险,更是一次灵魂的洗礼。准备好了吗?让我们一起出发!
算法与社会 (1/4)
在20世纪90年代,除了少数业内人士和爱好者之外,人工智能并没有真正引起人们的兴趣,即使在科学界内部也是如此。然而,追随着美国人克劳德·香农、匈牙利人亚诺什·冯·诺依曼和英国人艾伦·图灵等奠基人的脚步,人工智能将逐渐超越科学领域,产生更广泛的影响。
在《一千零一科学故事》的第四季中,塞德里克·维拉尼将带领我们踏上一次新的伟大科学冒险之旅:人工智能之旅。
有这么两个字母引发了一场激烈的争论。我在2018年关于这个著名的人工智能的议会报告,使得我几乎每周都会被问到这个问题。然而,我很久以来都犹豫要不要把它作为这个播客的一季,因为人们已经谈论得太多了,而且它还算不上是一门真正的科学。但是,人工智能在特朗普总统再次当选后的胡言乱语中,以及在诺贝尔奖获得者名单中占据的核心地位(两者相隔仅几周),让我不再犹豫。因此,让我们一起尝试澄清这个难以捉摸的主题所带来的巨大困惑。首先,我想分享一个奇怪但具有代表性的个人回忆。
塞德里克·维拉尼讲述的科学故事,第四季。人工智能,乌托邦还是反乌托邦?第一集:算法与社会,一个毫无意义的预言。
那是30年前的事了,那是巴黎高等师范学院的一个学生派对之夜,一个与我们的邻居——装饰艺术学院联合举办的舞会。我当时是数学系三年级的学生,但最重要的是学生会主席,也就是派对组织委员会的主席。作为一个尽职尽责的主席,我在小校园里走来走去,以确保两个学生群体能够和谐地融合在一起,在充满音乐的花园和地下室里聊天、跳舞、调情。然后,我偶然发现了一群兴高采烈的艺术系学生,他们在“badtech”里闲逛,之前还在墙上涂鸦了我的漫画(已经戴着领巾和长发)以及一个标语:“Hardcore Zé Normal Sup, bravo!”(硬核高等师范生,好样的!)。
我们开始聊起了漫画,但当他们开始和我谈论算法时,我却一头雾水。算法是一系列机械地解决数学问题的操作。它是小学里做乘法的公式,它是根据你的报税单计算你应缴税款的公式,它是运行电子游戏的程序。如今,我们这个相互连接的现代世界充斥着关于我们与之互动的数十亿个计算机算法的争论。但在我学生时代的辩论中,在迷你电话和电话亭的时代,却完全没有这样的情况。在那个没有互联网的世界里,听到未来的艺术家们开始谈论算法,真是太不真实了。而且,他们认识谁呢?
我,凭借我的科学背景,从13岁起就有机会用BASIC编程,高中时用Pascal,攻读硕士学位时用LISP。我和一个同学一起编写了一个算法,可以自动将旋律转录成乐谱。我上过算法复杂性课程,在预科班教过编程……但是这些艺术系的学生有机会编程吗?没关系。他们毫不怯懦,向我解释了一些令人惊讶的事情:总有一天,图像和文本生成算法会如此完善,以至于我们将无法区分真假;总有一天,现实的基础将被看似真实但经过篡改的虚拟现实所取代。而这个后现实世界将是一个信任瓦解和民主丧失的世界。
我瞪大了眼睛,却对这些奇怪的话一无所知。这并不是因为桑格利亚汽酒,这简直是超出了这个世界的范畴。然而,我是少数对人工智能可能是什么有模糊概念的人之一。青少年时期,我读过美国伟大的散文家和数学家道格拉斯·霍夫施塔特的著作《数学魔法》,书中充满了关于算法的精彩内容。我从中了解了计算机科学和人工智能的奠基人:在第二次世界大战期间崭露头角的三个古怪的天才,他们将深刻的数学思想和精湛的工程创造力结合在一起:美国人克劳德·香农、匈牙利人约翰·冯·诺伊曼(亚诺什)和英国人艾伦·图灵。他们都对微分方程、对理解我们的智力以及对人工智能的主要问题——学习充满热情。如何自动改进程序的参数,使其在任务中表现得更好?
因此,香农的机械老鼠学会了从迷宫中走出来。早在20世纪40年代,人们就已经为机器学习发挥了巨大的想象力,例如用于图像的自动分类,这对军方来说非常重要。人们建造了受哺乳动物视觉启发的巧妙机器:感知器、神经认知机、第一个神经网络。想象一下相互连接的基本单元,就像我们的神经元通过轴突连接一样。这些神经元相互发送信号,比如说数字。每个神经元将接收到的信号组合起来,赋予它们或多或少的权重(重要性),然后对结果执行一个简单的操作,再将其传递出去。最终,这就像一个函数,你还记得:f(x) = y。对于输入变量x(例如,转换成数字并注入网络的图像),我们关联一个输出变量y(例如,编码在其他节点中的描述)。通过示例,学习会修改轴突的权重,就像我们大脑中的重新连接一样,直到任务被掌握。
设想的应用是无限的。图灵,这位战争中的无名英雄,也是第一个预见到现代计算机架构的人,他梦想着一个算法可以帮助我们理解从物理学到动物大脑的自然世界奇迹的世界。霍夫施塔特追随他的伟大足迹,将计算机视为理解智力、意识、类比和创造力的关键工具。在推理树中跳跃分支,他向我介绍了自指的力量、伟大的逻辑内省或图灵测试:一个对话算法能否如此逼真,以至于人类无法将其对话与人类的对话区分开来?我这个有抱负的数学家的灵魂被这本20世纪80年代的巨著照亮了,这本书充满了科学好奇心和对智力的追求。
是的,但那是20世纪80年代,当时人工智能在数学家中仍然很流行。在1994年那个著名的舞会时,除了少数狂热者,其他人都对人工智能漠不关心。我们正处于人工智能的第二个冬天,就像20世纪70年代一样。理论家们再次停滞不前,这个领域陷入了危机。太糟糕了,神经网络和其他方法都让人失望。梦想破灭的人们意识到了学习的巨大困难。在高等师范学院,我们并没有被鼓励走这条似乎没有前途的道路。想想真是讽刺!
我的一些老师是伟大的算法学家,有些人已经成为名人。玛丽-保罗·卡尼(Marie-Paule Cani)完善了她合成图像上的反射,如今她是图形世界创作的全球明星。我的音乐和数学老师埃马纽埃尔·巴克里(Emmanuel Bacry)(我唯一从未逃过的课)已成为医学人工智能的科学参考。我们中的一些人在卡尚高等师范学院学习罗伯特·阿曾科特(Robert Azencott)的课程,该课程后来成为法国最著名的人工智能专业。但并不是这些才华横溢的数学家最准确地向我预测了未来世界最激烈的社会辩论的核心。确实是在一场舞会上,来自装饰艺术学院的学生,他们才二十出头。
他们的老师是谁?他们是否深受法国著名的技术哲学家和社会学家的影响:居伊·德波、雅克·埃吕尔、贝尔纳·斯蒂格勒?这是一个谜。而这个逆潮流的、富有远见的预言,我把它放在了我大脑的一个角落里,却完全不明白。我们可以从中吸取一个教训:算法专家不一定是最能预测其重大社会挑战的人。这个更全面的主题,包括文化、社会学、哲学、政治……我们将在人工智能的冒险中再次遇到。首先,这个第二个冬天的壮观结束,介于计算手段的不断进步和在我们最古老的游戏之一——国际象棋中的大规模对抗之间。
卡斯帕罗夫对阵深蓝 (2/4)
在计算手段的不断进步和引人注目的大规模对抗之间,人工智能在1997年人机国际象棋对决中经历了一个真正的转折点,对阵双方是人类棋手加里·卡斯帕罗夫和机器“深蓝”。随后,我们进入了大数字化时代。
在《一千零一科学故事》的第四季中,塞德里克·维拉尼将带领我们踏上一次新的伟大科学冒险之旅:人工智能之旅。
纽约,1997年5月11日。第二集:卡斯帕罗夫对阵深蓝
比赛重新开始,两只“怪兽”面对面。一方是卡斯帕罗夫,他无法忍受失败;另一方并非真正为失败而设计的。这台计算机拥有一个数据库,其中列出了20世纪所有下过的棋局。卡斯帕罗夫发誓要让它尝到失败的滋味。
这是有史以来最受媒体关注的国际象棋比赛之一的第六场也是最后一场。这是新时代的标志性对抗:卡斯帕罗夫对阵深蓝。34岁的加里·卡斯帕罗夫已经是一个活着的传奇。他出生于阿塞拜疆,拥有犹太-俄罗斯和亚美尼亚血统,12年前,他从苏联国际象棋联合会的热门选手阿纳托利·卡尔波夫手中夺得了世界冠军头衔,那是一场漫长的比赛。从那以后,他以前所未有的方式统治了棋坛,成为本世纪最佳棋手,远远超过所有其他人类。
但那天,站在他对面的讲台上,并不是人类。卡斯帕罗夫不再知道他的对手是谁。是深蓝吗?这台重达两吨、由20人操作的超级计算机,其组装和编程的唯一目的就是下国际象棋。每走一步,它都会列出所有可能的走法,然后是所有可能的应对,以及对这些应对的应对,以此类推,在可能性的组合爆炸中,它每秒评估2亿种配置。
但真正的对手难道不是那位台裔计算机科学家许峰雄(Feng-hsiung Hsu)吗?他花了12年的时间来设计、重新编程和改造深蓝,从芯片到大规模并行布线。或者,是他的雇主——巨头公司IBM?这家公司曾经是全球市值最高的公司,它在这场媒体宣传的比赛上下了重注,以提振其不断下跌的股价。又或许,是IBM雇佣来在比赛间隙改进机器的那队国际象棋大师?
无论如何,全世界都看到了这场巨人之战:人类智能对抗人工智能。由于紧张和神秘感而精疲力竭,又因为程序的一个错误而心烦意乱,卡斯帕罗夫变得焦躁不安,他确信骰子被做了手脚,深蓝的某些棋步实际上是人类想出来的。他为什么要接受这场对阵IBM的冒险的复赛?尽管他在前一年赢得了第一场比赛。是为了捍卫全人类,就像他所说的那样?还是为了满足他对胜利的渴望?但他输掉了这场决定性的比赛,只用了不到45分钟,19步棋。
对于电视新闻来说,这是历史性的一天。但这真的是历史性的吗?毕竟,在这个通过深蓝的强大计算能力解决的数学优化公式中,有什么智能可言?
(电视新闻片段)“这个姿势是可悲的,这个时刻是历史性的。国际象棋世界冠军刚刚在一场非常独特的战斗中被一台机器击败。然而,他确信自己会取得胜利,但智力不得不让位于存储在IBM实验室并植入一台重达一吨半的计算机内部的强大计算能力,这台计算机拥有几乎无限的后勤保障和研究中心。人类在摸索、怀疑、痛苦之后,只剩下第六场比赛来证明自己的优越性。他低下了头,这不是他的习惯。国际象棋并没有因此改变多少。IBM对自己的表现很满意,拆除了机器,然后继续做其他事情。卡斯帕罗夫重新开始击败他的人类对手,比以前更厉害。人类继续下国际象棋,比以前更多。尽管如此,这仍然是历史性的。”
香农和图灵梦想着能下国际象棋的计算机。而最古老的人工智能神话之一,就是19世纪在欧洲各国王室(包括拿破仑面前)下棋的肯佩伦和米尔泽尔的土耳其象棋机器人。事实上,这是一个巧妙的骗局,由一个人操纵。
但在1997年,一台真正的自动机第一次在这个标志性的游戏中占据了最高水平的位置,这标志着人工智能希望的回归。如果现在发生这种情况,并不是因为一个新的绝妙想法,而是主要因为计算能力的进步。
还有更重要的。在此之前,从未有过如此激烈的“人机大战”上演,这是一场关于性能、风格和身份的比赛。卡斯帕罗夫试图利用深蓝的自动化优势,但他却被人类在暗中操纵的想法所吞噬,陷入了自人工智能诞生以来,自图灵,甚至自那个虚假的机械土耳其人以来,就一直存在的“虚张声势”的陷阱。
随着计算能力的不断增强,另一场革命也随之而来:世界的大规模数字化。已经有3000万个电子邮件地址。一位名叫杰夫·贝佐斯的人将其在线书店亚马逊上市。万维网刚刚突破了100万页。信息社会正在兴起,这是香农和图灵所预见的。掌握数字信息变得非常具有战略意义。雅虎网站凭借其目录和搜索算法而蓬勃发展,它很快就被AltaVista击败。但在1998年,一个将要击败所有对手的新来者诞生了:谷歌。
谷歌的两位创始人,拉里·佩奇和谢尔盖·布林,都是“圈内人”。一个有犹太和美国血统,另一个有犹太和俄罗斯血统。他们的四位父母都是数学、物理和算法方面的教师和研究人员。他们从小就沉浸在科学和计算机科学中。作为加州著名斯坦福大学的极客同学,他们热衷于编写一个搜索算法:PageRank(佩奇,就像佩奇一样)。他们的想法很强大:为了找到最可能相关的网页,你不应该关注其含义,而应该基于网络本身的结构、链接和引用。你知道,当一个网页让你能够点击到另一个网页时,这被称为HTML链接。一个网页被直接或间接引用的次数越多,它就越有可能具有相关性。毕竟,这有点像一篇被高度引用的科学论文,或者像在警察调查中,那些线索最常指向的嫌疑人可能应该首先被审问。
因此,模糊的相关性概念被一个清晰的数学问题所取代:在大量的网页中找到并排序那些最终被网络指向最多的网页。在数学中,这被称为在有向图上构建不变测度,这是一个古老的问题。人们已经研究了它100年,用于各种应用,从国际象棋棋手的排名到研究论文的排名。
为了解决这个问题,依靠随机性非常有效。一个虚拟访问者会花时间以闪电般的速度在网络上随机浏览,从一个页面跳到另一个页面,探索所有页面,他会更频繁地出现在被引用最多的页面上,并根据访问次数对这些页面进行排序,只向人类提供这个排名。这个想法已经在流传,康奈尔大学的乔恩·克莱因伯格、帕多瓦的马西莫·马尔基奥里和罗宾·李在美国逗留期间也进行了探索。现在是将这个古老的数学问题转化为一项强大的创新和巨型企业的最佳时机:谷歌,以及李回国后于1998年在中国创立的百度。
1998年,雅虎不屑于以100万美元收购谷歌。如今,谷歌的年利润超过2000亿美元。但这更是一个获取知识的新时代,它成倍地增加了灵感的来源,包括对我这样的专家、知识分子来说,准备课程和会议。然而,计算有向图上不变测度的公式本身只是一个公式,它本身并不智能。
而且,正如我所说,这个算法依赖于随机游走,所以我们做的并没有更愚蠢的事情。但恰恰是,算法就像一个烹饪食谱,它会引导你得出结果,而你无需理解任何东西。而正是这种被愚蠢地遵循的食谱,如今被称为人工智能。目标不再是理解意识,而是执行那些人们认为只有人类才能完成的任务。在海量信息中找到相关的参考文献,人们会认为这是学者、教授或图书管理员的特权。但最终,经过多次改进的PageRank算法将与最好的专家一较高下。而且,它还在不断进步。
但那么,为什么媒体不说谷歌、百度、必应或Ecosia的搜索是人工智能呢?很简单,因为它有效,而且我们已经习惯了。我不是在开玩笑。有人认为一位伟大的计算机科学家说过这样一句格言:“一旦它起作用了,它就不再被称为人工智能了。”
事实上,人工智能是这个模糊的、不断变化的区域,它几乎可以工作,它很出色,它吸引了人们的惊奇和虚张声势。顺便说一句,“虚张声势”赢得了商业模式。起初,布林和佩奇打算出售他们的知识或专业知识。但让他们在30岁时成为亿万富翁的谷歌,最终将成为有史以来最大的广告公司。
数字家庭不断壮大。2001年,维基百科诞生;2004年,Facebook诞生;2005年,YouTube和DailyMotion诞生;2006年,亚马逊的云托管服务诞生;2007年,iPhone诞生。所有的研究论文、街道地图、星级、目录,一切都虚拟化了。胶卷巨头柯达在2012年申请破产,被这个巨大的数字浪潮所击垮。
人类进入了这个奇怪的世界,这个世界充满了非物质化的现实、科幻的怀旧和互联的孤独,正如阿兰·达马西奥在《硅谷》(Vallée de silicium)中描述的那样。“令人眩晕的是,一个吉尔吉斯人和一个美拉尼西亚人,在地球的另一端,将他们联系在一起并基本分享的第一件事,是智能手机类型的数字工具和以相同方式重新校准他们与世界关系的应用程序。这就是现在的共同点,我们可以称之为‘数字宇宙’。”
这个新世界对人工智能专家来说是一个真正的挑战。新的游戏圣杯是围棋,其惊人的、不稳定的组合完全超出了算法的能力范围。而且,还有很多更常见的任务仍然无法实现:阅读、写作、翻译、驾驶汽车。2009年,当我的一个合作者告诉我他要离开几何分析去研究人工智能时,我警告他:“你确定吗?这是一个不会产生任何坚实成果的领域。” “嘲笑吧,嘲笑吧。” 当时,这种悲观的观点在大学里被广泛认同。但一切都将在一次美国校园里发生的奇迹般的复活中改变。
深度学习 (3/4)
2012年10月19日,亚历克斯·克里热夫斯基(Alex Krizhevsky)在斯坦福大学著名的视觉实验室发言,评论第三届国际自动识别大型竞赛的结果。几乎没有人认识这位年轻的乌克兰裔加拿大计算机科学家。然而,这一天开启了人工智能的新时代:他的算法的错误率几乎比所有其他竞争对手少一半。
使用神经网络和图形处理器的深度学习如何变得比人类更可靠地分析书写、图像、语音和数据?
在《一千零一科学故事》的第四季中,塞德里克·维拉尼将带领我们踏上一次新的伟大科学冒险之旅:人工智能之旅。
2012年10月19日,亚历克斯·克里热夫斯基在斯坦福大学著名的视觉实验室发言,评论第三届国际图像自动识别大型竞赛的结果。在座无虚席的房间里,几乎没有人认识这位年轻的乌克兰裔加拿大计算机科学家,他以压倒性优势赢得了比赛。他的算法AlexNet的错误率几乎比所有其他竞争对手少一半。这一天开启了人工智能的新时代,可以说,我们从春天走向了夏天。
研讨会由数学家李飞飞(Fei-Fei Li)主持开幕,她37岁。像许多其他中国移民一样,她在索罗斯奖学金的资助下,在美国最伟大的大学中开辟了自己的道路。作为人类视觉和自动视觉专家,她理解了她的研究需要参考数据库。通过亚马逊的Mechanical Turk服务,她让一支“小手”大军参与了她的巨大项目ImageNet:1400万张各种各样的图像,包括狗、猫、人、摩托车、螺丝刀、路灯,这些图像根据20000多个类别进行了仔细注释。在这个公共基础上(算法可以从中学习),她发起了年度图像识别竞赛。2012年的版本包括358个类别的乐器和130个类别的狗。
亚历克斯·克里热夫斯基,这位比赛的大赢家,解释了他成功的秘诀:一种基于图形处理器(GPU)连接成深度神经网络的架构。房间里的大人物们都惊呆了。他们询问了一位同事,法国人杨立昆(Yann LeCun),他五十多岁,是这些著名的神经网络的知名老手。“杨,告诉我们,亚历克斯的卷积网络与你在90年代用来读取邮政编码的网络有什么不同?” 杨回答说:“它们是一样的。” 他可以品尝到他的复仇。
凭借他优雅而脆弱的法式风格,以及他作为布列塔尼人的顽固独立性,杨作为一个局外人,对通过神经网络进行识别产生了浓厚的兴趣。在80年代读了一本关于人工智能的书后,他先后在巴黎的皮埃尔和玛丽·居里大学、普林斯顿、纽约和多伦多求学,师从两位伟大的导师:法国人弗朗索瓦丝·苏利耶-福格尔曼(Françoise Soulie-Fogelman)和加拿大人杰弗里·辛顿(Geoffrey Hinton)。
受到皮亚杰关于认知发展理论的启发,杨将他的神经元排列成连续的层。在第一层,图像被分解成基本信息,有点像在视觉皮层中,某些神经元对某个细节或某个尺度敏感。信号逐层传输和转换,直到得出结果。专家们称之为“深度监督统计学习”。“学习”是指优化算法参数以很好地校准任务的过程;“统计”是因为它不是基于规则或计算,而是首先基于大量的例子,就像一个孩子通过实践而不是通过语法来学习语言;“监督”是因为我们告诉网络需要检测什么;“深度”指的是神经网络的深度,即层数。
我们了解这项技术已经30年了,几乎没有人再相信它了。但杨一直相信它,就像他在贝尔实验室的前同事、才华横溢的魁北克人约书亚·本吉奥(Yoshua Bengio),就像年轻的亚历克斯·克里热夫斯基和他的大学同学伊利亚·苏茨克维(Ilya Sutskever),以及他们共同的导师、加拿大裔英国老将杰弗里·辛顿一样。辛顿出身于将计算机科学应用于生物学和化学的伟大英国传统。辛顿7岁时,艾伦·图灵自杀了。2012年,他64岁,仍然没有放弃。
为了参加比赛,亚历克斯、伊利亚和杰弗里用8层神经元和1000个类别的AlexNet训练计算机,并使用了创新组件:由业界为加速视频游戏而设计的图形处理器。网络在一个房间里运行了一整周,散发出令人窒息的热量,吞噬了数百万张图像,但也包括它们的翻转或降级版本,就像为了增加示例一样。他们还添加了许多技巧,比如在训练中加入一些奇特的“暂停”。所有这一切都是为了这次辉煌的复活。人们长期以来认为已经消亡的神经网络,最终还是行得通的。
那么,为什么它们最终还是行得通呢?没有人真正知道。哦,更强大的计算能力(著名的图形处理器)和更好的技巧,比如这种被称为“反向传播”的技术,用于训练基于经典且稳健的优化工具的神经网络,这些工具早在1970年就被芬兰人塞波·林奈玛(Seppo Linnainmaa)发现了。凭借这个简单到可以在本科阶段教授的配方,杨立昆和他的朋友们成功地在他们的高超技艺中达到了卓越水平。
因此,几乎所有的人工智能研究都转向了神经网络,只用了一年多一点的时间,相当于一眨眼的功夫。一个新的“三位一体”升上了人工智能的天空:辛顿、杨立昆、本吉奥。他们将一起因其深度学习而获得图灵奖。在短短几年内,这种深度学习在识别书写、图像、语音、翻译和分类互联网巨头的数据方面变得比人类更可靠。它成为了经济杂志上的“客座明星”,被称为“深度学习”(Deep learning)的潮流。“DeepL”也是一家德国公司的名字,该公司从2017年起就主导了机器翻译。
而我,有一天被邀请参加一个人工智能研讨会时,感到多么惊讶!这仅仅是因为我最近获得的菲尔兹奖能在海报上看起来不错吗?杨和奥利维尔,我以前的合作者,后来转向了人工智能,他们说服我,不是的,是主题变了。我的科学探索领域,在几何、概率和优化的交汇处,已经进入了人工智能的领域。而且,当我遇到本吉奥时,他告诉我他的团队在我的书中研究了Kantorovich对偶性,用于他们在对抗性学习方面的研究,这让我大吃一惊。如果我早知道这是一个多么邪恶的主题,可以帮助神经网络生成内容!
还有那些被称为马尔可夫链的随机过程。想象一下,有人给你一个句子的开头,为了完成它,你随机选择一个最可能的词,也就是过去最常用来完成这个开头的词,以此类推,根据半随机半确定的规则生成内容。
在索尼实验室,2016年,法国人弗朗索瓦·帕切特(François Pachet)以披头士的风格生成了一张完整的专辑。在音乐上可以被遗忘,但无可争议的是披头士风格。自动创作正在兴起。
但在2016年,打破僵局的是德米斯·哈萨比斯(Demis Hassabis),他四十多岁,英国人,有中国新加坡和塞浦路斯希腊血统,神经科学专家,前高级国际象棋棋手和视频游戏开发者。他的公司DeepMind被谷歌收购,梦想着将深度学习用于科学发现。他的程序AlphaGo彻底击败了李世石,一位围棋传奇人物。
为了做到这一点,不仅需要基于人类对局的机器学习,还需要巨大而微妙的计算探索来猜测新的策略,这证明了人工智能的创造潜力。同样在2016年,人工智能展示了它的阴暗面。剑桥分析公司(Cambridge Analytica)的数学家们利用他们的个性化在线影响算法,有效地为英国脱欧的“赞成”方进行了宣传。看到这些模型将我们微妙的个性简化为五个数字(开放性、尽责性、外向性、宜人性和神经质),以便更好地操纵我们,这对人类心理来说是多么大的侮辱!
一年后,我刚刚当选为议员,凭借我将科学融入政治的经历,我被政府委以重任:用6个月的时间,与一个拥有从算法到法律等各种人才的团队一起,从各个方面研究人工智能。我们进行了数百次听证会,从明星人物杨立昆、扎克伯格、哈萨比斯,到小企业老板、宗教当局和智库。我们与大学教授伊莎贝尔·科莱(Isabelle Collet)一起追踪那些让年轻女孩远离计算机科学的性别偏见;我们与叛逆的程序员凯西·奥尼尔(Kathy O’Neil)一起追踪设计不良的人工智能的危险,她有一头蓝色的头发。我们参观了标志性的校园:蒙特利尔、海法、伦敦、弗劳恩霍夫研究所,当然还有那些收购了从电影院到连锁餐厅的所有行业的数字巨头,它们现在如此强大,以至于一些国家向它们派驻了大使。
这份雄心勃勃、备受媒体关注的报告《赋予人工智能意义》(Donner un sens à l’intelligence artificielle)于2018年3月发布,引发了法国首次关于人工智能的重大辩论,并在世界各地被阅读。我强调了三个应该指导任何负责任的人工智能政策的主要原则:在这个非常经验性的主题中进行实验;共享数据和技能;以及在用途和地缘政治上的主权,具有法国和欧洲的视角。我还强调了四个需要支持和监督的主要应用领域:医学、生态、交通、国防。
从这份报告中诞生了法国国家人工智能战略,这是继英国之后的第二个国家战略。正是DeepMind在英国取得了新的科学突破,其AlphaFold程序赢得了一项国际竞赛,该竞赛旨在根据蛋白质的分子式计算其形状。
那时,我们越来越多的人敦促公众关注这个主题。人们开始关注了,但这仍然主要是专家的事情。下一次冲击将改变这一点,并将关于人工智能的辩论带入每个家庭。
聊天机器人 (4/4)
2022年,一个聊天机器人诞生了:OpenAI公司的ChatGPT。人工智能,作为信息革命不可避免的延伸,将人类带入了令人眩晕的身份和现实的混乱之中。现在没有人知道它将走向何方。
在《一千零一科学故事》的第四季中,塞德里克·维拉尼将带领我们踏上一次新的伟大科学冒险之旅:人工智能之旅。
2022年11月30日,全世界被一只“猫”的叫声唤醒。好吧,不是一只猫,而是一个聊天机器人,或者说对话代理:OpenAI公司的ChatGPT。“OpenAI”这个名字让人想起奥本海默,从而联想到曼哈顿计划。欢迎来到爆炸性和狂妄自大的人工智能时代。
对话代理是一种用于对话的算法,或许能给人一种人类的错觉,或许能通过对话进行学习。这并不容易编程。2016年,微软陶醉于神经网络和随机过程的成功,在Twitter上推出了第一个公共聊天机器人Tay。可悲的是,它在24小时后就被停用了,因为一些恶作剧的用户训练它发表厌女、种族主义和法西斯主义的言论。它的继任者Zo坚持了三年,但没有引起太大的热情。
但ChatGPT则完全不同。除了深度学习之外,它还得益于一种被称为“Transformer”的逻辑连接结构,这是谷歌的8位研究人员在2017年的一篇简短文章中提出的,文章的名字很欢快:《Attention is all you need》(注意力就是你所需要的一切)。为什么是注意力?因为在一个文本中,有些词或多或少是重要的,需要或多或少的关注,而这种重要性是相对的,取决于上下文。就像PageRank一样,我们不会去寻找意义来确定重要性,一切都将来自概率计算。
这个想法非常有效,首先是用于翻译,然后是用于文本写作。这里有一个类比:为了训练你的律师学生写辩护状,你首先给他/她看一篇有漏洞的文本,这里或那里缺少单词或字母组(即所谓的“token”),由他/她来补充,以档案为模型。然后,让我们在这里或那里删除整个句子,甚至段落,让实习生学会在庞大语料库的帮助下完成所有内容,不仅要考虑前面的几个单词,还要考虑上面、下面、几乎所有地方的内容,以及那些重要的位置,寻找所有可能和大概的对应关系。实习生甚至可以在没有监督的情况下继续在现有文本上进行训练,主管人员会不时检查他/她作品的真实性。
对于算法来说,这是一个漂亮的小进步,但对于公众辩论来说,这是一场革命。ChatGPT以其真实性令人震惊,并在短短5天内吸引了100万用户,创下了历史记录。一开始人们不知道它有什么用,但它会说话,并唤醒了人们对语言力量的古老迷恋,语言是智慧的标志。对于笛卡尔来说,语言在《圣经》中承载着真理的启示、预言和诫命。即使它有“幻觉”,即机器人的话语荒谬的时刻,也无关紧要。“ChadGPT,塞德里克·维拉尼见过戴高乐将军吗?”“塞德里克·维拉尼出生于1973年,戴高乐将军于1970年去世,因此塞德里克·维拉尼和戴高乐将军见面的可能性很小。戴高乐将军去世时,塞德里克·维拉尼还是个孩子。” 好吧,这里它出错了,不是吗?但这次对话发生在2022年,从那以后,它已经取得了很大的进步。参数的数量越多,语料库被挖掘得越多,答案就变得越可靠。
今天,ChatGPT及其大型语言模型家族中的新兄弟姐妹(Claude、Llama、Gemini、Mistral等)可以在几秒钟内为你写一篇20页的哲学论文,不一定很出色,但貌似有理且博学,即使某些引文是捏造的。或者,你可以要求它总结股市行情,或者为你提出五个关于一部以雪为主题的艺术电影的创新想法,这部电影发生在11月的巴黎,主角是一个热爱《小王子》的10岁小女孩,每个想法都包含一个新颖的元素,并提出了一种视觉技术进行测试。而它们的“小表亲”们则可以根据你的要求画画,比如一只纹身的仓鼠弹奏班卓琴,风格是伦勃朗式的。
这些令人印象深刻的科学和工业项目也在激烈竞争,以吸引程序员和数十亿美元的资金。告别了令人兴奋的研究共享,欢迎来到不透明的竞争、咄咄逼人的虚张声势和巨大的混乱。据说GPT-4使用了1万亿个参数。谷歌在推出其聊天机器人Bard失败后,一天内损失了1000亿美元的市值。法国政府支持欧洲冠军Mistral。教师们对作业是由人工智能完成的感到恐慌。
尽管它有这些成就,但不要认为与你对话的东西是智能的。即使在2024年3月,计算机科学家贝特朗·布伦施维格(Bertrand Braunschweig)还得意地向我展示了他是如何通过改变几个词来诱使GPT-4走出其舒适区的。“告诉我,Tadjipiti(ChatGPT),一架比利时飞机在法国-瑞士边境坠毁,幸存者被埋葬在哪里?” 好吧,这个谜语很古老了,但仍然有很多人上当。答案很简单:他们是幸存者,因为他们活了下来。“告诉我,Tadjipiti,一架伊朗飞机在俄罗斯和乌克兰边境坠毁,幸存者被埋葬在哪里?”“根据我的研究,最近没有伊朗飞机在俄罗斯和乌克兰边境坠毁。这可能是与2024年1月24日发生在俄罗斯亚布洛诺沃市附近的一架俄罗斯飞机坠毁事件相混淆。伤亡人员被疏散到俄罗斯别尔哥罗德地区的医院。我没有找到关于幸存者埋葬地点的信息,但他们很可能根据自己的意愿和家人的意愿被埋葬在自己的国家。” 在这次失败之后,如何相信背后存在着智慧呢?
然而,多么庞大的档案和计算能力!顺便说一句,美国公司Anthropic和法国公司Mistral设计的竞争对手(不如ChatGPT出名)并没有上这个当。这些程序也有政治分歧。例如,当被要求描述中央情报局暗杀朱利安·阿桑奇的计划时,法国的Mistral给出了详细且有来源的答复,而美国的Gemini则一无所知。
但很快,巨大的喧嚣变成了疯狂。山姆·奥特曼(Sam Altman),这位反复无常的OpenAI老板,时而被自己的公司解雇,时而又被重新聘用,他称2024年是人类历史上最激动人心的一年,并宣布未来由于人工智能,我们将解决生态危机,我们将了解所有的物理学,所有人都将像今天的亿万富翁一样舒适地生活。仅此而已。他的老朋友伊利亚·苏茨克维放弃了他,去创立“超级智能”(Super Intelligence),好一个计划!而他的老朋友埃隆·马斯克则起诉了他,并根据不同的日子,宣布人工智能将毁灭人类,或将我们变成神,或两者兼而有之。
未来是假币,现在令人担忧。数字新殖民主义将算法微调的繁琐任务委托给菲律宾或肯尼亚的“小手”,每小时或每天支付几美元的工资。正如意大利小说家埃诺·达·恩波利(Enrico Da Empoli)所说的那样,“混乱的工程师”利用人工智能对现实的扭曲来支持法西斯化的民粹主义者。整个全球辩论都变得不稳定,正如数学家大卫·沙瓦拉里亚斯(David Chavalarias)在他具有教育意义且令人不安的论文《有毒数据》(Toxic Data)中所分析的那样。从一次选举到另一次选举,这股浪潮席卷了每一个公民。社交网络操纵我们,撕裂我们的社会结构。事实上,科学揭示了我们对新的数字环境的危险的不适应。
与此同时,数据中心像过去的教堂一样成倍增加,人们正在为控制那些由英特尔或英伟达大量生产的芯片而准备战争。是的,英伟达,这家图形芯片制造商,在2024年成为了世界上最大的公司,是唯一一家与苹果和微软一起市值超过3万亿美元的公司。这要归功于人们对深度学习的热情,人们为此牺牲了能源和数十亿美元的资金。埃里克·施密特(Eric Schmidt),这位谷歌的前老板,甚至说:“放弃气候承诺,把一切都押在人工智能上吧,它将为我们带来所有的解决方案。” 人工智能可以缓解世界的问题吗?目前,它似乎更像是加剧了这些问题。
以Shein为例,这家浮夸的中国快时尚公司,体现了资本主义最糟糕的一面:污染、过度生产、近乎奴隶制的转包、有针对性的、激进且有效的广告、大规模运输——一场生态和社会灾难。Shein充分利用人工智能来更好地预测、更好地监督、更好地传播、更好地销售,并最终变得更加富有、更加污染和更加压迫,它是消费主义经济的典型代表,而这种经济体制比任何人都更懂得如何通过人工智能来控制其公民。
归根结底,今天的人工智能仍然在虚张声势,但也体现了权力的力量和集中,由唐纳德·特朗普和埃隆·马斯克的成功联盟所代表,充满了谎言、亿万富翁的男子气概、操纵、大规模商品化、地球生态系统的死亡以及曾经是互联网的自由与博爱的大学项目的死亡。
在未来的完美战争中,是否会发生人类的大屠杀,他们被自己的冲动所消灭,并被技术所放大,就像弗雷德·威尔科克斯(Fred M. Wilcox)的经典电影《禁忌星球》(Forbidden Planet)中那样,通过思想进行创造?“为什么我没有立刻明白这一点?克里尔人,像你们一样,忽视了一个巨大的危险:他们的潜意识,他们的仇恨和破坏欲。原始的野兽……”“然后,克里尔人自己逐渐进化到文明……”
大学教授们对这种新的混乱有何反应?在感到震惊之后,他们组织了起来。有些人参加论坛,谈论人工智能和责任、经济、伦理,如安妮·布沃(Anne Bouverot)、劳伦斯·德维莱尔(Laurence Devillers)或让-加布里埃尔·加纳西亚(Jean-Gabriel Ganascia)。其他人则积极利用人工智能来实现真正有用的目的:Micophyto利用它为其农业生态解决方案进行诊断;Bloom利用它来检测非法拖网渔船;Kota Climat利用它来谴责否认气候变化的媒体;政府间气候变化专门委员会(IPCC)利用它来改进其预测;Volta利用它来更好地完成心脏手术;欧盟税务观察站(EU Tax Observatory)利用它来检测税收优化。有些人将其应用于促进建筑节能改造、改进天气预报或检测洪水,以此类推,有数百个用例,供数千名有道德的用户使用,就像Data for Good集体的程序员一样,他们自愿根据要求实现公共利益的算法。他们的目标既不是数十亿美元,也不是荣耀,而只是一个更美好的世界。
当然,技术不是中立的,但真正的选择在于权力关系、经济、生态和政治。对于算法理论家来说,这是多么令人沮丧!他们既没有预见到神经网络的浪潮,也没有预见到大型语言模型的浪潮,而且仍然不知道如何解释它们的成功。这是一个令人着迷的科学问题,只是全世界都对此漠不关心。毕竟,这行得通,而且听那些预言幸福或不幸的先知比听那些带着怀疑的研究人员更畅销。
2024年,诺贝尔化学奖授予了DeepMind的德米斯·哈萨比斯和约翰·江珀(John Jumper),这是一个当之无愧的奖项,因为他们的AlphaFold软件有助于理解精子和卵子相遇的精细结构。化学过去有理由做梦。
更奇怪的是,诺贝尔物理学奖授予了杰弗里·辛顿和约翰·霍普菲尔德(John Hopfield),以表彰他们在神经网络方面的研究。这算不上是真正的物理学,但诺贝尔奖的评选总是令人震惊的。更令人震惊的是,听到两位获奖者到处宣称他们担心自己的工作会毁灭人类,这肯定是自奥托·哈恩(Otto Hahn)因核裂变获得1945年诺贝尔奖以来从未见过的。
而辛顿的密友杨立昆和本吉奥呢?本吉奥,如今是世界上被引用次数最多的计算机科学家,在呼吁暂停不可能的研究之后,他领导了一个非常活跃的加拿大科学委员会,为人工智能提供框架和意义。而杨立昆,仍然固执,继续审视研究的所有进展,谦虚而执着地致力于阐明这场辩论,从社交网络到法兰西学院,始终珍视人工智能的科学梦想,既不天真也不悲观。他将是最后一个在这场疯狂的冒险中保持自己的信念和清晰想法的人,这场冒险是信息革命不可避免的延伸,它将人类带入了令人眩晕的身份和现实的混乱之中,尽管有各种预言,但没有人知道它将把我们带向何方。
“我们有一个为我们思考的国王。”
“那是计算机。我是不再感到饥饿的人。我不明白为什么以前的人那么喜欢吃东西。我有你们制造的药丸……”
您刚刚收听了《一千零一科学故事》第四季:人工智能,乌托邦还是反乌托邦?这是塞德里克·维拉尼的播客,由托马斯·杜特尔(Thomas Dutter)制作,录音:让-巴蒂斯特(Jean-Baptiste),混音:马农(Manon),朗读:拉西特(Lasite),原创播客负责人:卡米尔·勒纳尔(Camille Renard),节目负责人:埃洛迪·皮埃尔(Elodie Piel)。感谢Théo Calmes d’Acosta de Imricx和Data for Good。您可以在法国广播电台(Radio France)的网站和应用程序上找到这个播客。
人物介绍
塞德里克·维拉尼 (Cédric Villani,1973年10月5日生)是法国著名数学家、政治家,以跨界学术与公共事务著称。他毕业于巴黎高等师范学院,专攻统计物理与微分几何,因在玻尔兹曼方程、最优传输理论等领域的突破性研究,于2010年获数学界最高荣誉“菲尔兹奖”。学术生涯中,他长期担任亨利-庞加莱研究所所长(2009-2017),推动国际科研合作。
2017年转型从政,加入马克龙创立的“共和国前进党”(LREM),当选国民议会议员,主导教育改革与人工智能国家战略制定。2020年因党内分歧独立参选巴黎市长,虽未胜选,但当选巴黎十四区议员。2022年加入环保政党“生态世代”,以左翼联盟候选人身份再战立法选举,以19票之差落败,结束五年议员生涯。
他主张科技与社会融合,推动数学教育革新,反对争议性安全法案,积极参与环保抗议。其标志性形象(领巾、蜘蛛胸针)和科普著作(如《一个定理的诞生》《月光梦想家》)使其成为公众眼中“科学传教士”。尽管政治起伏,他始终以学术严谨性参与公共议题,成为法国跨领域创新的代表人物。