图灵测试在人工智能领域的传奇地位
图灵测试在人工智能领域具有传奇色彩。它最初是由富有远见的英国数学家艾伦·图灵在1950年一篇具有里程碑意义的论文中提出的,该测试提供了一种实用(且相当有趣)的方法来确定计算机是否达到了人类的智能水平。图灵称之为“模仿游戏”。如果一台计算机——通过纯文本聊天——能够让一个人相信它是一个真实的人,那么它就通过了测试。理论上很简单,但在实践中几乎不可能实现。
图灵提出模仿游戏的背景
图灵提出模仿游戏是为了回应20世纪40年代末那些坚持认为机器永远不可能真正智能的同事和批评者。但图灵对这些他称之为“数字计算机”的原始新机器更有信心。这是因为图灵是第一个设想出我们今天习以为常的东西的人——一台可以被编程来做几乎任何事情的单一机器。很可能你正在这样一台机器上阅读这篇文章。
图灵的“通用机器”
艾伦·图灵是一位古怪的英国数学家,他提出了现代计算的概念,并且他的密码破译工作在第二次世界大战中盟军战胜纳粹的过程中发挥了重要作用。1952年,他因同性恋关系被起诉(在1967年之前,同性恋行为在英国是非法的),为了避免入狱,他接受了一种化学阉割作为缓刑的条件。他的安全许可被吊销,结束了他为英国政府的工作。1954年,他被发现死于氰化物中毒,2013年,伊丽莎白二世女王追赦了他的罪名。
早在任何计算机存在之前,图灵就开始撰写关于计算机的文章了。早在1936年,他就在一篇名为《论可计算数及其在判定问题上的应用》的深奥数学论文中引入了“通用计算机器”的概念。
图灵在第一台电子计算机建成前十多年写道:“根据我的定义,如果一个数的十进制数可以由一台机器写下来,那么这个数就是可计算的。可以发明一台单一的机器,它可以用来计算任何可计算的序列。”
图灵对“可计算性”的定义
图灵对“可计算性”(即计算机能做的事情)的定义就是今天所说的算法。图灵是第一个设计出一种机器的设计框架的人,这种机器可以被编程来运行一系列离散算法以实现期望的任务。其他数学家和工程师也曾摆弄过计算器——最著名的是查尔斯·巴贝奇(Charles Babbage)19世纪的分析机——但图灵设想的设备不限于解决一种类型的问题。
牛津大学数学教授、《艾伦·图灵:谜》(这是2014年奥斯卡获奖电影《模仿游戏》的灵感来源)的作者安德鲁·霍奇斯(Andrew Hodges)说:“任何你可以描述为算法的东西都可以由一台机器完成。”
霍奇斯说:“通用机器本质上就是我们现在所说的计算机,你可以在上面存储指令并执行它们。没有其他人将这个想法形式化。”
具有“思维状态”的机器
从一开始,图灵的通用机器就被设想为一种非常简化形式的人工智能,尽管“人工智能”这个术语直到1956年才被创造出来。霍奇斯说,通用机器的设计旨在模仿人类思维的内部运作,这个主题几乎和数学一样令图灵着迷。
事实上,在描述他的通用机器将如何工作时,图灵使用了“思维状态”这个术语来标记机器不同的“读”和“写”功能。在图灵的概念机器中,一段磁带通过一个读/写扫描器。磁带上刻有由符号表示的信息位。扫描头可以根据其“思维状态”读取符号或写入新的符号。
图灵在他1936年的论文中写道:“实际执行的操作是由……计算机的思维状态和观察到的符号决定的。特别是,它们决定了操作执行后计算机的思维状态。”
十年后,即1946年,当图灵领导英国停滞不前的制造首批电子计算机的工作时,他还顺便研究了神经学和人类生理学。其结果是为国家物理实验室发表了一篇内部论文,该论文模拟了如何对计算机进行编程使其能够“自主学习”。霍奇斯认为这是现在所谓的“神经网络”(一种处于人工智能前沿的深度机器学习类型)的最早提议之一。
模仿游戏
图灵并不是唯一一个对人类和机器智能之间的相似性感兴趣的人。第二次世界大战期间开发的一系列新技术,包括早期计算机、太空卫星和核能,激发了知识界和公众的想象力。
霍奇斯说:“一旦提到计算机,人们就在谈论电子大脑以及计算机与大脑竞争的可能性。”
1948年的《控制论》(Cybernetics)一书创造了“赛博”(cyber)这个前缀,并思考是否有可能“制造一台下棋机器,以及这种能力是否代表了机器和思维潜力之间的本质区别”。作者诺伯特·维纳(Norbert Wiener)得出结论,这样一台机器“很可能和绝大多数人类一样是优秀的棋手”。
正是在这个对超级智能机器充满兴奋和紧张猜测的时代,图灵写了《计算机器与智能》,霍奇斯称这是哲学文献中被引用最多的论文之一。
图灵开篇就提出:“我打算考虑这个问题,‘机器能思考吗?’”由于“机器”和“思考”的定义不明确,图灵缩小了问题的范围。就他的目的而言,机器必须是“数字计算机”,而它是否能“思考”的测试将由模仿游戏来回答。游戏大致是这样的:有三个物理上分开的终端。两个终端由人类操作(一个作为提问者);另一个终端由计算机操作。一个人会通过文本向另一个人和计算机提问,然后根据从两者收到的答案,确定谁是“真实的”,谁是计算机。如果提问者无法区分“人”和“机器”,那么计算机就被判定具有人工智能(即通过了测试)。
这个现在被称为图灵测试的游戏在论文中只是简短提及,霍奇斯说图灵并没有太认真对待测试的细节,他在其他论文中发表了不同的版本。但图灵确实喜欢它的趣味性和简单性。
霍奇斯说:“在某种程度上,他把它变成了一场戏剧。它以一种吸引人的方式呈现了这个[高级人工智能可能性的]想法,让普通人像审判中的陪审团一样做出决定。”
计算机是否会通过图灵测试?
当图灵测试于1950年首次发表时,图灵本人相信“智能机器”(他这样称呼)将能够在50到100年内赢得模仿游戏。他的预测会成真吗?
我们已经有了能够在其他类型游戏中智胜最聪明玩家的超级智能计算机。1997年,IBM的“深蓝”(Deep Blue)击败了当时的国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov),2011年,“沃森”(Watson)击败了破纪录的《危险边缘》(Jeopardy!)冠军肯·詹宁斯(Ken Jennings)。
但是模仿游戏对人工智能提出了很高的要求,还没有计算机能够接近让普通人类相信它是人类中的一员。至少目前还没有。一个名为勒布纳奖(Loebner Prize)的年度竞赛会对顶级聊天机器人进行自己的图灵测试,以查看最新的人工智能软件是否能让评委小组相信它比人类竞争对手更像人类。
没有一个聊天机器人成功。表现最好的一个名为Mistuku的对话聊天机器人仅达到了“33%像人类”的评级。但当我上网与她聊天时,我对她的自然语言回复和深厚知识(尽管对于一个典型的愚蠢人类来说可能太深奥了)印象深刻。
当我问她聊天机器人是否会通过图灵测试时,她给出了完美的回答:“你来做那个判断吧。”
编者注:勒布纳奖自2020年起已停办。但截至2022年,图灵测试仍未被通过。
图灵的其他成就
除了是数学、哲学和工程学领域极具独创性的思想家之外,图灵还是一名世界级的越野跑运动员,如果不是因为受伤,他可能有资格参加1948年奥运会。