道格拉斯·霍夫施塔特,中文名“侯世达”,凭借《哥德尔、埃舍尔、巴赫:集异璧之大成》(GEB)一书获得了普利策奖。在他看来,我们并不理解人工智能的真正含义。而终其一生,他都在探寻如何复制人类思维。
“这取决于你对人工智能的理解。”在印第安纳州伯明顿市(Bloomington, Indiana)的一家杂货店里,道格拉斯·霍夫施塔特(Douglas Hofstadter,中文名“侯世达”)一边挑选沙拉食材,一边说道:“如果将其定义为理解人类思维或是制造类人物品的尝试的话,人们或许会称赞——即使没称赞到这个程度——这是有史以来为数不多的杰作之一”。
在说这些话的时候,侯世达显然是经过深思熟虑的。毫无疑问,对他而言这一尝试是当今人工智能领域中最为振奋人心的项目,大众可能会将其视作科幻小说情节成真的又一基石——就像IBM公司研制出的玩转《危险边缘》1 (Jeopardy)的超级电脑沃森(Watson),或是苹果的iPhone手机助手Siri语音系统——而事实上,这两者都不具备什么智力。在过去30年中的大多数时间,侯世达都带着自己的研究生,窝在印第安纳大学(Indiana University)校园正西北角的一个老房子里,利用闲置资源一心编写代码,试图编写出能够思考的计算机程序,从而发现人类的思维运作方式。
想象力,乐观主义和发展的本质
他们这样做的前提很简单:思维是一个很不寻常的“软件”,想要了解一个软件的运行方式,最好的办法就是自己试着编写一下。计算机有足够的灵活性,足以将思维中奇怪的发展回路构建出来,但是它只会对精确指令作出回应。因此,如果这次努力得以成功,结果将会事半功倍:我们最终会了解自己的思维是如何运作,同时也会制造出智能机器。
就像侯世达这些年一直解释的那样,他在课间从粒子物理研究学院回去的路上,突然萌生的想法改变了他之后的人生。他对自己在俄勒冈大学(University of Oregon)的博士论文研究方向非常失望,感到自己”深深地迷失”了。1972年的夏天,他决定打包行李,驾驶着他命名为“水银”(Quicksilver)的车一路向东,穿越整个大陆。每天晚上,他会找个新地方扎下帐篷(“有时候是在森林里,有时候是在湖边”),打着手电筒看书。他可以随心所欲地思考,最终他选择了思考“思维”本身。从他14岁起,当他发现自己的小妹妹莫莉由于“大脑有很严重的障碍”而无法理解语言时(她的神经很可能从出生起就有问题,而且诊断不出原因),他就暗自开始对思维与物质间的联系深深着迷。1890年,心理学之父威廉·詹姆斯(William James)将两者之间的联系描述为“世界上最神秘的事情”:意识如何能够变成物质?几磅重的灰色胶质如何产生思维,甚至是对思维自身的思考?
在开着“水银”到处漫游时,侯世达认为自己找到了答案:所有的思考都存在于数学证明的核心中。1931年,出生于奥地利的逻辑学家库尔特·哥德尔(Kurt Gödel)曾做过一个很著名的演示,他演示了数学体系如何阐明数字及体系本身。侯世达认为:意识也是通过类似某种“平行交叉的反馈回路”出现。一天下午,他坐下来,打算给朋友写封信,把自己的想法大致描述下。但是在完成了30页之后,他决定暂时不寄出,而是让想法再沉淀一下。七年后,这些想法已酝酿成熟,最终被整合成为一本2.9镑、777页的书,名为《哥德尔、埃舍尔、巴赫:集异璧之大成》(G del, Escher, Bach: an Eternal Golden Braid,后文简称GEB)。侯世达凭借此书获得了普利策奖(非小说类),年仅35岁,是第一次写书。
GEB一问世便引起了轰动。1979年7月,《科学美国人》杂志(Scientific American)极受欢迎的专栏作家马丁·加德纳(Martin Gardner)难得地在自己有限的专栏篇幅里为该书写了充满溢美之词的书评,正是他催化了这场胜利。在书评的最开始,加德纳说道:“每隔几十年,就会有位不知名的作家带给我们一本内涵深刻、措辞清新、博大精深、幽默风趣、文风华丽、构思新颖的作品,而它一旦出现,就立刻成为文学盛事。约翰·霍兰德(John Holland)——第一位获得计算机科学(后被划到传播学分类)博士学位的美国人,回忆说,“我周围的人都说这本书太棒了。”
对于自己在人类文明上留下不可磨灭的印记这一点,侯世达表现得很淡然。GEB不仅是一本富有影响力的书,它还是一本解析未来的书,人们将其称为人工智能的“圣经”。而人工智能作为新兴学科领域,将计算机科学、认知科学、神经系统科学和心理学这四门学科联系在了一起。侯世达对电脑程序的描述清晰、独特,揭示了“人类思维软件结构的奥秘”,这些解释吸引了整整一代的年轻学生走进人工智能的研究领域。
但是随后,人工智能的研究方向发生了改变,侯世达却不想改变初衷,为此他几乎从这个领域中消失。
GEB出版时,人工智能研究正处于历史转折点。20世纪80年代初,学术界的资金正缩减:供给长期“基础科学”的资金逐渐耗尽,研究重点转向实用系统。野心过大的人工智能研究名声很差,好高骛远的承诺成了家常便饭。1956年时达持茅斯夏季研究项目(Dartmouth Summer Research Project)诞生时,所有组织者——包括“人工智能”这一术语的创造者约翰·麦卡锡(John McCarthy)在内——都曾表示,“如果精心挑选一些科学家,让他们整个夏季在一起研究的话,人工智能会向前迈出一大步,制造出拥有一种或几种以下能力的机器人:会说话、会思考,解决现在还只能由人类所解决的问题,实现自我提高。之后麦卡锡回忆道,他们失败的原因是“人工智能的开发比我们想象的更难”。
战时压力渐增,负责人工智能研究的主要部门美国国防部高级研究规划署(ARPA)预算紧缩。1969年,美国国会通过了曼斯菲尔德修正案(Mansfield Amendment),要求国防部仅对那些“直接与具体军队职能或运作有明显关系”的项目提供支持。1972年,ARPA更名为DARPA,其中的D代表国防部,这也反映了该部门对于军队利益方面的项目的重视。直至战争进行了一半2 ,规划署才自问:我们的国防究竟有何改进?确切地说,这10年中价值5千万美元的研究经费到底花在了哪儿?
人工智能研究初期,人们只是努力给阿兰·图灵(Alan Turing)的著名问题——“机器能否思考”——一个肯定的回答。到20世纪80年代早期,面对来自各方的巨大压力,人工智能研究的重点逐渐改变,各方观点各异,有人认为它日趋成熟,也有人认为它从根本上改变了研究方向——向着程序驱动的方向发展,成为以运用程序带动软件工程的一个分支。通常具体买主确定之后,相关研究和制造就会迅速完成。对军队来说,最受欢迎的项目包括“控制和指挥”系统,比如针对战斗机飞行员的飞行辅助计算机操作系统;以及能够自动在航空摄像图中识别道路、桥梁、坦克和弹药仓库的程序。在民用私人领域,最流行的是“专业系统”,像是“桩型选择系统”这样的专业定制产品,它可以帮助设计者选择建筑物打地基时所需要的材料;以及电缆故障自动检修及策略推荐系统,程序可以帮助提取和总结电缆维护报告。
在GEB一书中,侯世达更希望大家能够理解人类智慧本身,而非利用人工智能来巧妙地解决问题——而此时,他的方式因无法“开花结果”而被抛弃,他的光芒一闪而逝,侯世达发现自己逐渐从主流队伍中被剔除出去。此时推动大流的观念是:让机器尽可能以任何方式运作,而不再考虑机器是否具有人的思维。
“很少有人关心思维如何运作”,侯世达表示,“而这正是我们所感兴趣的——思考是什么?”
IBM公司生产的超级电脑“深蓝”打败了国际特级象棋大师加里·卡斯帕罗夫(Garry Kasparov),而它这次的胜利完全是凭强力破解。它在比赛时的每一步有效落子,都会考虑对手如何出棋和自己的应对策略,通过运算,提前估出六步以上的走法。拥有超快估算能力的“深蓝”,可以计算出每一步可能落点的得分,并选择得分最高的出棋,它仅仅是靠原始计算能力打败了世界大师。“深蓝”能在一秒钟内估算出多达3.3亿个位置的得分,而卡斯帕罗夫在落子前,却仅能估算出几十个的。
侯世达想知道:如果“深蓝”的胜利不能带给人们任何的启发,那为什么要去完成这项任务呢?“好吧!”他说道,“‘深蓝’的确很会下棋,但这又能说明什么?我们能从‘深蓝’身上了解到人类是如何下象棋的吗?不能。它能告诉你卡斯帕罗夫对棋局的想法和理解吗?”人工智能的出现不是为了回答这些问题,尽管它们让人印象深刻,可是在侯世达眼里,却是误入歧途。他淡出人工智能领域的速度和他进入该领域时一样快。他表示:”对我来说,作为人工智能研究领域中的新手,我根本不想玩这骗人的把戏。确实,我并不想卷入一些看似是研究智能、实际上跟智能根本不沾边的‘高端’项目。我不知道为什么,越来越多的人沉迷其中。”
一个答案是:20世纪80年代早期,人工智能企业的市值仅几百万美元,而到80年代末期,已涨到了几十亿。(自1997年“深蓝”赢得比赛之后,IBM的股票就暴涨了180亿美元。)人工智能作为一门计算机工程学科的地位越稳固,就越能完成更多的工作。如今科技跟人类的思维扯不上什么关系,基于这一论断,我们似乎正处于黄金时代。人工智能的应用遍及重工业、交通运输业以及金融业。也正是人工智能,支撑着谷歌的核心功能、Netflix3的电影推荐功能、IBM的超级电脑沃森、苹果的Siri语音系统、无人驾驶飞机与无人驾驶汽车的系统。
斯图尔特·罗素(Stuart Russell)和彼得·诺维格(Peter Norvig)在《人工智能:一种现代的方法》(Artificial Intelligence: A Modern Approach)一书中说道:“就在莱特兄弟等人不再模仿鸟类,而是开始……学习空气动力学时,人类寻求飞行的努力就成功了。”正是因为放弃了模仿人类,人工智能才开始运作。这就是类推的真谛:既然飞机不能像鸟类一样挥动翅膀,那为什么要让电脑思考呢?
这一点的确很有说服力。但是,当考虑到我们的实际需求时,这个论点就站不住脚了:你希望能有一个搜索引擎4,当你搜索某东西时,能够像人类一样明白你的真正用意。伯克利大学的计算机科学教授罗素告诉我,“互联网上搜索引擎类公司的市值总和有多少?大约在4千亿到5千亿美金。而真正能够从中提取、理解信息的搜索引擎,市值能达到其他公司总和的10倍之多。”
那么,这就是一个关系到数万亿美元的问题:如今的做法是否能让我们达到目的?目前支撑人工智能的方式,很少借鉴人类思维方式,而是以大数据和大工程为基础。如果你都不知道你自己是怎么思考的,又怎么能指望一个搜索引擎明白呢?或许,正如斯图尔特·罗素和彼得·诺维格在《人工智能:一种现代的方法》的最后一章中所提到的,在人工智能实用化的过程中,其发展好像通过爬树来登上月球:“我们的确在稳步前进,不过只是能到树顶而已。”
现在的电脑仍然难以识别手写字母“A”。正是因为电脑识别难以实现,才有了了CAPTCHAs5 (全自动区分计算机和人类的图灵测试),网站登录时会要求你识别扭曲的文字并将其输入到文字框内6。
在侯世达看来,这没什么好惊讶的。他在1982年的一篇文章中提到,了解所有字母A的共通点,才能“理解思维范畴的延伸性”。他说,这才是人类智慧的核心。
侯世达喜欢说:“认知就是识别。他将‘看作’描述为基本认知行为——你将一些线条看作字母A,将一大块木头看作“桌子”,将会议看作玩弄“皇帝的新装”的把戏,把朋友的不满视为“酸葡萄”心理,把年轻人的时尚看作是赶时髦,这些认知贯穿了你的生活。这就是理解力。但理解力到底是怎么运作的呢?整整三十年,侯世达和他的学生一直在努力寻找这个问题的答案,试图建立“拥有基本思维模式的电脑模型”。
侯世达在其最新著作《表面与精华》(Surfaces and Essences,与伊曼纽尔·桑德(Emmanuel Sander)合著)中写道:“我们每时每刻都会同时面临许多事情、或是复杂的状况。” 作为想要生存的生命体,我们需要做的就是理清这些混乱。正因为我们的大脑有了正确的观念,所以我们才能解开这些混乱的结。一直以来,这都是自然而然发生的。类推是侯世达常用的专业术语。新书的封面是一堆随机排列的字母A,文中的论点便是,类推——“思想之火与动力”,我们每日的精神食粮。
“比如与人聊天,”侯世达说道,“你会吃惊的发现,你的每一次聊天都是一个类推的过程。”某人提到的事情,会让你想到其他事;而你说的东西,又会提醒别人一些什么——这就是对话。没有比对话更直接的了。但侯世达表示,对话中的每一步都是一个类推,思维跳跃相当复杂,简直是“计算神将”。大脑不知如何就能剔除任何不相关的表面细节,提取出主要信息——即构架精髓,然后从你“库存”的想法和经验中,检索出最为相关的故事或评论。
他写道:“当心!那些看似无用的语句如‘哦,是的,我今天碰上了这事儿!’……在这些废话里藏着人类思维的奥秘。”
GEB发行过后的许多年里,侯世达没再接触过人工智能。现在,如果你从书架上取出《人工智能:一种现代的方法》,一千多页的内容里都找不到侯世达的名字。他的同行,都把他看作是过去式了。GEB的新书迷看到出版时间后,得知原书作者还活着时甚感惊讶。
在侯世达的陈述中,事情是这样的:在其他研究人工智能的人开始制造产品时,他和他的团队正“耐心、系统而出色地” 钻研真正的问题,寻找通向光明的道路,就如他的朋友哲学家丹尼尔·丹奈特(Daniel Dennett)提到的那样。 “很少有人关心思维如何运作” ,侯世达表示,“而这正是我们所感兴趣的——思考是什么?我们不想丢掉问题。”
“我是说,谁知道呢?” 侯世达说道,“谁知道会怎么样。也许有天,人们会说,‘这些东西侯世达已经说过、做过了,我们现在却还在探索中。”
这听上去就像是一个迷茫者的自我安慰,但是他的这种想法也许是想引发你思考一个问题:如果有关人工智能最好的点子——侯世达所谓的”真正的人工智能”,虽然他对使用这种看似矛盾的说法表示歉意——被丢弃在伯明顿的抽屉泛黄,一切将会如何呢?
侯世达生来就爱思考,就好像有些孩子天生就是犯罪的料儿。他成长于上世纪50年代的斯坦福大学校园,就在帕罗奥多(Professorville)南边不远。他的父亲罗伯特是核物理学家,1961年诺贝尔物理学奖获得者之一。他的母亲南希热爱政治,倡导残疾儿童教育,同时任职于阿格纽斯发展中心(Agnews Development Center)的伦理委员会,莫莉便是在那里生活了20多年。正如人们开玩笑时说的一样,南希空余时间是位“专业的教师妻子”:她把罗伯特的起居室改造成了一个可以让密友们肆意畅谈的地方,在这里“科学与艺术相互交融”。侯世达对我说——这是一场智慧的盛宴。
侯世达把父亲的讨论通通吸收了。他热爱父母的朋友们,醉心于他们的奇谈怪论——那些“最细小或者最庞大的东西”。(在侯世达8岁的时候,他曾说他梦想成为一个“静质量为零,自旋为1/2的中微子7。”)他会泡在物理系,吃四点钟的下午茶。“就好像我是一个12岁的小研究生。”侯世达说。他充满好奇、永不满足、不知疲倦——“就像被思想吸引的孩子”——当然,也会紧张无比。他的思维模式曾经是、现在也是,被他称作“吃大餐”的模式:他会一天弹上七个小时钢琴,也会下决心把叶甫盖尼·奥涅金(Eugene Onegin)的诗拿出来背上1200行。他曾经玩了好几个星期的录音机,让自己学会倒着说话,这样倒带的时候他说的话听起来就是正常顺序的了。他会一连几个月全身心地投入在某件事当中,或是学习地道的法语,或是写些编纂荒诞小说的程序,或者是阅读大量关于毕达哥拉斯理论的证明,直到他看出它“为什么正确”为止。他“每天都要探索学习”,侯世达说:“没法不去探索,我完全被这些东西迷住了。”
现在,侯世达已经六十八岁了,但是他的性格中仍旧有一些彼得·潘8 (Peter Pan)的成分,他更多地生活在文字、软件的世界中。这个年纪的人难道不能正常一点么?不整洁的白发耷拉在耳朵前面,身形憔悴、无精打采,在鼻子和上唇之间有一道深沟,看起来好像圣诞怪杰。但他仍有一股属于年轻人的严肃劲和认真劲。他对事物的要求很高,并不那么好相处。他是那种会恳求整个晚宴上的人都吃蔬菜的素食主义者,是那种会纠正你话语中“性别歧视语言”9的敏感的人。“他这个人就是有这么多的规矩,”一个与他相识了五十九年的朋友,彼得·约翰(Peter Jones)说:“就像他讨厌你们这些家伙一样。还有,和他讲话的时候,最好别说‘你们这些家伙’。”
侯世达在伯明顿的印第安纳大学当了三十多年的教授。现在,他和去年九月新婚的妻子林宝芬(Baofen Lin)一同住在距离校园几个街区的房子里,前妻留下的两个孩子丹尼和莫妮卡也都已长大成人。尽管他和认知科学的课题组以及多个系——比如计算机科学、心脑科学、比较文学、哲学系的附属机构都有密切联系,但他并没有这么做的义务。“我想我拥有的是你能想象的最轻松的工作了,”他告诉我,“我只做那些我想做的事。”
他大部分时间都呆在顶楼的两间书房里。那里铺了地毯、有点闷气,有些乱、他喜欢整洁点的。他的书房是他的世界中心,他在那里读书、听音乐、学习、画画、写书、发电子邮件。(侯世达每天要花四个小时写电子邮件。“对我来说,”他说,“一封电子邮件和一封信是一样的,每一处都必须正式,必须高雅,必须仔细写……我总是重写、重写、重写、不停地重写所有的电子邮件。”房间的布置呈现出侯世达生活在自己的精神世界中。房中堆满了书籍、绘画、笔记本和文件,处处可见思考留下的痕迹。书房就好像是陈列他思想的博物馆,能让我们看见他在头脑中囤积的知识。
“任何我思考过的东西都会成为我职业生涯的一部分。”侯世达说。与他一同编写《思即是我》(The Mind’s I )的丹尼尔·丹尼特(Daniel Dennett)说:“很简单,侯世达是一位现象学家10,真正身体力行了现象学,在这一点上他做得永远比任何人都好。”侯世达研究他自己的思维现象——比如感觉,内在行为。“这就是他如此擅长现象学的原因,”丹尼特告诉我:“他比任何人做得都好,因为他总是在积极尝试,探索人的行为背后到底发生了什么,探索头脑中到底发生了什么。”
在裤子后面的口袋里,侯世达总是装着四色圆珠笔和一个小笔记本。这个本子曾经用来记录和他的研究相关的灵感,但现在只是一个积累资料的本子,他的书架上到处都是这样的本子。他抽出一本——是从上个世纪50年代末开始使用的。本子上全都是语言中的错误。在他还是个少年的时候,他记下了一万个这样的例子,诸如音节交换(“注针射头”)、词不达意(“运行那个策略”)、慌不择言(“小心好运”)等等,这些错误中的一半都是他自己犯的。他给笔记本拍照,用剪子把它们裁开,放在他书房里随处可见的小橱柜和贴着标签的盒子里。
对侯世达来说,它们是一些线索。“对于在头脑中进行的活动来说,没有谁是一个可靠的向导,你会被定义、潜意识误导”,他曾经这样写道:“因此大量搜索错误的行为就显得非常重要。在一个单独的错误里,犯错机制几乎无迹可寻;而在大量搜集起来的错误中,关于特定犯错机制的有力证据(或反证)就会逐渐显现11。正确的表达没什么意思,因为正确的表达是一根魔棒,很好地发挥了掩饰意识如何运作的作用。侯世达寻找的是“兔子的耳朵尖……陷阱的蛛丝马迹”。
侯世达被称作当代的威廉·詹姆斯。詹姆斯在其1980年出版的经典著作《心理学原理》(Principles of Psychology)中,赋予内省以新的含义(他首创意识流概念),“我们多数的想法都会永远地消失,再没复原的可能”,詹姆斯写到,“而心理学,不过是把宴会上掉下的面包屑收集在一块。”正如侯世达一样,詹姆斯一生都躲在桌子下,愉快地寻找面包屑。区别在于,詹姆斯只是用双眼在寻找,而侯世达则拥有一个类似显微镜的东西。
你可以不把载人飞机的发明归功于莱特兄弟(the Wright)在基蒂霍克镇(Kitty Hawk)制造的滑翔机,而你不得不承认他们在自己的单车行里,用废金属以及回收的车轮辐条修建了六英寸的风洞。当他们的竞争对手在以高价测试机翼时,莱特兄弟却开始致力于空气动力试验。这个实验的成本只是前者的零头。他们的传记作者弗莱德·霍华德(Fred Howard)表示,“莱特兄弟的空气动力实验用时如此之短,运用的材料和支出也甚少,却是最关键、最富有成效的。”
在伯明顿北费丝大道(North Fess Avenue)上一所老房子里,侯世达带领流体类比实验团队,他亲切地称为FARG(Fluid Analogies Research Group)。团队的年度运营预算为10万美元。置身其中,你会感到像家一样舒适自在——如果你在里面溜达,会很容易错过储物间旁嵌入式的文档柜,客厅里嗡嗡作响的复印机,还有在书柜上图书管理的标识(神经系统科学,数学,意识)。在这25年中,这个地方一直团队用来做高端项目的领地,正如侯世达曾写道:“首先是揭开创造力的奥秘,其次是揭开意识的奥秘”。
计算机对FARG的价值,就如同风洞对莱特兄弟发明飞机的价值一样。人类思维快速、无意识的转换所引起的混乱,放到计算机里,却可以放缓、倒退、暂停甚至还可以编辑。侯世达认为,这正是人工智能发展的绝佳机会。一个程序中的某些部分可以被选择性地隔离出来,用于验证在缺失这些部分时,程序是怎样运行的;改变参数来检验性能如何改进或退化。当计算机让你吃惊时,不论是明显的敏捷抑或是明显的迟钝,你都可以查找到具体的原因。“我总感到人类开始充分了解大脑的复杂性”,侯世达写道,“唯一的希望,便是通过在计算机上模拟思维模式和在模型不可避免的失败中吸取经验。”
在侯世达的家中,将捕捉和整编好的思维过程转换成能运作的电脑程序,看似只是一小步,却花费了一个熟练研究生大约5到9年的时间。这些程序的基本构架是相同的:一套部件以及一套可追溯到Jumbo的整体设计,这是侯世达1982年编写的用于解决报纸上的拼字游戏的程序。
当你听到编写一个程序可以解决报纸上的拼字游戏,你的第一反应应该是:对电脑而言,这不是大材小用吗?的确!——我曾编写过一个程序,只花费4分钟的时间便可找出任何单词。它是这样运行的:将打乱的字母取出,尝试重新组合字母,直到发现能和字典中的某个单词相匹配。
侯世达花费了2年的时间来构建Jumbo程序:较之解决拼字游戏,他更感兴趣的是当他解决了问题时,那个程序是怎么运作的。他一直在关注自己的思维。“我可以感受到字母在我的脑海里打转,” 他告诉我,“他们好像蹦蹦跳跳着簇成一团,又分开,又重新组合——不安分的家伙们。我什么都没做。那些字母在干事儿。他们会自个儿尝试各种事物。”
侯世达研究的模仿思维自动组织字母顺序的架构是基于生物细胞内的运动。字母由不同类型的“酶”进行组合和拆分,就像侯世达说的,这些“酶”摇摇晃晃,看在哪里找到他们的结构,兴奋地进入有效的状态。有的“酶”是重组者(比如可以把pang-loss重组为pan-gloss或是lang-poss),有的是缔造者(g和h就组合为辅音群gh,jum和ble就组合为单词jumble),还有些是拆分者(ight被拆分为it和gh)。每一次反应依次形成其他的“酶”,“酶”的数量在任何时候都需要平衡自身来应对混乱的状态。
“我并不想卷入一些看似是研究智能、实际上跟智能根本不沾边的‘高端’项目。我不知道为什么,越来越多的人沉迷其中。”
模仿思维自动组织字母顺序不同于一般的运算,它的变动性显著。侯世达再次以类推的方式说明:一群蚂蚁在森林里游荡,其中的侦察兵向四面八方进行打探,并向同伴汇报他们的发现,这些发现指引着蚁群对食物进行有效探索。这是一支强健的队伍,即使一些蚂蚁被踩死了,队伍也可以很快恢复,正是由于这种坚韧,他们才能对各种突发事件应对自如。
当你读《流体概念和创造性类推:思维基本体系的计算机模型》 (Fluid Concepts and Creative Analogies: Computer Models of the Fundamental Mechanisms of Thought)这本书时,看到书里对这个模型结构及所运用程序的逻辑和体系的详细描述,你会怀疑侯世达是否能因这样一本不切实际的书而出名。正如一位《纽约时报》的作家在1995年的书评中谈到的:《流体概念的创造性类推》一书的读者忍不住怀疑在印第安那大学的团队正在研究什么重要东西。
但是很少有人,甚至是GEB的崇拜者,知道这本书的存在或是书中描绘的程序。这大概是由于FARG的项目几乎是夸张且不切实际的。因为他们在狭小而异想天开的“微小领域”中进行研究,实施的任一项目都不会优于真正的人类。
现代人工智能的主流——大约始于上世纪90年代初,并一直延续至今——经历了几乎被扼杀在襁褓的寒冬,才出现了漫长而渺茫的春天,得以稳步推进,并在商业上取得了成功。
人工智能面临着一个基本的困境。一方面,那些我们知道如何编写的软件已经非常有规律了,这些电脑程序就像秩序井然的军队,配备有各级指挥官,每一级都可以实现命令的层层传递,就如同程序可以调用子程序,子程序再调用下一级子程序。另一方面,这对于我们要编写的程序同样适用。因此,这种规则的等级性似乎是个错误的理念。侯世达曾总结过这一现状,他写道:“对人工智能的全部努力实质上就是要战胜计算机的死板。”80年代后期,主流的人工智能陷入了追求金钱、影响力,出席各种会议,给期刊投稿、出书中——因为在人工智能对计算机的战争中,他们输了。
曾一度成为业界维持生计的“专家系统”,因脆弱性正逐步走向没落。根本上讲,它们的运行模式是行不通的。使用机器将一种语言翻译成另一种语言,渴望人工智能的必杀技。其标准是把语言学家和翻译家集中起来,并尝试把他们的专业知识转化成程序可以遵循的规则。这种标准失败的原因,也许你可以预料到的:人类的语言复杂多变,没有一套规则可以将其诠释清楚,即使遵循了所有的规则,也会出现打破规则的例外。
如果机器翻译作为商业活动存活下来——如果人工智能也存活下来——必须另辟蹊径,要是能找到一条捷径就更好不过了。
事实确实如此。你可以说,它始于IBM公司1988年启动的Candide机器翻译系统项目。隐藏于Candide系统背后的,是首先承认基于以下规则:深入理解语言是如何产生的;语义、句法、时态是如何起作用的;词汇如何组合成句子、句子如何组合成段落——更不用说理解观点,词汇只是中间衔接的通道了。所以IBM抛开了这种方法。开发者接下来所做的并不高明,相反特别简单,甚至让你很难相信。
这项技术叫做“机器学习”。其目的是在一项设备中输入一个英语句子使其输出一个法语句子。当然,人脑就是这样一种设备,但最重要的是要避免人脑的复杂性。我们要做的就是用一套几乎不需要工作的机器,输入英语词汇,它可以随意的输出相应的法语词汇。
想象一个箱子,上面有几千个按钮,其中有一些按钮负责一般性设置:输入一个英语词,应该平均输出多少个法语词;另外一些负责特殊性设置:输入词汇jump,输出哪些相应的法语词。问题是:只通过调整这些按钮,你能使机器把符合逻辑的英语转换成合乎逻辑的法语吗?
结果是可以做到。你需要做的就是把英语句子输进机器,而这些句子的法语翻译你是知道的(例如Candide系统,就是使用了220万组主要来源于加拿大议会讨论记录双语句子)。一次只进行一组,输入句子的英语部分,看看它会输出什么样的法语句子。如果结果与所期望的不同——也就是已知的正确译法不一样,那么机器还不精确。所以要微调按钮再次尝试。经过充分的输入、尝试、调整和再输入、再尝试、再调整之后,你会对这些按钮熟悉起来,能够产生与英文句子相匹配的法语句子。
用上百万组句子重复上述过程,你将逐渐校准你的机器。即使输入一个你不知道法语怎么说的句子,也能得到比较准确的结果。这样做的优点是,你不需要编写精准的程序,也不需要弄清楚按钮为什么这样或那样拧。
机器学习并非是由Candide系统首创——实际上,20世纪60年代,机器翻译才初具形态时,这一理念就曾被多次试验。但直到IBM公司建立Candide系统,机器学习试验才得以成功。此次突破并非是Candide系统破解了这个问题,而是这样一个简单的项目得到了充分的执行。机器翻译,正如小组成员亚当·伯杰(Adam Berger)在项目的总结中写的,是“在最困难的自然语言翻译任务和一般性的人工智能问题上广泛思考,因为如果没有对要翻译文本的上下文理解,准确翻译是不可能的。”像Candide系统这样简单的项目能够运行,说明有效的机器翻译不需要理解词义——它需要的是大量的双语文本。正因如此,它变成了征服人工智能理念的证明。
Candide系统功能惊人,它的处理方法就是把化解复杂过程的问题转化为在运行过程中寻找尽可能多例子的问题。这个问题不像模仿人脑的思维过程这么复杂,只会随着时间的推移而变得简单——80年代末到90年代初,物理学家们简直闯入了万维网的天堂。
人工智能在90年代复兴绝非偶然,同样,世界最大的网络公司谷歌成为“世界最大的人工智能系统”也绝非偶然。《人工智能:一种现代的方法》的作者,谷歌产品研发总监彼得·诺维格说,现代的人工智能是关于“数据,数据,数据!”,谷歌公司较其他公司而言,拥有更多的数据。
谷歌翻译,基于与Candide系统相同的开发原理,现已成为世界一流的机器翻译系统。其软件工程师乔希·埃斯特尔(Josh Estelle)表示,“在最初几周的人工智能课程学习中,你可以采用任一简单的“机器学习算法”编程,无论是学术界已不再使用的,还是看起来没什么用的——但是,数据胜过一切。当你的训练案例从1万个增加到100亿时,所有的算法都行得通了。”
人工智能很有用,因此谷歌翻译覆盖到的大多数语言,团队员工也不会讲。“这是个划算的事情”,埃斯特尔说,“你或许想多雇些工程师,而不是那些只会说母语的人。翻译,即是大规模的数据挖掘,这里头工程学的作用不可小觑。”
机器学习方法之所以带来如此可观的收益,是因为:人工智能剔除了一阶错误,并以具体的程序代替认知性的任务。“你可以发现这一过程正异军崛起”,诺维格解释道,“如果我们能让这一程序的运行时间缩短10%,那么每年将节省数百万美元,所以加油吧。那么我们究竟该怎样做呢?着眼于数据,用机器学习方法或是统计法总能找到更好的解决方案。”
谷歌已开始寻求深层次解决方案:由脑生物学激发机器学习的延伸;试图用一张“知识图”将单词图表化,比如当你搜索“奥巴马”时,出现的是与之相关的人物、地点和事件。但谷歌用户多达10亿,但为满足多达10亿的庞大用户需求,谷歌不得不采取权宜之计。不必使劲逼它,为了提高用户覆盖数、搜索反馈速度,减少工程量,谷歌翻译的开发者已做出了让步。从其自身看,谷歌翻译已开发出拥有人类智能的产品,但它并非真正的人类智能。一旦运行,它就像巨型版的罗塞塔石碑12 (Rosetta Stone),有着无法辨认的象形文字。
“难道我们研发了尝试模仿人类认知能力的超级电脑沃森,这就够了吗?”IBM的沃森计算机研发团队领导大卫·费鲁奇(Dave Ferrucci)提出质疑,稍作停顿,他强调道,“当然不够。我们不过创造出了一台能在《危险边缘》胜出的机器罢了。”
对费鲁奇来说,智能的定义很简单:就是一款程序能做到的。“深蓝”是智能的,因为它在国际象棋比赛中战胜了加里·卡斯帕罗夫;沃森计算机是智能的,因为它在节目危险边缘中战胜了肯·詹宁斯13 (Ken Jennings)。“这就是人工智能,对吗?或者说,非人类智能。为什么要期望利用人工智能科学创造出人类智能呢?”
费鲁奇并未忽视二者的差异。他乐于告诉大家,沃森运行时,需要一间屋子大小的处理器与20吨的空调设备,而人类只拥有鞋盒大小的大脑,吃一块金枪鱼三明治就可以运转好几个小时。同样,人类也会在比赛结束后,站起来、聊聊天、吃块百吉饼,与别人争论、跳舞,或思考——而此时,沃森就只剩下嗡嗡的运转声、热的发烫的处理器、不会说话、没有生命,只会回答类似“总统是谁、能量饮料有哪些”的问题。
“根本上讲,他们所表现出来的这些特征,最多只能看做人工智能的影子,甚至连影子也算不上。”费鲁奇说,“我们总是低估人类的大脑——上世纪50年代至今,我们一直在研究人工智能——人的大脑究竟是怎样运转的。
对此,侯世达期望能从费鲁奇、以及主流人工智能的学者那里得到答案:“既然我们低估了人类大脑,那为什么你不来研究下呢?
“在这个事上,我心情比较复杂”去年,我向费鲁奇提出这个问题时,他回答到,“作为个体,你能做的事情很有限,我想,当你全身心投入某事时,你一定会问自己一个问题:这么做是为了什么?曾经,我问过自己,答案是,我对人的大脑如何工作很感兴趣,对理解认知能力很着迷,我喜欢读这方面的著作、掌握相关知识”——他称侯世达的工作很有启发性——“但我究竟要用它们做什么呢?我真正想要的,是构建会做事的计算机系统。但我想这并不是通往认知理论的短路径。”
谷歌产品研发总监之一彼得·诺维格,与费鲁奇的观点基本一致。“我认为他在解决一个很棘手的问题”,他与我谈到侯世达的研究时说,“我想我处理个简单些的问题就够了。”
从他们的回答中,可以看到人工智能的失败遗留下的经验。早期研究多致力于基本问题的解决。尼尔斯·尼尔森(Nils Nilsson)在其学术史著作《人工智能的探索》(The Quest for Artificial)中写道,“我认为,对‘社会地位’的关注对一些人工智能研究者产生了荒谬的影响。”
斯图尔特·罗素,与诺维格合著了《人工智能:一种现代方法》,进一步表示,“人们在做很多事情的时候,并没有很宏大的目标,”他对我说,“在机器学习领域里,其中一项重大的突破,可以说发生在上世纪80年代中期,‘喏,这些是一部分真实的数据——我能通过程序准确预测剩下的部分么?’可现在你看到的是,人们把这当作机器学习的唯一任务。”
这很危险,所谓成也萧何败萧何。当机器可以更快速地处理更多数据时,我们允许自己变得愚蠢些。我们不再认真解决难题,而只是往数以亿计的数据中加入更多。这有点像用图形计算器14做你的高中微积分作业——除非你需要真正理解微积分,否则它没什么用。
实际情况似乎并非如此:谷歌翻译由处理1百亿个文档扩大到1万亿个文档,就能立刻达到人工翻译的水平。这个道理同样适用于搜索、图像识别、提问-回答,或是规划、阅读、写作、设计,或任何其他你希望用自己的智慧解决、而非机器来完成的难题。
而在人工智能商业化的过程中,包括诺维格在内,即使没有隐约担心,大家似乎也意识到了这个问题。诺维格说,“我们来画条曲线:随着我们获取的数据增多,我们的系统又能随之改进多少呢?果证明,虽然效果一直有改进——但相比过去,幅度明显变小。”
而对侯世达以前的研究生詹姆斯·马歇尔(James Marshall)来说,这个问题很简单:“最终,艰难的道路是唯一能一直指引你前进的道路。”
侯世达35岁时,才有了第一段长期恋爱关系。侯世达说:“他天生便有一条狭窄的’谐振曲线‘。”他借用了物理上的一个概念来描述自己非常挑剔。“有的女人对我的影响很大,她们的脸蛋对我的影响更大。我描述不出她们的样子······总之,很罕见。”1980年,在经历了他称之为“地狱般缺爱的15个春秋”之后”,他遇见了卡尔·布罗(Carol Brush)。(“她就是我谐振曲线的中点”15)没多久,他们便幸福地结婚了,还有了两个孩子,但在1993年,也就是婚后不久,他们到意大利度假时,卡尔因脑瘤突然去世。那时,他们的孩子丹尼5岁,莫妮卡2岁。”我觉得在卡尔去世后,他迷失了很久。”侯世达的老友潘提·卡内尔瓦(Pentti Kanerva)说。
侯世达已经30年都没有参加有关人工智能的会议了。“我和他们那些人没有交流。”侯世达说起人工智能的同仁们,“完全没有交流,一个也没有,我不想和那些固执、我无法说服的同行交谈。你知道,我称他们为同事,但其实我们都不算是同事——因为我们根本无法沟通。”
对侯世达的采访无形之中让我觉得很困难。他很和善,但是他不像健谈的人,或者深受喜爱的老师们那样,充分利用你所说的,以一个不可或缺的盟友的身份让你得以了解他们的思想,好像他们的回答最终只取决于你的贡献。我记得旁听侯世达和学生的圆桌讨论时,我几乎没有发现侯世达的思想有什么变化。他好像在寻求共识。在他把邮件发给众多记者后,讨论便开始了;他看起来对那个最热情的回复最关心。
“所以,我并不喜欢。”他告诉我说,“我不喜欢参加会议,不喜欢碰到那些很固执,会坚信我觉得并不正确的想法的人,也不喜欢见那些完全不了解我观点的人。我只喜欢和那些志趣相投的人交谈。”
从大约15岁开始,侯世达每隔十年便会读一遍《麦田里的守望者》(The Catcher in the Rye)。2011年的秋天,他为本科生开设了一门研讨课——“J.D.塞林格(J. D. Salinger)《麦田里的守望者》的伟大之处”。他觉得自己和霍尔顿·考尔菲德(Holden Caulfield)很相似。当我提到我高中同班的同学都不喜欢霍尔顿,因为他们觉得霍尔顿太爱抱怨时,侯世达解释说“也许他们并没有感受到霍尔顿的脆弱。”你想象一下,他独自一人站在山顶,看着下面的同学在足球比赛中嬉戏玩闹的场景,和霍尔顿在小说开始时一样。“我已经有了很多想法,”侯世达告诉我,“我不需要来自外界的鼓励。”
当然,避免冲突的愚蠢之处就在于你不参与其中。“在科学中几乎没有那种非对即错的观点,以至于人们说’天哪,为什么我没有这么想?‘”鲍勃·弗伦奇(Bob French)说,他曾是侯世达的学生,两人认识已经30年了。“从板块构造论到进化论的所有学说,都要有人去为之斗争,因为大家不赞同这些观点。如果你不参与其中,不参与学术界的混战,那么你的想法最终只能被那些也许并没有你的学说好,但有人为之争取的学说挤得靠边站。”
侯世达从来都不想去争斗,他的职业是一把双刃剑,如果有好处的话便是他不需要去争斗什么。35岁时,他获得了普利策奖,立刻引起了学校的重视,并授予了他终身教职。他不需要在期刊上发表文章;不必让自己的文章接受同行评审,也不必为评审结果而改稿。基础图书出版社(Basic Books)会出版他所有的稿子。
斯图尔特·罗素坦白地说,“学术界并不是那种你可以埋头钻研,一有想法,所有人就会为之欢呼雀跃的地方。可能50年之后,我们会说,‘我们确实应该多听听侯世达的’。但是现在,科学家们至少应该思考一下,怎样才能让人们了解你的想法。”
“生命短暂,艺术长远。”侯世达很喜欢说这句话,“我只是觉得生命很短暂。我工作,但我不想宣扬。我不想争什么。”
他曾给我做了一个类比。他说,爱因斯坦在1905年的时候提出了光量子假说,但是直到1923年,才有人接受这个学说。“一个人都没有,”他说,“在整整18年的时间里,只有爱因斯坦自己,相信光是以粒子的形式存在。”
“那一定很孤独。”
译者:王大丢
译文来源
原文地址
- 1.危机边缘》是美国CBS的一款益智问答节目 ↩
- 2.美国越战从1961年起至1973年结束,大约用了10年时间 ↩
- 3.Netflix是美国一家在线影片租赁提供商 ↩
- 4.此处为借代的手法,以“Google”代指“搜索引擎” ↩
- 5.CAPTCHA是一款区分用户是计算机和人的计算程序,这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试 ↩
- 6.我们登陆网站时需要输入的验证码 ↩
- 7.中微子个头小,不带电,可自由穿过地球,几乎不与任何物质发生作用,号称宇宙间的“隐身人” ↩
- 8.彼得潘是詹姆斯·巴里剧作中的人物,被心理学借用,指一个在社会上未成熟的成人 ↩
- 9.在人称代词指代对象性别不明的情况下,如果用He指代这个人,那么就犯了性别歧视的错误 ↩
- 10.现象学是由德国哲学家胡塞尔开创的哲学流派,主要观点是把对事物的已有知识放在括号之中,让事物的本来面目呈现出来 ↩
- 11.这种说法来自弗洛伊德的心理学。弗洛伊德认为,错误是人类潜意识活动的扭曲表现,通过分析错误可以看出人的真实感受 ↩
- 12.罗赛塔石碑是一块同时刻有古埃及象形文、阿拉伯草书,以及古希腊文三种文本的玄武岩石碑,是解密古埃及文的钥匙,此处为比喻手法 ↩
- 13.节目危险边缘的连胜纪录保持者 ↩
- 14.一种能够画图像、解联立方程组以及执行其他各种操作的手持计算器,大多数还能编写程序 ↩
- 15.物理中谐振曲线是对称曲线,中点对应的便是谐振曲线的最高点,侯世达的意思便是他遇到了最合适的人 ↩