根据笛卡尔的观点,没有机器能够用人类所用的恰当方式来推理和使用语言,因为这样的灵活度已经超过了物质"质料"的能力,无论它如何排列。人工智能界如今普遍认为,机器性能的局限性更多地与我们详细说明执行一个特定任务需要什么的有限能力有关,而非机制之类的事情。然而,有理由怀疑:不可能对一个被要求执行所有任务的程序给出一个形式说明。这不仅对上面所讨论的面孔和语音模型识别来说是对的,而且对于作为形成人类思维以及人类语言使用的重要基础的关于世界的全部意义和知识也同样成立。对于图灵来说,如果人类的判断能力无法区分用打字机打出来的答案是由一台机器还是人给出的,这就是一个关于机器是否能思维的充分测试。但是,正如心理学家罗伯特·格林(Robert Green,1981)所指出,人类可以执行(通过适当训练)更具有挑战性的任务,这无法用按照形成图灵机程序的规则所进行的符号操纵来详细说明。例如:
在一直用计算机探索的更有趣的任务中,将一种语言翻译成另一种是尤其相关的任务。在20世纪50年代那段激动人心的日子里,人们相信,只要有足够的时间、金钱和专心致志的专家的努力,所有与机器翻译有关的问题原则上都能够被解决。多年之后,非常明显,一些与语义内容相关的问题,可能最终被证明是难以解决的。正如洛克(Lock,1975)所指出的那样,人类翻译者与计算机以非常不同的方法处理工作。到目前为止,正如翻译人员所担心的:“普遍被接受的模型只是把语言A的单词和语法替换为语言B的单词和语法,这是完全错误的,没有翻译人员会这样做。他真正做的是用语言A来阅读或听文本,从而理解观念……然后用语言B表达出相同的意义。意义是交流的实质。语词和语法是一种任意的约定,它们随岁月演化,从而彼此各异”。
如果机器和人能各自有效地完成同一项任务,那么它们翻译语言的路径差异可能并不重要。不幸的是,众所周知自然语言是语境极其敏感的和充满歧义的,这使得从一种语言到另一种语言的准确翻译变得极其困难。就像格林(Green)指出的,这使得人们尝试各种方法来建构基于对所有语言共同的逻辑原则的“枢轴语言”(pivot language),在这种语言中,任何给定的实际语言的每个陈述都有一个单独、无歧义的含义,然后它可以被翻译成任何其他语言。例如,枢轴语言可能会有51个不同的概念以对应自然语言中"头"的51个含义。通过将表层形式转换成适用于转换语法的一些公共的“深层”结构或逻辑句法,自然语言使用表层语法把个别意义合并成复合含义的不同方式也可以正规化,结果使得在深层结构中每一个陈述都是准确的和唯一的。如果会引起歧义的表层结构能够被翻译成无歧义的深层结构,那就有可能将复合含义准确地从一种语言翻译到另一种语言。这个任务将会是艰巨的,但让我们假设,从理论上来说这是可以被实现的。如果是这样,人类翻译者的能力还是会优于那些机器。正如格林所指出:
鉴于自然语言的边缘非常模糊——也正是这点使得诗歌成为可能——因此.中枢语言不会容许这样的模糊性。为了获得语义的明晰表达,自然语言的省略的、暗喻的、引人回味的属性将不得不被舍弃掉。中枢语言将是枯燥的,缺乏自然语言的丰富性和风味。从中枢语言重新译回目标语言会引入所有与目标语言相关的模糊性,但是这种模糊性不会与源语言相关的模糊性相一致。通过利用模糊性,抓住细微的差别,试着匹配源语言与目标语言资料中的暗喻、令人回味等方面,人类翻译者能比这做得更好。这在一定程度上使得翻译艺术如此富有挑战性且值得人类翻译者留恋,这也是为什么机器翻译被认为更适合翻译技术资料而不是诗歌。
格林的结论是,翻译所需要的不只是交换单词的能力,更需要交换思想的能力。同样,其他一些任务或许也是由人来执行会相对轻松些。格林认为,任何中等智力的成人都能轻而易举地将它们分类成8对相似的意义对。
为什么这一任务对于机器来说可能是困难的?在这些意义对中,相似的思想是由完全不同的单词嵌于不同的表层形式(例如,比较(f)和(n))所组成的句子传递的,并且如果对物理世界和社会世界没有一个全局的理解,就无法理解它们的含义。这对于机器翻译来说是困难的,因为这远远不止是根据句法规则对单个单词语义的操作。格林还指出:
我们人类主体不会面临这样的问题。人们直抵句意,完全不关心逻辑语法或任何其他细节。在人与机器各自性能之间作比较的全部要点是,如果不是一种睿智的(sapient)、有感觉能力的(sentient)生命体将纯粹可量化的信息转换为内在的整体意义,就不可能从语言的形式中得到它真正的内容。
初看起来,这似乎概括了笛卡尔的论点:只有一种睿智的、有感觉能力的生命体,才能够以那种对人来说很自然的恰当的方法来使用语言。然而,与笛卡尔相异,格林的目的并非在人类与机器之间设置一道不可逾越的鸿沟。恰恰相反,他的目标是要更准确地定义这个鸿沟,从而跨越它。因此,一台机器以什么样的方式才能真正地学习人类语言艺术呢?
我们知道,一个普通人不断地受到来自多种渠道的各种信息的狂轰滥炸。撇开所有的技术困难,让我们假设,我们可以制造一台机器,使其能够处理……不同形式的信息输入——听觉、视觉、触觉、味觉等,再加上适当的用以影响环境的手段,当它抓起木块试图去咬的时候,使得它能执行一些类似婴儿能完成的实验。从本质上讲,我们所追求的是一种自我编程的计算机,它可以被家庭抚养长大并根据经验学习。如果这概念的跳跃似乎太大,那么可以使用沃肖(Washoe)和海伦·凯勒(Helen Keller)的理论来弥合,可以采纳其中一人的观点或两者兼用。
语言技能是自然发展的,而不是被强加的。不是把一本现成的字典和一组规则放到计算机中,它通过一个自我教学的渐进的过程获取词汇和相应的规则。这个自学成才者,采用直觉加侦探的策略,通过比较各种不同情境语境下的信息输入,形成分类,加以标签并且通常把杂乱无章的内容整理成一种形式和秩序,以使得能够作出预测和实施采取行动的有效目标。麦克纳马拉(McNamara,1973)简明扼要地写道,“……语言学习中的主要推力来自于孩子对理解和表达自身的需求”。或者,甚至更尖锐一点说,“……婴幼儿把意义作为语言的线索,而不是把语言当作意义的提示"。
格林认为,这样的一台机器应该能够轻而易举地通过图灵测试——并且,鉴于只有具备感知能力的生物才能在这种完全意义上理解意义,这样的一台机器同样应当是有意识的。
这些在25年之前提出的论断与当代研究仍具有相关性。例如,哲学家亚伦·斯洛曼开发了一个研究项目,来详细说明这个与人类心智和意识相关联的更复杂的功能架构如何随机器与世界的交互作用而发展的。并且在最近几年,这个项目和类似项目已经从那些将人类知觉和认知本身视为根本上是“具身的"并有赖于与世界的交互作用的理论中获得了新的动力。可是,即使在今天,人工系统中的自然语言仍然是一个问题。例如,麻省理工学院罗德尼·布鲁克斯(Rodney Brooks)和林恩·安德里亚·斯坦(Lynn Andrea Stein)在教导一个机器人婴儿“考戈”(Cog)学会感觉运动和认知技能上,已经付出了10多年的努力。尽管促成学习的条件已经预先编码进这个机器人中,但是它的“神经系统”是一种大型的并行体系结构,其目的就是从与世界的交互作用中进行学习。最初的学习包括对对象的识别、操作和避让等,而终极目标则更为雄心勃勃。哲学家丹尼尔·丹尼特(Daniel Dennett)(这个团队的一名成员)报告说:
我们希望教给考戈的一项才能是人类语言的基本能力。在这里,我们遇到了诺姆·乔姆斯基(Noam Chomsky)使之成名的虚构的先天语言器官或语言习得装置(LAD, Language Acquisition Device)。我们会尝试给考戈建造一个先天的LAD吗?不。我们将试着给考戈一种构建语言的困难方法,那种方法我们成千上万代祖先都用过。考戈有耳朵(四个,因为使用四个麦克风比拥有像我们这样的精细塑造的耳朵更容易获得良好的定位),以及正在开发的一些专用信号分析软件给考戈一个识别人类语音的很好机会,或许还会拥有区别不同人声音的能力。考戈也将有语音合成软件……为了使考戈能跟人类进行丰富且自然的互动,要尽可能让它装备精良。
据估计,基于这种基本设备,语言习得需要一个长期的学习过程,就像一个小孩长大成人也需要很长时间一样。研究小组还打算给考戈安装一个"动机结构",具有大致映射为人类各种欲望的内在编程好的目标和偏好。最终,希望考戈能够学会如何汇报它自己的内部状态。而且,丹尼特宣称如果这一切成功,我们将有足够的理由相信考戈具有与其他人类所拥有的一样的意识。
12年后(2007年10月),考戈项目网站上列出的成果很有启发性。考戈看起来能够做类人的眼球运动以及头和颈的定向行为;它能够将视线移到一个可视目标,模仿点头,摆动手臂以及打鼓;它也能够进行一些面部和眼睛探测。但当前研究项目清单中却完全没有提及语言学习。
声明:脑医汇旗下神外资讯、神介资讯、神内资讯、脑医咨询、Ai Brain 所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。
投稿邮箱:NAOYIHUI@163.com
未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。