34957+70764=?计算机竟然答错了:图灵设计的人机问答不靠谱?

新智元2021-05-08
拿人类易犯的错误来伪装就足以。

编者按:本文来自微信公众号“新智元”(ID:AI_era),作者:新智元,编辑:LQ,36氪经授权发布。

图灵怎么看「智能」呢?他或许认为「智能并不是一种可以编程进入机器的东西,而是一种通过社会互动构建起来的品质」。

1950年,数字时代的初期,图灵的《计算机器与智能》发表了。开篇,图灵就提出了那个著名的问题:「机器能思考吗?」

图灵没有试图定义什么是「机器」/「思考」,而是提出了一种不同的方法来回答这个问题,这种方法来源于维多利亚时代的一种娱乐方式——模仿游戏。

模仿游戏的规则是这样的,一男一女在不同的房间里,通过手写的笔记与裁判员交流。裁判员要分辨笔迹各属于谁,但是由于男人试图模仿女人的笔迹,这就加大了游戏的难度。

受到这个游戏的启发,图灵设计了一个思维实验,其中有两名参赛者,一个参赛者比较特殊,是一台计算机。

图灵认为,经过编程,如果这台计算机也可以玩模仿游戏,而且水平非常高,连裁判也不能判断他到底在和人交流还是计算机,那就有理由推断:这台计算机是智能的。

这就是「图灵测试」,一个至今仍然是人工智能领域最著名也最具争议的议题之一。

图灵测试的回答是明确的

图灵测试的持久吸引力在于对「机器能思考吗?」这一哲学上引人深思的问题,它给出了明确的答案。

只要通过测试,这个问题的答案就是肯定的。

就像哲学家Daniel Dennett所描述的:图灵测试就是哲学对话的终结者。

哲学家Daniel Dennett

「与其没完没了地争论思考的终极本质,为什么我们不直接承认不论这个本质是什么,只要通过了测试,那就具备了这一本质。」

但是仔细阅读图灵的文章,就会发现一个细节,这个细节在测试中引入了模糊性,这表明也许图灵的意思更多的是对机器智能的哲学挑衅,而不是一个实际的测试。

在「计算机器与智能」的一个章节中,图灵模拟了未来智能计算机的测试情况。(人问问题,计算机回答。)

问: 请给我写一首关于福斯桥的十四行诗。

答:这事别把我算在内,我从来不会写诗。

问: 34957加70764是多少?

答: (暂停30秒,然后给出答案)105621.

问: 你下国际象棋吗?

答:下。

问: 我的 K1上有 K,没有其他的了。你只有 K在 K 6,R在R1。该你走了。你怎么走?

答: (停顿15秒后) R-R8配对。

出错的肯定是人,机器不会出错

在上面的交流中,计算机实际上犯了一个数学错误。两数字的和应该是105721,而不是105621.

从这一点看,这些对话的设计不太可能是图灵,图灵可是一位杰出的数学家,却留下了这样的错误?

更有可能的是,它是一种为警觉的读者准备的复活节彩蛋。

在文章的其他地方,图灵似乎暗示了计算错误是一种编程技巧,只是想混淆裁判员的判断。

图灵写道,一台机器可以被编程为「故意引入错误,以计划好的方式来迷惑审问者」。

虽然在1950年,用错误来暗示人类「智能」的想法可能很难理解,但它已经成为在NLP领域工作的程序员的设计实践。

例如,在2014年6月,一个叫Eugene Goostman的聊天机器人被报道成为第一个通过图灵测试的计算机。但批评者很快指出,Eugene之所以能通过测试,是因为他内在的欺骗: Eugene模拟了一个13岁、英语为第二语言的男孩。

这意味着他在句法和语法上的错误和他不完整的知识被误认为是天真和不成熟,而不是自然语言处理能力不足。

同样,去年谷歌的语音助手系统 Duplex 以其类似人类的语气词 umms 和 ahhs 赢得了人群的喝彩。许多人指出,这不是系统真正思考的结果,而是模拟人类认知的手工编码的犹豫。

这两个例子都体现了图灵的想法,即计算机可以被编程为犯一些简单的错误,以便给人以「我是人」的印象。

和图灵一样,Eugene Goostman和Duplex的程序员也明白,拿人类易犯的错误来伪装就足以愚弄我们。

也许图灵测试并不评估机器是否智能,而是评估我们是否愿意接受机器是智能的。

正如图灵自己所说: 「智能本身是有情感的,而不是与数字相关的。我们在多大程度上认为某事物具有智能的表现方式,既取决于我们自身的心态和训练,也取决于所考虑对象的性质。」

图灵似乎认为,或许智能并不是一种可以编程进入机器的东西,而是一种通过社会互动构建起来的品质。

参考资料

https://spectrum.ieee.org/tech-talk/tech-history/dawn-of-electronics/untold-history-of-ai-why-alan-turing-wanted-ai-to-make-mistakes

+1
5

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业