技术前沿
环保双碳
人工智能
隐私计算
数据安全
区块链

思维与智能的概念引起人们对图灵测试的讨论

人工智能和人类智能是一回事么?

我们应该首先理解人类如何获得智能行为。人工智能系统今天能做的事情,就是必须模仿人类智能。

智能,作为生物体或系统的一种核心属性,涵盖了广泛而复杂的能力范畴。在广义上,智能体现为生物体或系统所展现出的理解环境、学习新知识、进行逻辑推理、做出判断决策、适应变化环境以及创造新解决方案的综合能力。这种能力不仅限于人类,众多生物乃至高级机器系统都在一定程度上展现出了类似的智能特征。

当我们提及智能的狭义定义时,它特指人类所独有的智能形式,包括了我们对外界信息的感知、记忆的存储与检索、思维的逻辑性与创造性、语言的沟通与表达、情感的体验与共鸣以及意志的坚持与选择等复杂心理活动。这些心理活动不仅构成了人类智能的基石,还推动了我们文明的发展和社会的进步。

将人类智能赋予机器的设想由来已久,这也是人工智能产生的逻辑起点。将人工智能与其作为模仿对象的人类智能的关系进行探讨,从物质载体、认知方式与反应形式三个方面对人类智能与人工智能进行区分,进而回答人工智能不具备人类智能的原因,得出人工智能奇点不会到来的结论。

人工智能拥有人类智能的前提是“人工”对“人类”的模仿与复制。

人工智能靠算法,其实根本问题也不是算法,是数据。垃圾数据产生不了智能。今天最先进的人工智能技术或者说算法都是统计学的应用,是对于数据的计算,对于模型的“学习”。因为“在理性的世界里,所有的判断都是统计学”。

人类智能不是靠算法,人类不通过算法去思考。

图片4.png

图灵测试(Turing Test),由英国数学家、密码专家和数字计算机的奠基人艾伦·麦席森·图灵(Alan Mathison Turing)于1950年提出,是一种检验某个对象是否具备智能的测试方法。这一测试不仅奠定了人工智能领域的重要基础,还引发了广泛的哲学和伦理讨论。

图灵测试的具体流程如下:测试者通过某种装置(如键盘)向被测试者(一个人和一台机器)提问,所有对话以纯文本形式进行,测试者和被测试者之间保持隔离,以确保测试结果的公正性。测试者根据被测试者的回答来判断哪一个是真人,哪一个是机器。如果机器能够在多次测试中让平均每个测试者做出超过30%的误判(即无法准确区分对话对象是人类还是机器),那么这台机器就被认为通过了图灵测试,具有人类智能。

图灵测试的实现主要依赖于自然语言处理(NLP)和机器学习等技术。NLP技术可以理解和解析人类语言,而机器学习则允许机器通过学习大量数据和模式来模拟人类行为。随着这些技术的不断进步,现代AI系统已经能够在某些特定领域展现出与人类相似的智能水平,甚至在某些测试中接近或超过图灵测试的标准。

图灵测试不仅是一个技术实验,更引发了许多哲学和伦理问题。例如,我们如何定义智能?机器能否具有真正的意识?如果机器可以通过测试,我们是否应该将其视为有意识的生命体?这些问题触及了人工智能的本质和边界,也促使我们重新审视人与机器之间的关系。

随着人工智能技术的快速发展,图灵测试已经成为评估AI系统智能水平的重要工具之一。许多研究机构和企业都在努力开发能够通过图灵测试的AI系统,以提高其智能水平和应用能力。例如,在医疗、教育、交通等领域,智能助手和机器人已经开始扮演重要角色,它们通过模拟人类智能来提供更加个性化和高效的服务。

图片5.png

但另一种意见也认为,图灵实验有先天的不足。

总体看,图灵测试的方法受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文61沃维克宣称一款名为“尤金61古特曼(Eugene Goostman)”的计算机软件通过了测试,但是测试结果充满争议,例如机器人只要能够通过30%的评判标准即可被判定通过图灵测试,另外这个计算机软件通过扮演一名年仅13岁,且第二外语为英语的男孩让参与测试的裁判大幅度降低了测试难度。

中国科学院自动化所研究员王飞跃在“关于人工智能九个问题”中也对图灵测试存在的问题进行了讨论,他的意见主要有以下两点:

人类的智能并不是一个单一的对象,而是有多个类别组成,同样人工智能对应也是多类别组成。图灵测试究竟测试的哪些类别并不明确,从实践上看,目前图灵测试仅仅局限在语言智能等特定小领域里,不具备代表性。

图灵测试并不是考官对一台计算机测试后就可以宣布其是否拥有智能,图灵测试的本意是指一个广义的人类作为为整体的考官,其测试的时间段也不是具体的一段时间而是广义的时间段,即所有的人类在所有时间都分辨不出人与机器之后,才算其人类智能与人工智能等价。

从上述讨论可以看出,图灵实验只对人工智能系统是否具有人类智能回答“是”或“否”,并不对人工智能系统的发展水平进行定量分析,而且测试的智能或智力种类还过于单一;在测试方法上存在漏洞,容易被测试者找到漏洞从而产生作弊行为。

因此,持此类观点的人认为:总的来说,图灵实验目前还无法承担定量分析智能系统智力发展水平的需求。

最后,给你两个关于“人工智能”的不同的定义,你认为哪个更贴切或者说更适合呢? 

1.人工智能是一种通过计算机程序来实现人类智能的技术。它包括许多不同的领域,如机器学习、深度学习、自然语言处理等。

2.人工智能是一个以数据为基础,按照规则及通过算法建立模型(机器学习)并进而驱动决策的“计算机自动化”技术。