温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
人工智能
正在
感知
走向
认知
人工智能正在从感知走向认知
李生 苏功臣
算法、数据、算力三方面相关技术不断进展,最终促成了最近一次人工智能大开展。人工智能的四个方面,计算、感知、认知、决策,“我中有你、你中有我〞,连续向前。从宏观上看,现在人工智能正在从感知走向认知,通过深度学习的算法,感知智能已经有了很大突破,但是对于认知智能,它还刚刚开始或者说还在路上。
人工智能从1956年达特茅斯会议之后经历了三起两落。2022年AlphaGo人机大战轰动世界,迎来了人工智能第三次高潮。这一轮高潮的兴起得益于基于多层人工神经网络的深度学习算法,使得在感知智能上取得突破,并在产业界的多种场景下广泛应用。但是,当前的人工智能还称不上真正的人工智能。未来必须加强根底理论研究,以求在认知智能方面取得技术突破,开辟一条人工智能开展新路径。
一、人工智能的“三叉戟〞
这轮人工智能高潮的到来,主要依赖三个方面的进步:算法、数据、算力。在这三个方面中,算法是工具,数据是原材料,以及把原材料送到算法工具里面加工所需的动力能源——算力。
目前作为工具的算法,采用了基于多层人工神经网络的深度学习。这种深度学习结构受人的大脑工作机理和结构的启发,方法上是对数据进行概率统计分析。
大数据的出现使得深度学习算法的准确率大幅提升。大数据是由于计算机特别是互联网的兴起之后,包括各种企业事业各种数据、社会科学人际交往的信息,被记录保存起来,用于社会计算。但是,用于人工智能对大数据也有较高要求。首先数据是经过标注的大数据,比方有一张图片标注这是个猫,另外图片标注是个狗,等等。其次数据标注的质量要高,质量不高、标注不准确,就容易造成最后结论偏差。再次是标准的数据分布的面要广泛、合理。比方一个动物标注的颜色过多了,但是对其它方面比方眼睛、耳朵什么的标注少了,就容易产生偏差。最后要求标注的数据量要大,经常是几千万上亿的数据量。
数据在算法加工过程当中需要强大的计算能力和存储空间,也就是需要强大的算力。早先计算机主要的功能是计算和存储,CPU芯片主要为计算效劳。现在进入人工智能阶段之后,它涉及的计算量大,而且主要是矩阵运算,而CPU在线性的加减乘除运算表现出色,但微分积分、矩阵运算就相比照拟困难了。所以现在是借用了游戏当中的处理矩阵运算的GPU器件进行运算。另外,云计算的出现,也提高了计算能力。它实际上是一种虚拟计算,是把多台计算机联网之后,分配任务,进行分布式运算,完成之后汇总再由一台计算机呈现结果。
二、人工智能四阶段
算法、数据、算力三方面相关技术不断进展,最终促成了最近一次人工智能大开展。往前回溯,人工智能的起源在于人的智能。那么,什么是人的智能?
我们知道,人类是人、机、物三元世界的核心。人类的生活、生存要依赖物(物质、环境等),欲提高生活生存的质量需要机(工具、蒸汽机、电动机、计算机、互联网、人工智能等)的辅助。从历史上看,工业社会减轻了人的体力劳动;未来高度智能化的社会必将减轻和拓展人的脑力劳动。人类所具有的智能,来源于知识,而知识在于学习。智能那么是学习和求解问题的能力。这是推动人类进步和社会开展的强大动力,也是人具有的区别于其他动物的能力。
简单说,人工智能就是模仿或者模拟人类智能的能力,是用计算机来模仿人类学习和求解问题的能力。“看〞和“听〞对人类认识世界具有决定性作用,但是看到的和听到的并不一定都是真实的——这里存在知觉偏差的问题。所以我们强调要透过现象看本质,也就是说存在着“感知—现象〞“认知—本质〞两对相应的概念。认知的核心是反响,是一个“抽象迭代——思维推理〞的过程,所以才有“学而不思那么罔〞“不是收到篮子里的都是菜〞的说法。
因此,人工智能仿照人的智能从根本上来说有两项大任务,一项为哪一项模式识别,采用统计方法得到感知,从经验当中学习;一项为哪一项语义理解,用逻辑推理或知识推理的方法以求解决“认知〞的问题。
具体说来,人工智能包含四个方面,计算、感知、认知、决策。计算机于1946年问世,当时的主要功能是数值计算,当然也就具备计算智能。到1956年,在达特茅斯会议上提出让计算机来模拟人的智能,才正式出现了“人工智能〞的概念。人凭借着五官感觉外部事物,感觉、感知周围环境,那么机器就通过传感器来模仿人的感觉器官,来感知世界和外部环境,所产生的信息经过机器的中枢进行加工,实际上是对感知阶段感知到世界和外部的信息进行深层次的加工和处理,这就是机器智能的认知阶段,然后再产生决策。这其中最重要的是感知和认知。
人工智能这几个方面有什么区别和联系?计算智能的实现,首先需要问题的数据化,才能有计算智能可以处理的“原材料〞。另外,问题的解决还需要一定的方法、策略和步骤,这个步骤就是程序,即用计算机语言编程。这些程序告诉机器,解决和处理问题的过程,先做哪个,后做哪个。但是在计算智能阶段,这个程序需要人工编写,涉及到的工作量很大。开展到感知智能之后,解决了由人来编程工作量大的问题,程序的编制由机器自己自动完成了。程序自动化从开展来看也是经历了从机器学习到深度学习的阶段。数据特征在机器学习阶段是靠人工提取的,而开展到现在用深度学习的方法,数据特征实现了由机器自动提取。
需要强调的是,人工智能开展的这四个阶段并不是截然分开的,而是既有阶段性又有连续性。在开展感知智能的过程中,就在为认知智能做相应的工作。当初冯·诺伊曼和图灵同时创造了计算机的体系结构,计算机问世,主要解决的是计算智能的问题。但是图灵在那个时代,已经为人工智能做起了储藏,已经提出著名的“图灵测试〞问题,预测了下一个阶段的实践,推动了第二个阶段的开展。感知智能、认知智能有阶段性,但是阶段也是“我中有你、你中有我〞,之间存在着连续性。
三、深度學习的崛起
深度学习是机器学习的一种。机器学习是先用数据训练(学习)模型,获得规律(知识),再用训练好的模型去预测未知数据。运用数据训练好了的算法,叫模型,无须人工预先编程。在学习的过程中,算法、数据、算力三个要素,核心是算法。
现在感知智能阶段采用了深度学习的算法。这种算法的设想在上个世纪五六十年代就已经有了,但设想还不完善,另外还没有数据的支撑和算力的支持。直到2022年,Hinton,这位被誉为深度学习之父的大师,提出了反向传播(BP)算法,解决了训练误差的问题,深度学习才开始崭露头角。2022年,在BP算法根底上开展起来的CNN算法,在世界图像识别大赛上,与世界各地的学者推出的各色算法、模型一较上下,成绩突出,其准确率高出第二名10%左右,准确率到达85%,一举拔得头筹。这种新算法于是被世界各国的学者青睐。时隔四年,2022年,计算机AlphaGo和韩国围棋大师人机大战,取得了4胜1负的成绩,引起人们广泛关注和高度重视,直接助推第三次人工智能高潮的到来。
深度学习的多层人工神经网络是由一个输入层一个输出层及假设干个隐含层所组成,每层中的人工神经元与相邻层中的神经元相连接。隐含层一步一步对数据进行逐层深加工。脑科学研究说明,人类大脑大约由850亿个神经元组成,每个神经元约有1000个突触与其相连。当神经元受到刺激而兴奋时,就会向与其相连接的神经元传递脉冲,从而改变这些神经元中的电位,超过某一“阈值〞的话,该神经元就会被“激活〞,即也随之“兴奋〞,兴奋起来的神经元又会向与其连接的神经元传递神经脉冲。大脑皮层的神经元通过突触相连,分层分区形成神经网络。深度学习的结构是受脑启发的多层人工神经网络,信息处理过程是分层的,具有非线性处理、自动提取特征的特点,高层特征是底层特征的组合,从底层到高层特征的表示越来越抽象,越来越能表现语义或意图。
深度学习算法尤其是与大数据结合之后,把其他人工智能技术远远抛在了后面,成为引领人工智能开展的核心技术。
深度学习在感知上已经有重大突破,特别在识别上,现在刷脸随处可见,语音识别在同声传译上取得很大成就,在自然语言处理(NLP)也取得了进步。在NLP上,用深度学习的方法,把一个句子或者一个短语、词组投影到一个向量空间当中的词(句子)嵌入法来识别。2022年谷歌公司推出一款软件BERT,其思路就是把算法编制过程所涉及到的通用局部,单独拿出来,预先做好,做成一个网上开放的公用平台。其他开发者下载这个通用平台,通过预留的接口再和自己专用的局部進行微调,完成自己开发任务。这种“预训练+微调〞范式就是利用了深度学习的方法而取得的重大突破。
四、当前深度学习的局限性
随着研究和应用的不断深入,人们也发现目前感知智能采用的深度学习算法有其局限性。人具有意识,有情感,能够进行思维,能够推理。与之相比,目前人工智能没有意识,没有情感,不会思维,不会推理。人类的学习在于,能从仅有的少数几个例子中,快速掌握新的知识(小样本学习),并利用先前已有的知识进行归纳推理(归纳与演绎方法结合),提高对问题的理解和认知能力。这种推理和知识也是滚雪球的,有个积累的过程。机器就没有这种功能,所以深度学习有其局限性。
局限性主要表达在四个方面。一个是“贪婪〞,也即要求标注的数据越多越好,但标注本钱太大也太难。第二个是“脆弱〞,就是抗干扰能力低,容易被虚假数据欺骗,比方一个面包烤箱,如果前面给放上一块香蕉皮,这个烤箱就不能准确识别出来,可能识别是一个面包机。所以从这点说,深度学习的方法是从众的,运用概率统计的方法,讲的是少数服从大多数,但是真理往往掌握在少数人手里,少的也可能是正确的。所以这种算法的“脆弱〞有的时候导致一百个谬误就可能变成真理。第三个局限性是它不透明,暗箱操作,出错了,但不知错在哪儿,没法回溯去找。第四个就是它不具备思考和知识推理能力,所以“浅薄〞,只知道“什么〞,不知道“为什么〞,知其然不知其所以然。这就是目前人工智能主流的深度学习算法有其缺乏、有局限性的地方。
针对这些存在的局限,今后人工智能开展的方向是从感知走向认知,从识别走向理解。
五、从计算机视觉(CV)到自然语言处理(NLP)
人类对世界的认识可分成感性认识和理性认识两种。感性认识只能看到事物的表象,理性认识才能觉察到事物的本质。感性认识是认识的根底,是认识的初级阶段,理性认识是认识的高级阶段。只有理性认识才能透过现象看到本质,更深刻、更全面、更可靠地反映事物的本来面目,引导人们按规律办事,有效改造世界。
人工智能是对人类智能的模拟,感知智能对应着感性认识(识别),认知智能那么对应着理性认识(理解)。
计算机的感知智能,目前通过深度学习方法,具备了图像识别、物体识别或语音识别的能力,能“看〞出有这么个形状、这个样子,从边框到形状,能将人说的话识别成文本,完成这些任务机器都可以靠从数据(经验)中学习,搜索(比对),获取知识(还是处于感知阶段)不需要真正的理解(认知)。由于目前的人工智能还不具备真正的理解能力,对识别出的结果到底是什么,可以发挥什么作用不清楚。由感知到认知,需要解决的重点和难点在于语义的理解,或者叫做意图的理解,这主要涉及到自然语言处理。
人的语言具有歧义性(一词多义)和多样性(一义多词),比方说一个“打〞字就可以表达多个意思,打酱油、打乒乓球、打架、打黑等;一个词组也存在多意性的问题,比方“打伞〞既可以是翻开雨伞,也可以是打击黑恶势力的保护伞;同一句话也有不同的意思,比方说“中国这个球队谁也打不过〞,既可以理解是世界无敌,谁也赢不了这支球队,也有可能是自身很弱,遇谁输谁。同时,语义理解高度依赖知识,除上下文之外,还有语言知识(语法结构)、专业知识、背景知识、常识性知识和先验知识等。此外,语言存在着高度的开放性(新词不断涌现)和高度的灵活性(随意组合)。因此,Hinton说:“深度学习下一个大的进展应该是让神经网络真正理解文档的内容〞。比尔·盖茨说:“语言理解是人工智能领域皇冠上的明珠〞。
现在人工智能正在从感知走向认知,通过深度学习的算法,感知智能已经有了很大突破,但是对于认知智能,它还刚刚开始或者说还在路上。
六、人工智能的未来
人工智能进一步的开展必须逾越人类大脑思维能力鸿沟,解决不了推理问题,机器就难以实现真正的认知。不具有完全推