温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
ChatGPT
本质
分析
及其
教育
影响
李志民
中国教育信息化 编辑部:中国教育信息化2023年第3期一、引言最近,ChatGPT(全 称为 Chat GenerativePre-trained Transformer,也即聊天预训练生成模型)火爆于网络。一时间,很多人都在谈论它,并尝试与之对话。ChatGPT 由美国 OpenAI公司开发训练,它能够用几种不同的语言回答问题或根据使用者的请求提供信息,还能够进行简单对话、讨论任何问题,并提供人性化的文本。事实上,ChatGPT 只是自然人单方提问,不是真正的自然人双方对话,可以说不是真正的聊天。它不是一个真正的人,只是一个电脑程序。其知识水平仅限于“训练语料库”,没有能力跟踪当前事件或获取新信息。近 20 年来,人工智能研究不断取得新成果。ChatGPT 的出现,不同于以往的人工智能突破,仅仅具有展示或表演的价值,或者新突ChatGPT 本质分析及其对教育的影响李志民摘要:ChatGPT作为人工智能技术驱动的信息获取新工具,功能远远超过以往的任何检索搜索工具。它的出现是人工智能发展过程中的标志性成果,也为人工智能教育研究提供了新的视角。通过观察研究、文献研究等方法,提出互联网是信息技术前所未有的变革,是人类在改造自然中的一次新的飞跃,必将推动人类文明迈上新台阶;ChatGPT是在互联网承载基础上的人工智能开发,无论是大数据收集训练,还是大算力运行,都离不开互联网;ChatGPT会对包括咨询在内的一些行业产生影响,但目前不会取代任何职业。基于以上分析提出:ChatGPT对教育的影响主要在高等教育阶段,可以提高学习和研究效率,也可能影响教育评估和评价,还会推动教育向提高学术创造力和思辨性思维发展;不管技术如何发展,知识依然是个人幸福和社会发展的基石,也是现代社会的核心资源;促进社会进步的关键是扩大教育机会,使更多人接受高等教育,进而推进教育高质量发展。关键词:ChatGPT;人工智能;互联网;教育数字化;教育评估;教育评价中图分类号:G434文献标志码:A文章编号:1673-8454(2023)03-0012-07DOI:10.3969/j.issn.1673-8454.2023.03.002作者简介:李志民,清华大学网络科学与网络空间研究院兼职教授,中国教育发展战略学会副会长兼人才发展专业委员会理事长,中国科技评估与成果管理研究会副会长兼学术委员会主任(北京100084)2023年 第3期(第 29 卷 总第 522 期)中国教育信息化C hi nese JournalofIC T i n Educati onV ol.29,N o.3M ar.202312中国教育信息化 编辑部:破技术仅仅掌握在少数公司或个人手里,冲击的也是少数人和个别产业。ChatGPT 是人人可用、行行有用的信息助理。尽管 ChatGPT 现在还会出现错误或不准确的情况,但随着其迭代升级,功能将会逐渐强大,成为人人可以随时调取的基础信息工具,也必然会对各行各业带来巨大冲击。有研究人员称,ChatGPT 的问世,可以类比为台式计算机或互联网的发明,对人类的影响之大难以估量。本文通过观察研究、文献研究等方法,对 ChatGPT 的本质及其对教育的影响进行分析,以期为未来相关研究提供参考。二、ChatGPT 本质分析(一)ChatGPT是人工智能发展过程中的标志性成果ChatGPT 之所以火热,是因为其能够回答人类所提出的问题,并给出接近人类表达的正确答案。而最主要的是,ChatGPT 能够成为普通人使用的工具,尽管它依然不完美。以往的人工智能标志性成果,如 AlphaGo、自动驾驶软件等,皆通过演示和表演实现功能,而ChatGPT 是以连接主义的神经网络研究应用为主线,推动深度学习发展从量变到质变,“人人能用”是其火爆的根本原因。人工智能概念提出较早(1956 年),进展起起伏伏。进入 21 世纪后,互联网发展给人工智能研究提供了强有力的工具,新成果不断出现,如语音识别、图像识别、AlphaGo、ChatG-PT,每隔 56 年就会有新的产品出现。但目前仍处于弱人工智能阶段,本质上是人类自身无法真正认识自然人的智能是如何产生的。从科研层面来看,人工智能研究分为基础层、技术层和应用层。在人工智能的基础层研究中,根据对自然人产生智能的路径猜想,研究路径分为符号主义、连接主义和行为主义。1.符号主义符号主义曾经很辉煌,但不能从根本上解决智能问题。它是从人类认知顺序:人类抽象出的符号,源头是身体对物理世界的感知,人类能够通过符号认知解析进行交流,是因为人类拥有类似的身体。计算机只处理符号,不可能有类人感知和类人智能。人类可意会而不能言传的“潜智能”,不必或不能形式化为符号时,更是计算机不能触及的。要实现类人乃至超人智能,就不能仅仅依靠计算机。2.连接主义连接主义采取自底向上的路线,强调智能活动是由大量简单单元通过复杂连接后并行运行的结果。它的基本思想是:既然生物智能是由神经网络产生的,那就通过人工方式构造神经网络,再训练人工神经网络产生智能。困难在于,不知道什么样的神经网络能够产生预期智能,因此大量探索归于失败。20 世纪 80 年代神经网络曾经兴盛一时,掀起本轮人工智能浪潮的深度神经网络只有少数成功个案。3.行为主义行为主义是第三条路径。生物智能是自然进化的产物,生物通过与环境以及其他生物之间的相互作用发展出越来越强的智能,研究人员认为人工智能也可以沿这个途径发展。这个学派在 20 世纪 80 年代末 90 年代初兴起,近年来颇受瞩目的波士顿动力公司的机器狗、机器人就是这个学派的代表作。1总体来说,ChatGPT 属于连接主义,经过多次迭代进行完善,是深度神经网络的成功个案。它能回答问题,提供简化和改进学术写作过程的可能性;可以帮助用户构建和形成想法,建议可能的更改,并提供在项目上合作的可能性,等等。ChatGPT本质分析及其对教育的影响13中国教育信息化 编辑部:中国教育信息化2023年第3期(二)ChatGPT难以比肩人类历史上的四次信息技术革命ChatGPT 注册用户量短时间内超过以往的任何新技术平台,加之服务功能多,有人把它说成是新的信息革命。事实上,ChatGPT 难以比肩人类历史上的四次信息技术革命。物质、能量和信息是构成人类生存的三大基本要素。信息交流自人类社会形成以来就存在,并随着科学技术的进步而不断变革。信息技术的出现和进一步发展使人类生产和生活发生巨大变化,引起经济和社会变革。从古到今,人类共经历了四次信息技术革命,每一次信息技术革命都推动人类文明迈上新的台阶。1.语言的使用发展到文字的创造语言的产生是历史上最伟大的信息革命,其成为人类社会化信息活动的首要条件。文字的创造在人类文明史上非常重要,它将人们的思维、语言、经验以及社会现象记录下来,使文化得以传播交流、世代传承。人类自此有了文字记录的历史,第一次信息技术革命是文字的创造。2.造纸和印刷术的发明第二次信息技术的革命是造纸和印刷技术的发明。造纸术的发明和推广,对于世界科学、文化的传播和发展产生重大而深刻的影响,对于社会的进步和发展起着重大的作用。印刷术为知识广泛传播、文化与文明交流创造了条件,是人类近代文明的先导。3.电报、电话、广播、电视的发明和普及第三次信息技术革命是在电磁学理论基础上,以电信传播技术发明为特征。我们今天能够方便地使用电报、电话与远方的亲友联系,都靠它来服务。广播和电视的发明把纸质媒体的发行问题,变成了收听和收视率问题,也逐步形成了这个时代媒体信息传播“中央复杂、末端简单”的基本规律。24.互联网的发明和普及应用第四次信息技术革命是在计算机发明的基础上,实现计算机局部联网,再发展到互联网的普及应用。人类信息交换不仅不受时间和空间限制,彻底颠覆“中央复杂、末端简单”的信息传播规律传统,逐步实现人类知情权的平等,还可利用互联网收集、加工、存储、处理、控制信息。计算机的发明是人类智力的延伸,互联网的发明是人类智慧的延伸。互联网是信息技术前所未有的变革,是人类改造自然的一次新飞跃,必将推动人类文明迈上新台阶。ChatGPT 是在互联网承载基础上的人工智能开发,无论是大数据收集训练,还是大算力运行,都离不开互联网。可以说,没有互联网就没有 ChatGPT。(三)ChatGPT是近年来人工智能技术积累的结晶1950 年,有计算机之父之称的艾伦 图灵(Alan Turing)发表了论文 计算机器与智能 。该文建议考虑“机器能思考吗”这样的问题,并第一次提出“机器思维”的概念,后来被称为图灵测试。艾伦 图灵认为,如果一台机器能够与人类展开对话,而不被辨别出其机器身份,那么可以说这台机器具有智能。3到目前为止,还没有任何人工智能机器能够通过图灵测试,而最接近通过图灵测试的就是 ChatGPT。ChatGPT 是生成式预训练聊天转换器。生成式人工智能允许用户在对话框输入书面提示,并接收由机器生成的类似人类的新文本或图像和视频。类似的模型有 Dall-E,它是一个接收文本产出文本或图像的程序,因能够生成与人类文字描述相匹配的逼真、有时是荒谬的图片而获得关注。ChatGPT 的内核是大语言算法模型,从2018 年发布第一代开始,一路升级。OpenAI14中国教育信息化 编辑部:并没有对算法模型进行很大改动,只通过反复微调训练机制,以及越来越多专家人力和算力的投入来进行优化。GPT-1 训练涉及的参数量为一个多亿,GPT-2 达到了百亿,GPT-3 变成了 1750 亿,扩容了近 1500 倍。到了 GPT-3.5,也就是 ChatGPT,OpenAI 引入了人类反馈强化学习(RLHF)机制。该机制通过 40 位专家的参与,对 GPT-3.5 针对不同问题给出的三个答案进行打分,并建立奖惩模型,使其符合人类的期望,进而塑造模型的“人格”,最终让机器知道怎样的回答更具有人性化。对应的训练数据量,从 5GB 扩到了 45TB,实现了近万倍的增长。ChatGPT 的成功是量的积累,包括了多项技术、机器的算力、服务器的数量以及知识库。4对于 ChatGPT 而言,其生成式模型基于文本,可以对用户的要求产生类似人类的反应从仿写威廉 莎士比亚(William Shakespeare)风格的诗歌,到提出孩子生日聚会的建议。ChatGPT之所以令人印象深刻,是因为它有能力产生类似人类的反应,这在很大程度上得益于它所训练的大量数据。ChatGPT 背后团队 Open AI 受到一些实力强劲的投资者支持,包括科技巨头微软。因此,ChatGPT 拥有其他类似语言模型不可比拟的巨量语料库资源,来支持它进行预训练。ChatGPT 的另一个与众不同之处在于,它能够记录用户在一个线程中早期信息的上下文,并在以后的对话中使用它来形成回应。5尽管如此,ChatGPT 仍然只是一种语言生成模型,它只是对单词、语句的常见组合和搭配进行模仿,并不能理解文字的内在原因和逻辑。而有时,ChatGPT 会(像许多人类一样)通过谎称引用(不存在的)科学研究来讲令人信服的废话,或者围绕一个话题反复解释,却不能给出真正的观点。6从技术本身来讲,ChatGPT 并没有颠覆性的创新。此前,有国内团队也研发出类似的产品。例如,清华大学自然语言处理与社会人文计算实验室研发的人工智能诗歌写作系统“九歌”,采用深度学习技术,结合多个为诗歌生成专门设计的模型,基于超过 80 万首人类诗人创作的诗歌进行训练学习。该系统使用很简单,通过选择体裁、输入关键词、选择情感基调,就能一键生成诗词。7ChatGPT 和其他产品的表现差异并非来源于技术实力,归根结底还是训练量以及训练素材的数量差别,与之关联的是计算能力的差别。英文语料库范围是全球性的。中国接入互联网的时间较短,网民绝对数量也远远少于欧美国家,网上积累的语料库素材有限,因此国内使用中文训练的人工智能模型表现稍逊一筹。事实上,在 ChatGPT 刚兴起时,互联网上还流传着其各种啼笑皆非的回答,也曾经被一些公司限制使用,如今在广大网友的自发训练下已经有很大的改进。三、ChatGPT 对教育的影响