ChatGPT和人工智能:从基本原理到教育应用
1
ChatGPT
人工智能
基本原理
教育
应用
第2 1卷第1期2 0 2 3年1月北京大学教育评论P e k i n g U n i v e r s i t y E d u c a t i o n R e v i e wV o l.2 1,N o.1J a n u a r y 2 0 2 3C h a t G P T和人工智能:从基本原理到教育应用克劳斯迈因策尔(慕尼黑工业大学,慕尼黑)摘 要 本文阐述了C h a t G P T等聊天机器人在教育培训中的性能和局限性。为了确保此类人工智能工具的适当使用,必须全面了解相应算法的基本原理和局限性。本文首先梳理了人工智能领域从E L I Z A、C S I E C到WA T S ON等聊天机器人系统的发展路线,然后介绍了C h a t G P T的功能原理:人类语言的统计概率模型、人工神经网络、基于大规模文本的深度学习算法、应用人类反馈的强化学习算法等。基于以上技术基础,本文讨论了C h a t G P T为代表的新一代人工智能技术对教育政策带来的挑战,包括学生就业招聘、法律和新闻等相关专业教学设计、学生论文写作、学生考试和其他评价方式等,并提出应对这些挑战的方案,以保证未来在教育和培训领域中人工智能技术能够得到合理、有效、公平的应用。关键词 C h a t G P T;教育;培训;人工智能中图分类号:G 4 0-0 5 7 文献标识码:A 文章编号:1 6 7 1-9 4 6 8(2 0 2 3)0 1-0 0 3 5-1 4D O I:1 0.1 2 0 8 8/p k u 1 6 7 1-9 4 6 8.2 0 2 3 0 1 0 0 3一、图灵测试和人工智能英国计算机先驱、逻辑学家和数学家艾伦图灵(A l a n T u r i n g)在1 9 5 0年提出了一个模拟测试(后被称为图灵测试),并以此作为对人工智能的定义。如果一个技术系统在响应和解决问题方面与人类专家无区别,这一技术系统就应该被称为具有“智能”。在图灵之后的几年里,技术研发最初的重点是在计算机上模拟逻辑思维。这背后是认识论的观点,即智力主要与人类思维中的逻辑推理能力有关。为此,人工智能是基于符号表示的逻辑规则和公式,并将其转化为适当的计算机程序。这时的人工智能被称为符号主义指导下的人工智能。符号主义指导的人工智能的一个应用场景是自动推理和证明,即人工智能程序通过逻辑计算模拟人类的逻辑思维(R o b i n s o n,1 9 6 5)。具有满足性的自动推理系统至今仍在工业物流中使用(B i e r e,e t a l.,2 0 0 9;K c h l i n,2 0 2 1)。作者简介:克劳斯迈因策尔(K l a u s M a i n z e r),男,德国慕尼黑工业大学卓越荣休教授,图宾根大学冯魏茨泽克中心客座教授,欧洲科学与艺术院院长。3 6 北京大学教育评论2 0 2 3年二、从图灵到魏茨鲍姆的E L I Z A1 9 5 6年,约翰麦卡锡(J o h n M c C a r t h y)、艾伦纽厄尔(A l l e n N e w e l l)、赫伯特西蒙(H e r b e r t S i m o n)等人工智能的奠基人在美国达特茅斯召开会议,受图灵提出的“机器能思考吗”这一问题的启发,他们第一次提出了“人工智能”的概念,以此来描述通过计算机模拟人类智能的研究领域。人工智能研究的第一阶段是约2 0世纪5 0 年代中期至 2 0世纪6 0 年代中期,研究者对其甚为乐观,积极推动其发展(G r t z,&S c h n e e b e r g e r,2 0 0 3),如尝试设计解决问题的通用程序,然而实际结果令人非常失望。约2 0世纪7 0年代中期至2 0世纪8 0年代中期,基于知识的专家系统脱颖而出,并实现了第一批实际应用。诸如工程师和医生等人类专家的特定范围的、可管理的专业知识在专家系统中被表示出来,并被用于解决日常问题(B o e r s c h,H e i n s o h n,&S o c h e r,2 0 0 7)。基于知识的专家系统的人工智能程序,能存储有关特定领域的知识,并自动从知识中得出结论,以找到具体的解决方案或提供情况诊断(P u p p e,1 9 8 8)。然而,与人类专家不同的是,专家系统的知识仅限于一个专门领域,缺少关于世界的常识性知识和结构性知识。为了建立一个专家系统,专家的知识必须被转化为规则,通过一种编程语言来实现,并用解决问题的策略进行处理。上述 方 法 也 适 用 于 通 过 计 算 机 实 现 自 然 语 言 处 理。魏 茨 鲍 姆(J.W e i z e n b a u m)的E L I Z A语言程序就是一个例子(W e i z e n b a u m,1 9 6 6)。E L I Z A设计本意是模拟一个精神病医生,以一个人类专家的身份与病人交谈。它涉及如何用“精神病医生”的特定句型对病人的某些句型做出反应的规则,也即在各种情况下识别或区分规则。在最简单的情况下,必须确定两个符号结构的相等性,这是由关于符号列表的L I S P编程语言中的E QUA L函数确定的。如果符号表达式中包含术语和变量,则存在一种扩展,例如:(x B C)(A B y)这两项相等,因为变量x对应于原子元素A,变量y对应于原子元素C。通过引入变量,模式匹配可以识别一个模式的结构。为此,L I S P中定义了一个单独的运算符MAT CH(匹配)。一个数据与一个结构对应的最简单情况是常数相等,例如列表A B和A B相等:(MAT CH(A B)(A B)=T其中的符号“”表示以下列表不应理解为函数指令,而是符号的枚举。不同的生成元导致类的形成,其作用类似于逻辑或数字中的变量。所以符号“?”可以用来匹配任何对象,例如:(MAT CH(?B)(A B)=T(MAT CH(?B)(A B)B)=T第1期C h a t G P T和人工智能:从基本原理到教育应用3 7 这种结构匹配任何以B为第二个元素的两个元素的列表。生成器“*”是匹配任何元素组成的序列(包括空序列),例如:(MAT CH(*B)(B)=T(MAT CH(*B)(A B C B)=T 上述的结构匹配以B为最后一个元素的所有列表。这就解释了理解算法结构的基本原理,该结构反映了E L I Z A中精神病医生的知识。病人P和E L I Z A之间的对话可以想象为这样:病人:ME N A R E A L L A L I K E(男人都是一个样子)E L I Z A:I N WHAT WAY(何出此言)病人:THE YR E A LWAY S B UG G I NG U S A B OUT S OME TH I NG O R OTHE R(他们总是为某些事情烦扰我们)E L I Z A:C AN YOU TH I NK O F A S P E C I F I C E X AMP L E(你能说出一个具体的例子吗)病人:WE L L;MY B OY F R I E N D MA D E ME C OME HE R E(是,我男朋友让我来的)E L I Z A:YOUR B OY F R I E N D MA D E YOU C OME HE R E(你男朋友让你来的)病人:Y E S;I AM V E R Y S A D(是的,我很伤心)E L I Z A:YOU A R E V E R Y S A D(你很伤心)病人:S A D AN D D E P R E S S E D(悲伤且沮丧)E L I Z A:P L E A S E GO ON(请继续)如果患者使用了某些句型,这些句型通过模式匹配被E L I Z A识别,则以下规则允许推导出E L I Z A的答案:(*AM*B)(A P P E N D(YOU A R E)B)(*A R E*)(I N WHAT WAY)(*A LWAY S*)(C AN YOU TH I NK O F A S P E C I F I C E X AMP L E)(*MY*B ME*C)(A P P E N D (YOUR)(A P P E N D B(C ON S YOU C)(*L)(P L E A S E GO ON)第二条规则是:如果病人的句子中含有A R E,用“WHAT WAY”来回答。在这个输入句子“ME N A R E A L L A L I K E”(男人都是相似的)中,运算符*代表的ME N出现在A R E之前,而A L L A L I K E都出现在A R E之后。第四条规则规定:如果在病人的记录中,单词MY和ME被列表*B3 8 北京大学教育评论2 0 2 3年隔开,并且记录以列表*C结尾,那么E L I Z A会做出反应,首先将YOU和C部分组合在一起(C ON S YOU C),然后将B部分应用,最后将(YOUR)应用。因此,在程序语言L I S P示例中,与E L I Z A的对话只是语法符号列表的派生。从语义上讲,结构的选择与口语的对话习惯相对应。最后一条规则是一种典型的尴尬反应,因为它也发生在实际的对话中:如果任何符号列表(*L)没有被专家识别(也就是谈话中的噪音等等),那么它就会装作一副聪明的嘴脸,说“请继续”。三、从 E L I Z A 到 WA T S ON自魏茨鲍姆的E L I Z A以来,已经有了基于模式识别的文本匹配方法。下一步,该软件将句子分解为单独的短语,并快速计算出将回答模式与问题匹配的概率,或者将一种语言与另外一种语言翻译匹配的概率。一个高效翻译系统的例子是V E R BMO B I L,它是1 9 9 32 0 0 0年由德国人工智能研究中心(D F K I)研发出来(W a h l s t e r,2 0 0 0)。对于人类来说,处理语言要通过多个步骤;而在技术系统中,人们试图模块化地一个个地实现这些步骤。在计算语言学领域(H a u s s e r,2 0 1 4),此过程被表述为一个管道模型:从声音信息(听觉)开始,下一步是生成文本形式。然后将相应的字母字符串记录为单词和句子。在词语形态分析中,要分析人称代词,要将文本中的单词简化为最基本的词根形式。在乔姆斯基语法体系的句法分析中,要强调一个句子的主语、谓语、宾语、形容词等语法要素。在语义分析中,句子意义由乔姆斯基语法的深层结构中表现出来(C h o m s k y,1 9 6 9)。最后,在对话和话语分析中,系统将检查问题和答案之间的关系,以及表达的意图和目的。2 1世纪 初,贾 积 有 设 计 并 开 发 了 一 款 英 语 聊 天 机 器 人 系 统C S I E C(C o m p u t e r S i m u l a t i o n i n E d u c a t i o n a l C o mm u n i c a t i o n),它基于文本知识和推理,可以随时随地与英语学习者进行英语聊天;它可以根据用户的输入、对话上下文、用户和自己的个性化知识、常识性知识和推理知识生成交流性响应。所有这些知识都以自然语言标注语言(N a t u r a l L a n g u a g e M a r k u p L a n g u a g e,简称N LML)的形式表达,这些 N LML 既可以通过解析文本自动获得,也可以在图形化编辑器的帮助下人工编写。因此,C S I E C系统提出了一种直接通过文本知识的句法和语义分析进行逻辑推理的朴素方法。这种方法比旧式的E L I Z A类关键字匹配机制更具有优势。对六个月以内免费使用该系统的用户聊天日志的分析证明了这一优势。一篇被广为引用的国际期刊论文介绍了C S I E C的系统架构、实现技术以及教育应用效果(J i a,2 0 0 9)。另一个语义问答系统是I BM的WAT S ON程序(F e r r u c i,L e v a s,B a g c h i,第1期C h a t G P T和人工智能:从基本原理到教育应用3 9 G o n d e k,M u e