分享
ChatGPT与出版业变革...景、风险挑战及应对措施探析_程可伊.pdf
下载文档

ID:2564386

大小:1.09MB

页数:4页

格式:PDF

时间:2023-07-12

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
ChatGPT 出版业 变革 风险 挑战 应对 措施 探析 程可伊
圆桌论坛 与出版业变革:应用场景、风险挑战及应对措施探析程可伊(南京大学 信息管理学院,江苏 南京)摘 要:作为新一代对话式自然语言识别模型,一经面世引发各界广泛关注,在许多领域纷纷表现出落地潜能和应用前景。在出版业的众多应用场景中,智能编校、语义出版、智能检索以及互动出版或将成为 及其关键技术未来的主要应用场景。这轮变革将给出版业带来编辑职能、内容版权、内容安全三个方面的风险与挑战,同时也将促进出版业的从业者反思、政策完善、多维监管和评价量化,进一步推动人工智能在出版业的实践和探索。关键词:;出版业;应用场景;风险与对策中图分类号:文献标识码:文章编号:()及其关键技术的出现建立在 在自然语言处理(,)领域对语言模型的创造性探索。基于 底座进行开发训练,使用 亿规模的模型参数的巨大语料库,表现出小规模语料库所不具备的能力,如上下文学习机制、语言理解与生成等自然语言处理能力。在采用来自人类反馈的强化学习(,)进行训练的同时,使用人工标识及高质量的人机对话数据对模型进行奖励训练,使 生成的回复内容符合人类伦理和价值偏好。这样的变化使 摆脱了传统人工智能命令驱动的机械性,对对话内容所含的人类意图具有识别和预测力。作为人工智能内容生成(,)技术发展的最新成果,从内容维度给出版业的内容生产和传播带来变革。与 共生是人类社会在智能变革中必须直面的现实,探究 在出版业中可能的应用场景、风险挑战以及应对措施具有积极的现实意义。一、在出版业的应用场景当 及其关键技术与行业业务相关联,就会构建出新的应用场景,在出版业有智能编校、语义出版、智能检索、互动出版等。(一)智能编校出版业的编校工作由编辑加工和编辑校对两部分组成,是在不改变内容原义的基础上进行的推敲、修改、整理和润色工作。传统编校中常见的错误主要有:基础性错误,如错字、漏字等;知识性错误,如地名、人名的错误;表述性错误,如词序颠倒带来的表述歧义。编校过程中往往需要耗费大量成本,即使有一些纠错辅助工具,也受限于事前约定的固定配词或语法,无法更智能地联系上下文作出相对精准的分析和判断。可以依托自身强大的自然语言处理能力和生成能力,实现文档的快速遍历、找寻和标注,自动实现对绝大多数内容的规范性纠正。在医学健康等专业性较强、对编校要求较高的领域,可以快速纠正和提供相对准确的信息,并将其生产为通俗易懂的内容。在稿件润色方面,编辑也可以借助它对部分文段直接进行写作并以此为参考,从而提升自身的写作润色效率。经过训练后,还可以对稿件的标题、正文、页码等信息进行抓取,实现各类文作者简介:程可伊(),女,汉族,江苏南京人。主要研究方向:编辑出版。圆桌论坛 稿的初步校排,编辑后续做适当检查与微调即可。由此可见,将 引入编校工作,可以大幅提升编辑的工作效率。(二)语义出版自肖顿()首次提出语义出版的概念后,语义出版作为数字出版的高级形态,体现出技术在出版业中的融合应用。作为一种技术手段的集合,将任何可以增强出版物语义内涵的技术手段整合在一起,其主要目的是加速语义出版物的自动化流程,从而提高发布效率。当前绝大多数的语义出版表现为传统出版物的事后语义增强,而 的出现将在出版物创作阶段就开始进行各种语义分析与处理,实现真正意义上的语义出版。将 引入出版业的语义出版领域,可以实现人工智能对语义出版流程的全过程介入,从语义化预处理到语义内容加工,再到语义内容审核,直至形成对语义出版物的自动语义分析,这将深化乃至重构语义出版体系。具体来说,一方面,可以基于原有的人工标识,如主题、篇关摘、作者等,对新近出版物进行文本分析,实现大批量快速标识,自然语言处理能力的进一步提升了智能标识的准确性和效率;另一方面,可以发现新的关联网络,如特殊词频、语言结构等,以大型语言模型为基础自下向上智推检索意图,可以实现对“意图文本”复合出版物索引的建构。索引文本的“语境化”和模糊检索网络的“精准化”,将有助于实现内容更加深入的语义出版。(三)智能检索出版业的检索从纸件到数据历经了跨时代的变化。出版业的智能检索通常需要直面两个关键问题,即检索结果的精准度和检索结果的整理与输出。传统的智能检索中,检索工具所依赖的检索模型不同,往往检索结果差异较大,而检索结果的整理与输出也主要采用人工干预的方法,显然基于布尔逻辑、划定规则等条件的检索已不能满足实际需求。“听得懂”问题的,支持多轮深度交互,从检索流程上实现了从“命令执行”到“意图命令执行生成”的转变。意图的理解和结果的生成响应了人们对检索结果整理与输出的需求。将 引入出版业的智能检索场景,可以实现升级出版物检索推荐系统和精准化智能客服答疑等多个目标。用户可以通过描述被检索对象的相关特征来实现对出版物的精准检索,与用户检索意图相契合的模糊检索,将不受限于传统检索规则,但输出更加精准的检索结果。与此同时,出版物检索过程中的客户服务也将实现智慧进化,以对话方式收集、理解和回复各类问题,模型将通过不断学习,实现更加精准化和人性化的客户服务。(四)互动出版互动出版是在数字出版基础上,借助计算机或类似设备使用和传递信息进行出版时,让传统的“传受双方”在不同的出版环节进行角色的相互转换的出版方式。互动出版源于传播个人主义的兴起,信息内容的传者与受者间的互动是这一出版模式的关键特征。互动这一关键属性让互动出版从某种意义上来说,是一种碎片式出版,即经过组合、整理、加工而形成的非系统甚至非原创的出版物。在词条、短视频普及的互联网时代,互动出版呈现出强大的生命力,与 有着天然的融合条件。作为 技术的代表成果,兼具对话和内容生产功能,可以实现跨模态生成内容,将文字、视频、音频进行高效的模态转化。它的智能交互和快速创作能力,将极大地推动互动出版物的出版与传播。文本作为出版物的主要形式,基于文本的主题性交互将充分体现 在自然语言处理方面的优势。通过智能聊天或视觉输入,灵活设计出的出版物将让内容更加灵动。二、出版业面临 带来的风险挑战基于 的关键技术特征和运行模式特点,它的应用将给出版业带来诸多风险与挑战,如编辑职能的价值降转、内容版权的侵权行为、内容安全的缺陷等。(一)编辑职能现阶段由于 技术的发展在出版业领域尚未完全成熟,其底层算法和人脑的处理之间还存在一定差距,完全依赖 技术进行判断或编辑,会出现因模型拟合不当而造成误判和出错的情况。在出版领域这往往需要通过人工干预来弥补编辑过程中所产生的圆桌论坛 信息差,即便如此,对出版业的冲击已现端倪。随着 类 技术的出现,强大的交互式学习将弥补原有 技术对固有数据高度依赖的缺陷,让应用 技术编辑的结果更贴近人工编辑作业的结果。将以更低的成本和更高效的方式替代部分传统编辑职能,并且随着技术不断发展,编辑职能将实现由单一的机械性职能向复杂的智能性职能进化。这类技术将作为更经济的生产力工具,重塑传统编辑的人工作业体系和价值评价体系,带来传统编辑职能的转变。无论是对出版内容的二次编辑,还是对出版内容进行基于某个模型的优化转向,引入这类技术后的编辑工作都将对编辑从业人员提出更高的要求,相关岗位的功能迁移,将直接导致出版业从业人员面临减薪乃至失业的风险。(二)内容版权从内容生产角度看,作为一个新型生产工具,它对出版物进行文法校对、格式修正、内容整合等非创造性活动的价值,目前已被广泛认可。但与此同时,对 的创作能力,尚存在较大的合规性争议。生成的内容归属于谁,这类内容版权问题最受关注,版权争议主要表现为它在收集、训练、学习中得到的信息数据是否获取相应的授权,以及这样的非授权所导致的偏差是否会导致输出结果为虚假信息等。在弱人工智能阶段,由于 的过程机械化、内容非智能化、使用者主体意识强,所生成的内容仍可以视作创作行为,具备一定的“可版权性”。当以 为代表的强人工智能出现,其强大的信息资源整合与生成能力,在将内容的生成过程更加“智能化”,使用者的主体意志也从详尽的“命令式”转为“意图式”。的跨模态内容生成,让使用者对信息的发现由单向度生产转变为生产与发现并存的双向智能交互。这一变化让面向 生成内容的版权评价变得相当复杂,因为此时的内容生成已由“智能增强”扩展到“语义理解”和“概念模仿”。在进行数据处理时,随着受版权保护而未经标识的客体进入语料库,出版权属性将变得难以分辨,隐性引用将触发侵权行为。因此,出版业在使用 时,需要充分考虑所面临的潜在版权纠纷所带来的风险与挑战。(三)内容安全随着互联网信息体量的爆炸式增长,运用 技术对文本、图像、语音、视频等各类内容进行多维度识别和审核,由于可以大大地提升审核效率,在出版业已得到一定范围的应用。随着 的介入,基于千亿级语料库的充分训练和激励,它所生成的内容将达成对知识范式的灵活化表达和高度模拟,这使得内容安全在出版业的范畴变得更加宽广。比如,由原先的内容合规性审查,延展到了内容是否存在偏见和误导等更广的范畴。非范式的表达让 在执行复杂任务时,表现相当优秀,但在执行简单任务时会出现“不存在的知识”或明显的谬误。这正是由于 作为语言模型对高频和高特征化词汇和语法结构有抓取偏好,因此在某些内容的表达上,使用它生成的内容准确性不定。此外,类技术的普及如被不法分子利用,将可能由于刻意的内容导向,导致大量虚假信息和反伦理内容的涌现,信息的混乱将会对现有话语体系带来威胁与挑战。由此可见,出版业对 的应用与实践应始终保持谨慎态度并做出必要的监督。三、出版业面对 冲击的应对措施(一)从业者反思 的出现对出版业产生多维度多层次的影响,如何顺应新一代人工智能技术的发展,正视 对自身影响并积极响应和适应这一变革,值得从业者深入思考和探索。目前,在技术上虽然有所突破,但其学习成果与内容输出,还不能完全满足人们对内容生产力的期望。基于这一点,从业者应积极思考和正确审视 在出版领域的应用。对 未来在出版业可能造成的职能替代,从 业 者 不 应 将 其 视 作 一 种 驱 赶 行 为,应 借 在业内的引入为机遇,深入反思职能内涵,以人机协同为方向,主动借助新技术对传统出版编辑职能做转型升级,凭借对 等新技术的理解和运用,实现自我的职能转变与升级,主动跟上时代圆桌论坛 的变革,让它成为工作中“友好”的生产力工具。(二)政策完善从 在出版业的发展速度看,其影响带有突发、快速、革命性等特点,对行业冲击巨大。以 为代表的新一代人工智能技术整体上处于起步增长期。这一时期虽具有较强的创新性,但成长的指数级加速和应用的不稳定与无序,将可能导致各种乱象的出现。政策层面应坚持包容审慎的原则,重视新一代 技术的发展,及时制定和出台鼓励性、引导性政策。针对 技术在出版业的不同发展阶段和应用场景,在主动掌握技术发展进度的同时制定相适宜的政策,始终保持政策对技术的动态跟进,从整体上规范 类技术和产品在出版业的合理准入范围和应用边界,在对技术与应用进行规制的同时,可试行主体信息公开、内容规范标识等措施,营造良好的发展环境。在出版业 乃至 技术的广泛应用是必然趋势,政府和企业都应积极面对新技术引入后所带来的变化与阵痛,在政策视角扩大其应用场景的广度与深度。(三)多维监管 技术在应用中涉及的法律风险是多样的,如果应对不当将会引发严重后果。在出版业,需要对出现的新问题,在现行法律体系中进行清晰准确的界定与涵盖,在尚未完善立法的阶段,建立必要的监管体系十分必要。面对各类复杂的现象与问题,构建多方参与的人机协同监管体系是指在对问题预判和分类归纳的基础上,将监管组织进行必要的结构优化。各监管主体厘清各自的监管边界和主体权责,统筹监管、协同监管,体现人机共治,比如有针对性地开发 甄别工具和内容识别与标记模型、采用 技术规制 的生成内容。随着技术的发展,模型迭代、规则更迭、系统升级,各种监管技术都将为反伦理信息的识别、场景风险的评估和信息的可采信评价提供依据。从多个维度、全方位地实现对 的应用监管,才能实现保障 在出版业的健康发展。(四)评价量化 的多场景应用,其效用需要评价来量化。跨场景的复杂表现,需要来自各学科、多领域的专家学者共同商讨并形成一套相对完整的评价量化体系,只有建立科学合理的评价体系才能规范技术的发展。

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开