分享
基于文本挖掘的《传习录》思想体系构建与分析.pdf
下载文档

ID:3120795

大小:3.13MB

页数:7页

格式:PDF

时间:2024-01-21

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
传习录 基于 文本 挖掘 传习 思想体系 构建 分析
第3 5 卷第2 期2023年6 月D0I:10.3969/j.issn.1008-7109.2023.02.011宁波工程学院学报JOURNAL OF NINGBOUNIVERSITY OF TECHNOLOGYVol.35No.2Jun.2023基于文本挖掘的传习录思想体系构建与分析邓凯,陈微,王小妍(宁波工程学院人文与艺术学院,浙江宁波3 15 2 11)摘要:为了深入了解王阳明思想的形成与演变过程,以阳明心学的经典文献传习录为研究对象进行文本挖掘,使用PowerConc软件探究其字词频及共现关系,采用Gephi软件可视化地展示出该文本内容之间的语义关系网络。研究结果表明:传习录思想体系可聚类为“九大主题”,卷上讨论较多的是心、天理,以及“诚意”等大学相关命题;卷中讨论较多的是知、良知、致良知等阳明心学核心哲学概念;卷下对“功夫”作了较多讨论,集中谈到“灵明”的问题,并多次以“警如”一词进行打比方说明。阳明心学思想早期侧重对“理本体”与“心本体”的创新性论述,中期演进到对“良知本体”的确立,晚期重点论述良知学本体功夫更多内容。另外,“诚”字作为具有思想考察价值的字,在阳明心学思想体系中具有非常重要的地位。关键词:文本挖掘;传习录;阳明心学;思想体系中图分类号:B21文献标志码:A文章编号:10 0 8-7 10 9(2 0 2 3)0 2-0 0 7 0-0 7Construction of Ideological System of Chuanxilu-A Text Mining ApproachDENG Kai,CHEN Wei,WANG Xiaoyan(School of Humanities and Arts,Ningbo University of Technology,Ningbo 315211,China)Abstracts:In order to gain a deeper understanding of the formation and evolution of WangYangmings ideology,the classic literature Chuanxilu of Yangmings teachings was used as theresearch object for text mining,using PowerConc software to explore word frequency andco-occurrence relationships,and Gephi software to visualize the semantic network of the textcontent.The research results show that the ideological system of Chuanxilu can be clustered into“nine major themes.The first volume discusses the concepts of heart,heavenly principle,and“sincerity,which are related to the topic of the Great Learning.The second volume discusses thecore philosophical concepts of knowledge,conscience,and the cultivation of conscience inYangmings teachings.The third volume focuses on the discussion of“skill,particularlyemphasizing the issue of“ling ming and using many examples to illustrate the point.In the earlystage of Yangmings teachings,the focus was on the innovative discussions of the“Ontology ofPrinciple and the“Ontology of the Mind.In the middle stage,there was a shift towardsestablishing the“Ontology of Conscience,while in the late stage the focus was more on thecontent of the“Ontology of Conscience Cultivation.Additionally,the word“sincerity occupies avery important position as a word with significant conceptual value in the ideological system ofYangmings teachings.Keywords:text mining;Chuanxilu;Wang Yangmings Philosophy;ideological system收稿日期:2 0 2 3-0 2-2 3基金项目:浙江省“十四五”教改项目(ig20220599);甬江社会科学青年人才资助成果(甬哲社科办 2 0 2 2 8 号文件)通信作者:邓凯(19 8 6 一),男,湖南东安人,博士,副教授,主要从事阳明学研究,E-mail:k k d r e a m 2 0 0 5 12 6.c o m修回日期:2 0 2 3-0 4-2 3邓凯,等:基于文本挖掘的传习录思想体系构建与分析0引言中国古代经典文献具有历久弥新的价值,正如习近平总书记指出的,要让“书写在古籍里的文字都活起来”,让中华文明“为人类提供正确的精神指引和强大的精神动力”。进人到数字化、智能化的新时代,如何运用最新技术,更好地保护和利用经典文献,特别是通过文本挖掘,发现其中具有价值的新知识,已成为当今的重要问题和研究趋势。当前计算机技术能够突破人工脑力所限,结合社会网络分析等前沿数字人文研究方法,从字(词)频统计、共现关系、网络结构计算的角度,可以高效地提取阳明心学思想体系中的核心概念、命题和主题,并且指引深入分析思想演进脉络。然而,目前学界对传习录的研究主要采用“文本细读”的方式探讨其中的一些哲学概念、常见命题,比如从认识的对象、目的、方法手段和过程的角度谈心学体系,或从“总纲”与“体”“用”关系的框架进行总结,而选用“文本挖掘”的方式,揭示思想体系层面内容的研究还较少见。实际上,一个思想体系涉及到非常多的概念、命题和主题,有着复杂的形成过程,只有借助于“文本挖掘”技术和方法,才可以进一步完善阳明心学思想体系,基于此,本文从文本挖掘的视角开展了对传习录的研究。1文本挖掘的语料、方法及流程1.1电子化:梳理文本生成过程,聚焦王阳明本人的语料传习录文本的形成过程复杂,内容丰富深刻,围绕阳明心学思想体系的议题,将其电子化为“语料”,可供全文检索,以便细读文本,这也是后续进行数据统计、文本挖掘的基础。以通行的王阳明全集中传习录为准 4 1-14 3,人工校勘后可得准确的电子化文本,并将原来的繁体字转成简体字,拆分出其中的上、中、下三卷。传习录的“卷上”又称“初刻传习录”“卷中”或称“续刻传习录”“卷下”亦称“传习续录 5 1-5,这三卷的成书时间前后相继,可反映王阳明思想发展进程。此外,传习录卷上“徐爱引言”卷下“钱德洪跋”,以及附录朱子晚年定论(包括王阳明的序、朱熹论学选段),这些并非王阳明本人关于其心学思想的直接论述,故不予选人语料。1.2数据化:从字频到关系,量化数据指引质化研究方向语料中的“量化”数据,包括字词的出现次数及其共现关系两大方面,能够提供“质化”研究的切入点,比如传习录中出现频率靠前的字词(组)可有效提示阳明心学思想体系中的核心概念、命题及分布情况。古代汉语中大部分单“字”即相当于一个“词”,而且双字词、多字词也容易通过字与字之间的关系数据被发现,因此不必对传习录语料再作现代汉语分词处理,直接导人PowerConc软件计算可得字符词形概况、字词(组)的频数、字与字之间的共现关系数据。传习录语料中共有7 8 0 11个字符数,15 3 3 个词形数。字词(组)的出现频数,则从意义有效性的角度,可进一步细分到一字、两字、三字、四字和五字,并且得到相应的TF-IDF值,以评估其重要程度。字词(组)在传习录三卷的分布情况也可得到相应的量化数据。传习录核心字词组数据,不仅能提示阳明心学核心概念、命题,也可印证其书三卷在体裁上的差异。如表1所示,传习录的卷上、卷下为“语录体”,而卷中为“书信体”,所以“先生”一词在传习录卷中只出现10 次,卷上、卷下则分别为15 1和2 18 次;而“来书云”则未见于传习录卷上、卷下,只在卷中出现过3 8 次。此外,PowerConc软件还可统计出语料中字词的“共现”数据,揭示其间的“语义关系”和“语法关系”,引导相应的文本细读,能够发现其中重要概念之间的内涵联系,便于进一步去讨论基本命题,以及思想观念发展脉络等。7172字词组(部分)是知而一字有以人心先生良知二字圣人天理所以来书云致良知三字其良知上用功是圣人致其良知无善无恶真诚侧恒四字天地万物存此天理格物致知学存此天理致其良知而五字是无善无恶以天地万物如表2 所示,阳明心学经典命题“致良知”“心即理”“知行合一”都被涵盖在表1之中。“核心字共现数据”的获取,使得传习录思想体系的网络构建成为可能,而且指引相应的文本提取、质化研究。1.3文本挖掘:构建思想网络,发现核心概念、命题及主题从语料的电子化、数据化,发展到“网络化”,将获得文本内容结构更为深入的认知,特别是通过Gephi软件的“模块发现”功能,归纳出传习录的主题,构成阳明心学思想体系的完整框架。由上述核心字(节点)及其共现关系(边),构成一个思想体系的网络结构,操作流程是:首先将传习录语料导入PowerConc软件,从得到的字频统计结果中选取具有思想考察价值的高频前3 0 个单字;其次,在该软件中分别检索前3 0 个单字在文本中的共现关系,检索范围设定为该字的前、后各12 个字符;再次,选取这3 0 个单字的共现关系数据,汇总成表格导入Gephi软件进行计算,输出结果及可视化,如图1所示。宁波工程学院学报表1传习录核心字词组综合数据表总出现数/次分布/卷TF-IDF值142831038397038253810377537593379332331943140311633813323222432131911421311231021031027161632023年第2 期卷上出现数/次卷中出现数/次-410.81549-298.61197-279.05180-237.34259-233.02194-222.95269-218.35277-109.03151-92.924-55.8170-40.2793-33.372915.4000000-6.9015-6.0427.700065.270-3.45204-2.886042.8302.430-1.722传习录文本PowerConc.软件思想网络构建数据Gephi软件网络计算与可视化思想体系三层图1习传录文本挖掘流程图卷下出现数/次36351653430771575335231478138213293291191102182011185173212657303802211311275141900813064061306700631语料电子化整理1、清除非王阳明语录2、分上、中、下三卷1、核心词频(前3 0)字频及共现关系2、共现关系(前后12 字)1、概念(中心节点)2、命题(边的度数)3、主题(模块发现)邓凯,等:基于文本挖掘的传习录思想体系构建与分析表2 传习录核心字共现数据表(部分)核心字共现字词知是良而致以知其行有者人心是人人圣知心2字词(组)统计与核心概念、命题的提取2.1核心字的确定运用PowerConc软件可统计出传习录中出现频率最高的、具有思想研究价值的前3 0 个字,但出现频率高未必表示他们在整个网络中也具有相应的重要性。比如,出现14 2 6 次、频率最高的“是”字,比排在第二位的“知”字(10 4 0 次)要多出现将近4 0 0 次,差距很大。然而,从思想考察的角度看,“知”字显然比“是”字更为重要。具有思想考察价值的字,通过“共现”统计,结合Gephi软件中网络算法,可得出其“权威值 指标,提现节点重要性。对照这个指标与出现频率,可发现一些有意思的变化:大部分字的出现频率与其权威值排序有所不同,有助于探讨该字在思想体系中实际重要性。比如,“诚”字的出现频率排序为25,但其权威值排序上升到2 0,这说明“诚”字在阳明心学思想体系中的地位其实非常重要。传习录思想体系图(图2)主要呈现出三个方面的信息:节点的圆圈越大,表明出现次数越多,地位越重要;连线的次数越多,表明思想联系越紧密;字背底为相同的颜色,表示属于同一模块,根据传习录思想体系图可知,“知”“心”“人”“理”“学”“天”等字为阳明心学的核心字。2.2相关词(组)的整理结合字频统计与字数组合的检索,运用PowerConc软件可发现传习录中的重要词与词组,引导发现展现总体思想特征的核心概念。又从字词(组)的出现次数与其共现关系这两个维度“锁定”若干核心概念,去除一些与思想考察无关的虚词、无效搭配,得到传习录文本中核心概念,其中核心字按网络中权威值排序,词(组)右旁括号内为其出现次数。如表3 所示,核心字及相关词(组),全面涵盖了传73共现数/次核心字716548516351281266252231230223221218352334302221214共现字词是心也心理知人是心天理而理此事以知无物学图2 传习录思想体系图共现数/次409356230229218214241229212192144127107105105103102知74习录思想体系中的核心概念与命题,可展开专文论述。比如“致良知”“心即理”“知行合一”命题,分别在核心字“知”“心”“行 的相关词(组)当中。又如“无善无恶”的问题有学者作了专文论述。序号核心字1知2人3心4学5理6事7物8自9天10意11良12圣13功14行15道16明17体18用19善20诚宁波工程学院学报表3 传习录核心概念、命题总览核心概念、命题:具有思想考察价值的相关词(组)良知(3 2 3)、致良知(3 3)、致知(6 7)、知天(2 2)圣人(19 4)、人心(3 5)、圣人气象(6)此心(6 7)、吾心(3 2)、心即理(10)、心与理(10)为学(3 5)大学(2 6)圣人之学(14)圣学(10)天理(14 0)、穷理(4 1)、存天理(17)、是天理(18)存此天理(10)必有事(18)、事物(2 5)、事事物物(10)、有事无事(9)格物(10 5)、格物致知(10)、万物(2 7)、天地万物(12)自有(2 4)、自家(2 2)、自知(13)、自心(8)天下(116)、天下之理(6)天地(4 6)诚意(4 9)私意(17)良能(4)、良心(3)圣贤(17)、作圣(9)、圣门(8)、至圣(4)功夫(8 0)、功尚未了彻(4)知行(4 2)、流行(18)、生知安行(15)学知利行(6)、困知勉行(6)修道(2 0)、道心(12)道问学(7)明德(17)、明明德(12)、灵明(15)、我的灵明(8)心体(2 5)、体用(9)用功(8 3)实用(14)实用功(7)、发用(12)善恶(2 6)、为善(2 5)、为善去恶(7)、至善(2 1)、无善无恶(14)2023年第2 期至诚(17)、真诚侧恒(13)3模块发现与主题的归纳、分布及思想演进社交网络分析中的“社区发现”研究涉及主题演化等问题,其算法、技术运用到传习录思想体系研究中,可对核心概念、命题及其关系进行“主题 聚类,可称为“模块发现”。3.1传习录“九大主题 归纳据Gephi软件计算,传习录内容可聚类为九大模块,即“九大主题”,如表4 所示:表4 传习录基本主题的归纳序号主题1致良知知、良、致、自、真、诚、侧、恒、独、识2存天理理、体、意、性、善、恶、道、念、气、实、义3学圣人4天命5功夫核心字人、圣、贤、为、学、流、笃、行天、地、灵、明、德、命功、夫、用、力、妙其他主题相关字得、则、能、今、非、至、闻、我、分、昼、温、莫、夜、困、食、惟、专、由、州、节、认、书、私、家是、无、有、即、谓、如、去、着、论、穷、复、通、率、尊、思、虑、索、臭、落、头生、说、子、先、问、做、讲、言、世、教、古、门、多、象、信、大、难、情、语、文、博、作虽、日、方、下、易、间、昭、治、聪上、须邓凯,等:基于文本挖掘的传习录思想体系构建与分析序号主题6格物7养心8未发9修身表4 主题归纳将传习录中复杂内容联系起来,这是人工脑力所不能做到的。结合文本细读,可对其逐一进行全面而深入的阐发。比如邓立有论文以传习录为中心,专门考察王阳明对“孝”的阐发,指出“孝”与“心”的深刻关系8,这可佐证表中“存养心”主题归纳的有效性。3.2传习录三卷主题分布罗贵绒考证了传习录卷上、卷中所录时间9,本文参考其研究成果,为更准确地从时间维度对传习录文本进量化分析,将“卷中”训蒙大意示教读刘伯颂等及教约内容移到“卷上”,将“卷中”答罗整庵少宰书移到答顾东桥书之前。拉出传习录三卷文本生成的时间线,据此探讨主题分布情况。1)传习录卷上较多讨论的是:心、天理,以及“诚意”等大学相关命题。从字频统计来看,传习录中与“心”相关的词有“此心”“心体”“汝心”,在文本中出现次数如图3(a)所示。传习录卷上探讨“天理”的次数也是最多的,其功夫是“存天理、去私欲”。阳明心学的萌芽、形成,离不开儒学经典的诠释,特别是传习录卷上中对大学相关命题的讨论较为集中,如“至善”“明明德”“诚意”等。2)传习录卷中较多讨论的是:良知、致良知。“良知”是阳明心学中最核心的哲学概念,其分布情况具有重要的学术研究意义,“知”“良知”“致良知”的分布如图3(b)所示,其中包括“知天”“其良知”在卷中的较多出现可见讨论“良知”的频繁。阳明心学思想体系以良知为本体,以致良知为功夫,主张体用一源、本体功夫。因此,传习录卷中也是讨论“致良知”功夫论最为集中之处。传习录卷中谈到“致知”的次数,与“致良知”“致其良知”之和相当,可见阳明逐渐从大学“致知”命题,发展出自成一家的“致良知”学说。3)传习录卷下对“功夫”作了较多讨论,集中谈到“灵明”的问题,并多次以“譬如”一词进行打比方说明。阳明的功夫论强调其“简易”的特点,因此谈到“宗旨”“头脑”等。阳明讲学善用比喻,通俗易懂,能接引各种学人。“譬如”一词在传习录卷下出现12 次,此外只有卷上的1次,可知越到后来,阳明心学体系成熟,他也更重视思想的广泛传播。传习录三卷所含主题在卷中也有过渡之迹。传习录卷中是“书信”体,关于“朱子”与大学的讨论也相对集中,这应当与阳明论学对象的关切有关。3.3阳明心学思想之演进脉络阳明心学思想演进脉络的考察视角包括传习录主题在三卷文本中的先后分布,以及九大主题核心概念之间构成的思想演变逻辑关系,由此可梳理出阳明心学体系的思想演进脉络。1)早期侧重对“理本体”与“心本体”的创新性论述,思想演进脉络包括:核心字“心”与“天”的共现文本中的“心纯乎天理”一“知心知天”一“知性知天”;核心字“理”与“功 共现文75表4(续)核心字物、格、万、仁心、事、孝、养、存、此、吾、求发、未、已身、修其他主题相关字礼、字、应耳、清、从、外、随、照、汝、二、主、固、使、务、亲、两、父、执处、中终、侯35600(a)31302515131050卷上图3 传习录核心字在三卷的分布:(a)“心 的分布;(b)“知 的分布心体一日一汝心一一此心2016145卷中卷别(b)500400530020061卷下534贝1972011004007卷上良知一8 知一一致良知3071182211卷中卷下卷别76本中的“去欲存理”一“心纯天理”一“胜私复理”;核心字“心”与“物”共现文本中的“心外无物”“一念便是物”一“不可心有一物”;核心字“理”与“物”共现文本中的“即物穷理”一“物上求定理”一“心在物为理”一“物得其理”;核心字“天”与“物”共现文本中的“天下之物”一“心即天、心外无物”一“顺物天则”一“良知是自家准则”。传习录中10 次出现“心即理”命题,但不太被注意到的是出现同样次数的“心与理”,在“心”与“理”的关系问题上,卷中作了非常多的探讨,另有“知行”在三卷中依次出现13、21、8 次,这都涉及到阳明心学体系从“心本体”到“良知本体”的过渡。2)中期演进到对“良知本体”的确立,并论述相应的功夫,思想演进脉络包括:核心字“知”与“理”共现文本中的“知”一“知行”“良知”,提供理解“良知”的多维度视角;核心字“知”与“心”共现文本中的“知”“知觉、知行、本体”一“良知”;核心字“人”与“物”共现文本中的“物欲”一“人情”一“良知”;核心字“知”与“功”共现文本中的“致知”“独知、知行”一“致良知”;核心字“知”与“物”共现文本中的“格物致知”一“致良知于事物”一“万物俱在良知中”。致良知功夫论的内容在传习录卷中后增多。“格物致知”在传习录三卷中依次出现6、1、3 次,而“致知格物 则依次出现1、6、1次,由此可管窥阳明论述“格物”与“致知”过程中对两者地位的调整,强调“致”的功夫。3)晚期重点论述良知学本体功夫更多内容,思想演进脉络包括:核心字“心”与“理”共现文本中的“破偏外障”一“破偏内障”一“破内外障”,由此可见做功夫的次第与破障路径,具有极大的功夫实修参考价值;核心字“理”与“人”共现文本中的“理为先”一“心为先”一“良知无先后”;核心字“理”与“天”共现文本中的“天理”一“天下之理”一“良知尽理”;核心字“心”与“功”共现文本中的“心上用功”“心之发动处”“功夫一贯无多念”,足见阳明心学功夫如何去落细、落实;核心字“人”与“功”共现文本中的“心上用功”一“着实用功”一“良知用功”。此外,“内外”只在卷中、卷下各出现12 次,本体、功夫的“内外”关系,成为阳明心学发展过程中要阐明的重要命题,因此做了集中论说。4结语本文将传习录电子化文本整理成语料后,使用PowerConc软件得到字词频及共现关系,并利用Gephi软件可视化呈现出传习录的核心概念(节点)、命题(边)、主题(模块)。以此为基础总结了阳明心学思想体系中的核心概念、命题和主题以及思想演进脉络。尽管本文已经能够呈现出阳明心学思想体系的基本框架,但由于传习录仅是体现阳明心学思想的文本之一,因此后续的研究仍有必要将更多体现阳明心学思想的文本纳人研究范畴,比如遗言录。其次,本文所做的文本挖掘主要围绕具有思想考察价值的“实词”展开,未顾及“虚词”,因此今后的研究可将“虚词”也进行文本挖掘,以期构建更为全面的阳明心学思想体系。参考文献:1赵思渊地方历史文献的数字化、数据化与文本挖掘:以中国地方历史文献数据库为例 J.清史研究,2 0 16,104(4):26-35.2刘建国王守仁“心学”体系的内部结构 J.长白学刊,19 8 5(2):11-14.3林安梧,ZHAOZG.传习录与阳明学 J.孔学堂,2 0 15,2(2):6 2-7 0.4王阳明王阳明全集 M上海:上海古籍出版社,2 0 11.5】陈荣捷.王阳明传习录详注集评 M.重庆:重庆出版社,2 0 17.6】李琪慧传习录中的“无善无恶”:从“侃去花间草”一条切人 J.王学研究,2 0 18(2):9 3-10 2.7】吴小兰,章成志基于突发事件特征网络的用户社区发现与社区主题演化研究:以新浪微博H7N9事件为例 J情报理论与实践,2 0 17,4 0(5):9 4-9 8.8邓立.论王阳明对“孝”的心学阐发:以传习录为中心的考察 J.贵州大学学报(社会科学版),2 0 16,3 4(3):2 9-3 4.9】罗贵绒传习录各卷所录时间考 J人文论丛,2 0 17,2 8(2):17 9-18 8.宁波工程学院学报2023年第2 期

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开