温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
数据
概念
史考略
档案
解析
吴哲
112023 年 第 1 期“数据”概念史考略及“档案数据”概念解析*吴 哲1 丁海斌2,3(1.沈阳建筑大学马克思主义学院,辽宁沈阳,110168;2.广西民族大学管理学院,广西南宁,530006;3.广西数字档案管理研究所,广西南宁,530006)摘 要:数据时代,“数据”不只成为社会热词,同时也成为若干学科的重要植入性概念。作为信息社会的一个重要的名词术语,对其进行历史语言学的概念史的考察,具有重要的学术意义。从历史渊源角度看,“数据”(Data)应发源于数学领域,是从几何领域欧几里得的“已知条件”而来。Data具有“已知条件”“资料”“依据”三义,汉语“数据”则具有“以数为据”的涵义,两者具有一定的互通性。在“档案数据”的内涵争议中,将“档案”仅视为“数据”之定语与修饰词,是一种对于计算机或计算主义的屈从,并产生了诸多歧义。从数据的档案属性和同义复词视角分析,数据即档案,“档案数据”中的“数据”,可视为对“档案”的重申。关键词:数据;档案数据;概念史;同义复词;数据档案分类号:G270.9;H121A Brief History of the Concept of Data and the Analysis of the Concept of Archival DataWu Zhe1,Ding Haibin2,3(1.School of Marxism of Shenyang Jianzhu University,Shenyang,Liaoning 110168;2.School of Management of Guangxi Minzu University,Nanning,Guangxi 530006;3.Guangxi Institute of Digital Archives Management,Nanning,Guangxi 530006)Abstract:In the data age,data has not only become a social buzzword,but also an important implantable concept in several disciplines.As an important term in the information society,it is of great academic significance to investigate the conceptual history of historical linguistics.From the perspective of historical origin,data seems to originate from the field of mathematics,and it is generated from Euclids known conditions in the field of geometry.Date has the meaning of known condition,material and basis,while the Chinese word data has the meaning of data is based on numbers,and the two have certain interoperability.In the controversy over the connotation of archival data,the term archive is regarded only as the attribute and modifier of data,which is a kind of subordination to computer or computationalism and creates many ambiguities.From the perspective of archival properties and synonym-compound of data,data is archival,and the data in archival data can be regarded as a reaffirmation of archives.Keywords:Data;Archival Data;Conceptual History;Synonym-compound;Data Archive“数据”概念从学界对其进行察考或阐释开始,常处于较为抽象之境地,难以有一个精准的、达成共识的概念界定。又因为数据时代之“数据”,已经成为社会热点词汇,被许多学科所关注与引入,又经过不同学科视角的研究,从而引申出若干内涵与外延。由于着眼点不同、学术进路不同、认知差异等多种因素影响,对于“数据”概念的阐释呈现了百花齐放的态势,至少存在数十种概念界定。在某种程度上,“数据”概念呈现出不确定性、多元性与歧义性。因此,形成这样的判定并不是没有原因的:“数据本身没有确切的含义,其含义来源于背景语义。”1此外,在人文社会科学的一些学科领域(比如哲学),容易想当然地认为“数据”一词,是由“数”而来,所以不乏“数数据大数据的历史沿革”2这样的讨论。而计算机学科认为:“编码都必须是计算机能够接收的形式,因此,数据一词的最早来源就是指计算机数据。”3既然“数据”一词的历史渊源、“数据”一词的概念界定等都尚未完全厘清,那么,对“数据”进行一次概念史考察,或许可以消解某些歧义,提升我们对“数据”概念认识的明晰度。学术园地栏目主持:张 帆 杨晴晴12档案与建设ARCHIVES&CONSTRUCTION2023 年 第 1 期1 “数”与“据”1.1 何谓“数”“数(數)”字始见于战国文字,由“婁”而来,简化字为“娄”。“婁”字出于金文,古时即有“数”之涵义,段玉裁释谓:“婁,亟也。亟者,數也。”4例如,战国中期之郭店楚墓竹简 语丛二中,所谓“名娄”,即“名数”5也。后加“小击也”之“攴”,乃造为专字“數”,其简化字写作“数”。说文解字将“数”字之本义厘定为动词“计算”,训曰:“数,计也,从攴婁声。”6作动词时读音为sh,如道德经:“善数,不用筹策。”7从动词义计算,引申出名词义“数目”,名词读音为sh,如 庄子秋水:“号物之数谓之万。”8自汉代以后,尽管“数”的形容词、副词词义仍然使用,如数百步、数见不鲜等,但其主要词义“计算”“数目”已然相当稳固,此二义与今之“数据”概念存在着一定的关联性。1.2 常被忽略的“据”据,“(j)挶也,从手居声”9,所谓“挶”,亦可写作“拮据”,说文解字手部之双声联绵字,本义为鸟之筑巢,手足劳苦或手难以屈伸之病,后引申为处境艰难、经济窘困之义。按此“据”字,无论是手病之一种,还是拮据,皆与现代“数据”一词中所使用之“据”字风马牛不相及。而“数据”之“据”,实应为“據”字(原本据、據为二字,今则以“据”为“據”之简体)。“據,杖持也,从手豦声”,段玉裁注曰:“谓倚杖而持之也。杖者,人所据。”10“據”字,其初为动词,其涵义大体可理解为依托、依仗之义,后引申出名词义,意为凭证、凭据等,现代所谓“证据”“论据”者,皆此义。现 代 人 谈 论“数 据”的 概 念 时,其 重 心 在 于“数”“数字”“数字化”等,“据”字多被视为后缀,因此在概念阐释时,“据”字常常为人所忽视。释“数”者多,释“据”者少,就像前文所述,有学者讨论“数数据”的历史沿革,却几乎没人会去讨论“据数据”的历史沿革。以今审之,“数据”概念之涵义恐亦与“据”之动词义“依托”、名词义“凭证”有所关联,绝非仅为后缀而已。如,我们日常使用“据研究表明”“据调查表明”,是可以的,但若说“据数据表明”,则有病句之嫌。2 作为合成词的“数据”“数据”乃为“数”字与“据”字两词素相叠加之合成词。所谓“数据”,取“据”之名词义,则为“数字之凭据”;取“据”之动词义,则为“据之以数”或“以数为据”。此二义其实一脉相循,互为呼应,即数据何以能成为“数字凭据”呢?在于“以数为据”是也;反之,若可以“以数为据”,则数据便可以成为“凭据”。在中国历史文化语境中,“数”与“据”连缀使用时,“据”字多为动词依托、依据之义。自古统计数目,于数目后,常跟随此种“以数为据”之义,即“某某数,据某某”。如“户千六十七万七千九百六十,此通典所载之数,据东汉书”。11但是古时“数”“据”二字连缀使用,尚非固化之双音节合成词,只是表达根据什么而来、以某某为依据之类的涵义。如,春秋谷梁传:“今传言公田什一者,举其全数,据出税言之”12;素问:“守数据治,无失俞理”13等,此中所谓守数据治,即根据常规、规律而进行治疗,实为“据数”之义。又如“臣不过据数而言,岂敢妄议是非?”14此中之“据”固为动词,而“数”亦并非全是数目、数字的涵义,还有规律、术数等其他涵义。一如现代之“数据”概念,“数”亦并非只能指代数字,除数字外,文字、图形、图像、音频、视频等亦皆可称“数据”。此外,将“数据”当作双音合成词来使用,出之甚晚。以现有资料考察,清代学者杨守敬所撰日本访书志,其中太平圣惠方一百卷目录一卷中,谓“计其所采方书,增于外台秘要数据倍”。15其中所谓“数据倍”,结合前面“增于”二字,则此“倍”或为加倍之义,即“数据倍之”,故“数据”似当为合成词。不过这种用法即使在近代,亦非常见。3 与Data对译的“数据”关于Data的历史溯源,最早可追溯至古希腊数学家、被称为“几何学之父”的欧几里得。即,Data早期与数学具有较强的关联性,此恐怕亦是Data在现代词语涵义上等于“数据”之基础与渊源所在。从欧几里得时代到现代,以概念史视角来看,Data的涵义主旨似未发生颠覆式的变化,但其所指却出现过数次微妙的调整。3.1 强调“已知”意蕴的DataData概念源自数学(几何)著作,因此,对于Data的优先译介权也在数学史的领域里发生。据称欧几里得除 几何原本外,另有15部著作,不过基本都已散佚。“已知条件(Data)是唯一以希腊原文幸存至今的另一部著作”16,这里面至少提供了两个至关重要的信息:其一,早期的Data,涵义为“已知条件”;其二,学界现在广泛流行的观点认为“数据”一132023 年 第 1 期词最早出现于“拉丁文”,或许可以商榷。这一著作中提出的若干涉及比例与图形等众多命题在数学史上的意义值得我们重视。因为这些意义在现代的“数据”概念里仍在延续。数学家们并未执着于意义,只是指出“在已知图形中某些部分或关系是已知时,其他部分或关系在这种或那种意义上也是已知的”这种解释,正是已知条件(Data)这部著作的核心思想,而对于这种核心思想的最简洁的内涵表达即是:Data。因此,或可将Data的原始意义做一次提炼,即,限于图形范畴,若某些元素已知,则其他元素也可以成为已知。在此种意义上,现代“数据”之“以数为据”的概念与数学史上的“已知条件”相吻合。例如,在数据时代,若“已知”某人的每日出行轨迹,则该人的其他元素,如家庭住址与工作单位可“成为已知”等。因此,“数据”概念的原初涵义“已知条件”,在21世纪仍然成立。现实生活中,所有互联网服务商们之所以能够对网民群体使用“自动推送”“精准投放”等手段,都是基于“部分已知,其他部分也已知”的底层逻辑。3.2 强调“资料”意蕴的Data如果说强调“已知”意蕴的Data,多存在于数学领域。那么,对于强调Data之“资料”意蕴的解读,则较多地存在于历史学领域(在这个意义上,“资料”“文献”“档案”等概念为近义词甚至同义词,常可互换使用)。其中,双方的研究重心不相同,数学领域中的“已知”,具有计算性、思辨性意义,历史领域的“资料”,则更多的是Data的功能性意义。强调“资料”意蕴的Data,其较早似可追溯至精于魏晋玄学、佛教史的近代历史学家汤用彤先生。汤先生在论“科学推理之诸原则”之际,曾将Data界定为“算术之材料”。17民国时期,“史学即是史料学”“只要把材料整理好,则事实自然明