温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
库中库
全息
共享
民歌
数据库
建设
基础
核心
构想
刘宇统
,“库中库”全息共享式民歌数据库建设基础和核心构想刘宇统,张成香(亳州学院 音乐系,安徽 亳州;阜阳师范大学 音乐舞蹈学院,安徽 阜阳)摘 要:民歌数据库建设在全国范围来看还没有全面展开,现有成果仅限于一些地域性选题和数字化实践方面的一般性探讨。世纪以来,在大数据挖掘背景下,“数据库”这个概念有了使用区块链数据库架构的新延展,因此,民歌数据库建设目标不光要满足民歌本体数据的查询等传统操作需求,还应当具备包括民歌本体信息之外的全息式数据整备基础上的数据挖掘功能和大数据应用拓展功能。构建“库中库”式的新型民歌数据库,必须以民歌资源的数字化整备为基础,以元数据标准规范设计为核心,既保证传统数据库的高容错性,又要保证元数据的高安全性,实现民歌全息共享及民歌文化复兴的总目标。关键词:民歌数据库;数字化整备;元数据标准规范;区块链;库中库 中图分类号:.文献标识码:文章编号:()收稿日期:基金项目:年度安徽省高校人文社会科学研究课题“皖北民歌数字化保存与传播研究”()。作者简介:刘宇统,教授,主要从事中国音乐史和民族音乐理论研究。数据库建设是衡量一个国家或一个学术领域信息化建设和服务水平的重要标尺之一。伴随着民歌音乐文化的研究深入,民歌数据库建设问题在不同程度上得到了尝试性的探索,形成了一些地域性或者专题性的民歌数据库。但是,因为这些数据库的建设目标本身存在局限性,例如只专注于某类民歌、某地民歌、某自然区域或文化区域的民歌甚至仅仅是民歌相关事物,所以其制作团队采用了不同的建设策略,造成了数据库呈现内容和方式上的不同特色和差别。这些民歌数据库的最大优点是弥补了纸质文献的不足,提供了民歌资源共享的新渠道,可以让我们一睹某种民歌的风采,但是此类成果数量还较小,规模不大,商业化运用还不够,也不能展示中国民歌的总体状态。世纪以来,产业化发展让数据库建设具有了更大的开拓空间,以区块链为基础的“库中库”模式开始进入研究者的视野,以此为基础重新系统思考和构建全国范围内的民歌全息共享式数据库成为可能。在传统数据库的基础上加入区块链数据库形成“库中库”的新模式,需要进一步夯实民歌资源的数字化整备这个基础问题,充分考虑民歌的特点,把元数据标准的设计作为核心进行打造。一、“库中库”全息共享式民歌数据库建设的可能性区块链研究是 世纪核心技术自主创新的突破口,也是我国重点研发的领域之一,其涉及的区块链技术三大核心技术之一就是分布式结构。这种分布式结构使得传统数据的按点存储变化为每个节点的完整性存储,使信息共享更加方便,不同节点之间的协作更加高效。年,蔡维德等人提出了“库中库”式新型区块链数据库架构,也就是在外置的一个区块链系统里面包含一个数据库系统,然后再在这个数据库内置一个区块链系统负责元数据的存储。这个“库中库”模式的优势在于使用最底层的区块链系统来保证数据的安全性,然后由第二层的传统数据库实现信息的非结构化处理,最终由最外层的区块链系统实现信息共享。基于此,一种“库中库”全息共享式民歌数据库建设也就成为可能。中国民歌种类灿若繁星,早在中华人民共和国成立初期,民歌的田野调查工作就在党和国家的重点关照下成为音乐学术界的一项盛事。改革开放之后,“中国民间歌曲集成”工作正式启动,并且这种对中国民歌音乐文化遗 第 卷 哲学社会科学版淮阴师范学院学报产的抢救和保护工作一直绵延到 世纪,产生了全国性的大型系列学术成果。检阅这项成果的应用可以发现,其主要成果的展示方式是出版纸质书,尽管有的分册有配套的音频光盘,但总体来说,民歌采集与整理过程中的数据信息缺失严重,不能全息式展示中国民歌的总体状况。在民歌数据库的探索性建设基础上,充分考虑民歌研究的总体状况,我们发现“库中库”式新型数据库的构架,为现有民歌数据库的布点严重不均、信息共享和利用率受限等问题提供了解决方案。计算机可以处理的信息一般被划分为结构化数据和非结构化数据,前者指的是数字和符号等,后者指的是文本、图像和声音等。民歌数据库中的信息应该同时包含这两部分信息,但以后者为主。民歌数据库中的音乐资源是一种海量的非结构化数据,因此,该数据库实际上更应该属于非结构化图像数据系统。想要大范围建立这种数据库,传统方法都会面临一定的困境,要与田野考察时取得的图像信息互动更是困难重重。民歌数据库记录、展示和共享的主要对象是民歌,因此与民歌有关的一切因素都应该纳入其中才能最大限度地利用考察成果。蔡维德等架构的“库中库”模式中,处于中间层的数据库非常适合民歌数据库的构建,毕竟它“保留了 数据库关系行的特点,同时借鉴了 的非结构化存储结构”,还在性能上与 同样出色。设想一下,如果把目前已进入运行阶段的地方性数据库进行一轮民歌资源数字化的统一整备,并建立民歌的不同元数据库进行数据储存,那么一个全息共享式的“库中库”新型民歌数据库就可以实现全国范围内的跨区域共建共享。二、民歌资源数字化整备是民歌数据库建设的基础民歌数据库建设的最基础工作应该是对民歌资源的数字化整备。也就是说,建设之前先要把所有相关资料根据与民歌的相关程度进行分类整合,然后转化为计算机可以处理的信息。(一)与人的相关信息整备民歌作为一种文化成果,它首先需要展示的就是与人有关系的要素。现在的民歌总体上经过了一个大致共有的发展状态:原生态次生态再生态新生态,因此也具备统一整备的可能性。这里的原生态指的就是民歌产生和最初发展的状态,主要强调它的首次生成的生态。例如,原生的自然区域、最初的使用族群和人群、最初的文化认同状态(包括但不限于演唱场景、演唱人员性别、演唱者数量、演唱场合和作用、演唱的意义赋予等)。乔建中先生曾给它总结了三个特征:第一,反映在演唱语言上,强调使用“民族语言和地区方言”;第二,强调它的传承特点是“口头的自然传承方式(家族、村寨、社区等)”;第三,强调了原生态民歌的“特殊的歌唱方法和地域民族风格,同时还特意提出了歌唱环境这个因素,并强调二者之间交融一体的互动状态”。这里的“次生态”,强调的是民歌在传唱过程中发生变异版本,造成这种现象的原因主要是原生态被破坏。原生态被破坏,一方面是指自然生态本身出现的变化带来的非人为性破坏,例如,社会生产力发展和劳动方式的改变对某些劳动号子等对歌曲发生和演唱场景有根本性依赖的民歌种类的影响;另一方面是人为的原因,主要包括民族或族群迁徙、移民或者民族融合、“官话”或普通话推广等重大历史事件对民歌的影响。这些因素,造成了原生态民歌歌曲发生局部或者细节的变化,但总体上不改变歌曲的性质和社会意义,即为次生态民歌。这里的“再生态”民歌,主要指经由非原生状态的其他民族、族群或人群甚至是某个人的参与造成的原生态歌曲和次生态民歌发生了质性改变之后的民歌。例如,改编民歌、移植民歌等。乔建中先生说的 世纪 年代末新民歌运动中“曾出现过以简单粗暴的态度,违背民歌口传之规,不顾其民间基础,随意改动,胡乱填词,让某些传统民歌面目全非的做法,令后人大惑不解”的诸如此类民歌就是再生态民歌。非常明显,再生态民歌与原生态民歌和次生态民歌的区别就是语言、表现内容、文化认同、演唱场合、演唱人群、演唱的社会意义和实践意义都发生了质的改变。这里新生态民歌,也有人将其称为现生态民歌,主要是指经过专业人员的比较成熟的改编和加工之后,民歌的生态虽然遭到了破坏,但是经过传唱和传播获得了新的社会认同,具有了新的生态特征的那部分民歌。例如,槐花几时开太阳出来喜洋洋茉莉花等。与民歌发展阶段和状态相呼应,与民歌有关的人群的整备可以包括以下这些人群:第一,原生态民歌本体的创作者 原生创作群体或民族或族群、族群内部赋予的歌曲创作者;第二,非原生态民歌本体的创作者 作词者、作曲者或创作群体以及民歌变体的创作者 改编者或者移植者或者多次创作者等;第三,民歌的发现者 这里主要指那些把民歌作为文化成果呈现给世人的个人或人群 口述者、命名者、即时在场的演唱者、录音者、记谱者、记录者、信息发布的媒体人,等等;第四,民歌的歌唱者 原生态演唱人群、族群和民族等,传承人,被发现时即时在场的演唱者、民歌手和非原生态的其他演唱者(包括首倡者、首唱者、翻唱者、成就者)等;第五,民歌的传播者 研究者、倡导者、非演唱群体或非传承人员以及一般性接触并传播人群、族群或民族等。民歌往往具有集体传唱的特点,因此,在某些关于人的要素方面界定相对模糊,并且有的人群还会出现重叠的现象。例如,宜宾民歌槐花几时开,它的原生态已经非常模糊,只能根据文献推断大约是明清时代的汉族民歌,原生区域大约是我国的西南地区,内容是通过一对母女的对话表现当时年轻男女的恋爱状态,反映了当时人对于爱情的态度和风俗。这首民歌的记录者回忆,年下半年,宜宾市文工团喻祖云同西南军区战斗文工团李舒联(舒联)一起到屏山县体验生活。槐花几时开是在从宜宾去屏山的船上,由他演唱,由李舒联记的谱。但歌词来自大学生素描中一段四川民歌,曲调原型则是他凭借自己对宜宾民歌的积累和音乐修养,进行了加工。从此,喻祖云就与现在命名为槐花几时开的民歌结下了缘分,成为这首歌的创作者、首唱者、作曲者(曲调移植者)、作词者(歌词改编者)、传承者、即时在场演唱者。当时的受众李舒联则成为该首民歌的记谱者(制谱者之一)、命名者、首倡者。在场的其他人员则是该首民歌的首批听众,也就是该首民歌客观存在的一般性接触人群。如果他们将他们听到的内容向其他人转述,就构成了实质上的传播者、口述者和信息发布的“自媒体”人(群)。对于民歌的移植者,也需要特别注意。民歌在流传的过程中,除了保留歌曲形式,还有可能被转化成器乐曲,因此它的移植者,应该包括但不限于移植到乐器独奏、多声部作品等,同时在该歌曲的美化和优化的过程中的配器、和声编配、其他伴奏形式的创作等都需要综合考虑并进行专题整备。民歌与人有关的因素还需要结合时代变迁的大背景进行宏观考虑,因为在全球化视野里,中国民歌已经成为一个专有术语,承载着的文化基因参与构建整个中华文明。一些新生态民歌,已经完成了民歌国际化的实质性生态构建,它的传播人群已经跨越了国界。一些国际友人对一些中国民歌的创作型活动都应该纳入其中,值得建设一个专题性模块,反映国外人参与民歌构建的“子菜单”。当然,对民歌的“破坏者”也要有一定认识,毕竟有些人对民歌的所作所为还是会对该民歌造成某种生态的直接或间接破坏,我们不能忽略这一因素。(二)与物的相关信息整备民歌本身是非物质文化,但是,还是有大量的“物”可以成为其既定的物的要素,传达民歌的相关信息。这类信息在计算机信息分类中绝大多数都是非结构性信息。听觉信息整备民歌在实质上具有不可复制的一次性消费的特点,但是通过现有技术可以实现该歌曲声学属性方面的保存。一首民歌在传播过程中可以通过不同的载体进行分类整备。例如,钢丝录音(磁性钢丝录音)、磁带、唱片、等。这些物质载体在进行计算机信息转化时需要选择不同的声音格式以满足民歌“声音”的原始保存,尽量弱化其中的不良因素,必要的时候,可以选择一些非常规化手段。例如,开盘机的使用。在这类信息整备中,首先要根据不同的声音载体,选择最适合的音频格式,而不是优先考虑资源存储方便和节约空间等外在因素,以免后期再次返工造成资源的更大浪费。同时,也要考虑现有民歌的物质载体的自然损坏和人为损坏的不可逆性,不要失去了之后追悔莫及。现有的主流音频格式通常根据后缀进行区分,大 约 有 种 之 多。例 如,、等。它们又被分为有损格式、无损格式和为了某种软件适用的私有格式。不同的音频格式还可以通过音频解码进行格式转化,但是会造成声音质量不同程度的损失。不同民歌种类和不同民歌版本需要的音频格式又有所不同,因此不能采用单一的格式进行简单处理,尽管在数据库建设初期的确曾经要求建库过程中尽 第 卷 哲学社会科学版淮阴师范学院学报量保持数据的一致性,减低信息的冗余性,提高信息的可扩展性,但是,在新时代数据库建设中,这种削足适履的方式已经不可取,至少已经不适合了。民歌音频资源得来的成本应该在数据库数字化资源整备环节就被充分考虑。因此,无损音质的音频格式应该作为民歌数据的首选类型。考虑到数据库后期的应用,建议使用 格式,因为这种格式是一种完全免费的开