温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
国内
数据
杀熟
研究
述评
李诗苗
知识管理论坛 ISSN 2095-5472 CN11-6036/C Knowledge Management ForumE-mail:http:/674【面向全社会的知识服务新兴模式专辑】国内大数据杀熟研究述评李诗苗 张丽 张立彬南开大学图书馆 天津 300071基金项目:本文系 2016 年度国家社会科学基金重点项目“网络时代开放教育资源引进与利用中的知识产权问题研究”(项目编号:16ATQ002)和中央高校基本科研业务费专项资金项目“推进智慧图书馆构建,开启多元化服务新模式”(项目编号:63212101)研究成果之一。作者简介:李诗苗,馆员,硕士,E-mail:;张丽,编辑,硕士;张立彬,研究馆员,本科。收稿日期:2022-08-29 发表日期:2022-12-30 本文责任编辑:刘远颖摘要:目的/意义 梳理国内大数据杀熟相关文献研究现状,概括研究特征,使学术研究更好地服务于数字经济的发展实践。方法/过程 采用文献计量法和主题分析法,归纳大数据杀熟现有的性质界定,从算法、数据、平台的角度分析大数据杀熟背景下的算法伦理、算法权力、算法治理、数据权利、信息保护、用户隐私、滥用市场、博弈行为、反垄断研究。结果/结论 当前国内大数据杀熟研究呈现出以下特点:问题研究与时俱进;多学科研究成为常态;注重借鉴国外经验。未来的发展方向为:加强实证研究、跨学科合作研究,重视技术层面的研究,拓展法律领域的研究可提高大数据杀熟的深度与广度。关键词:大数据杀熟 价格歧视 算法 信息保护分类号:G251引用格式:李诗苗,张丽,张立彬.国内大数据杀熟研究述评 J/OL.知识管理论坛,2022,7(6):674-691 引用日期.http:/ 引言据中国信息通信研究院中国数字经济发展白皮书(2021)报告,2020 年数字经济快速发展,成为构建新发展格局的关键支撑1。数字经济带来了市场形态的新变化,以互联网平台为基础的线上交易成为商品交易的重要形式。但这一过程也引发了大数据杀熟等系列问题。2017年底,新浪微博网友“廖师傅廖师傅”自述被大数据“杀熟”的经历,引发社会热议。2018 年,科技日报一则“大数据杀熟:最懂你的人伤你最深”的新闻再次引起了公众的关注。大数据杀熟的案例在国外早已有之,亚马逊网站在 2000 年实施的差价定价试验是大数据杀熟的早期实践。借助于算法工具,各网络平台为不同的用户定制相应的价格,这在一定程度上构成了大数据杀熟现象。大数据杀熟又被称为算法合谋、算法歧视、算法消费者价格歧视、价格歧视。自大数据杀熟现象被曝光以后,公众对其的关注热度不减,各种关于大数据的调查和讨论不绝于耳。大数据杀熟涵盖对象(用户)、675主体(平台)、方法(大数据算法)等因素。无论是个性化定价还是大数据杀熟,用户在数据环境下都处于相对劣势的地位。由于平台账户和设备终端的个体独立性,用户在使用过程中极易形成所谓的信息茧房行为,从而使得“千人千价”的现象更加不易被察觉。平台是实行大数据算法的主导方,在这个过程中,通过收集用户数据、构建用户画像,向用户推荐信息,形成用户接受范围内的价格水平。在此期间,平台拥有绝对的算法权力,通过强制性的用户服务策略,搜集用户性别、喜好、消费习惯等来实现不同用户的不同服务。随着智能终端的普遍应用,学者们对大数据杀熟的现象日益关注。大数据杀熟事件被公开报道以来,我国学者对大数据杀熟的原因、过程、性质等问题进行了探讨。国内学者的研究集中于价格歧视2、消费者权益保护3、算法伦理4、个人信息保护5、反垄断6、价格欺诈7等内容。在不同的学科框架下,大数据杀熟有着不同的解释,本文试图对大数据杀熟相关的研究文献进行主题和时间层面的梳理,系统评述相关成果,以期为后续研究提供参考价值。2 文献调研本研究以中国知网、万方、维普为数据来源,以主题(CNKI)、标题或关键词(万方)、标题或关键词(维普)为检索路径,分别以“大数据杀熟”“杀熟”“价格歧视”“算法歧视”“算法共谋”“算法滥用”“算法监管”“算法伦理”“个性化定价”“定价算法”“算法推荐”“算法权力”“算法陷阱”为检索词,检索日期为2021 年 12 月 2 日,经过文献去重和与主题无关文献的数据清洗,共检索到文献 635 篇,文献年代与文献类型分布情况如图 1 所示:图 1 国内大数据杀熟研究文献年代与文献类型分布通过对比年度发文量可以发现,自大数据杀熟被列为 2018 年度十大消费侵权事件之一以来,大数据杀熟相关研究文献呈逐年上升趋势,期刊文章数量远高于报纸文章数量,表明大数据杀熟的主题得到了学界的普遍关注。随着深圳经济特区数据条例(2021)、上海市数据条例(2021)、中华人民共和国个人信息保护法(2021)、互联网信息服务算法推荐管理规定(2022)、关于推动平台经济规范健康持续发展的若干意见(2022)的颁布,大数据杀熟相关的数据立法、信息保护等话题扩展了研究的学科范围,预测该主题相关的论文数量将会持续增长。本次调研的 635 篇文献中,共有学位论文 31 篇,期刊DOI:10.13266/j.issn.2095-5472.2022.054知识管理论坛,2022(6):674-691知识管理论坛2022 年 第 6 期(总第 42 期)676论文 410 篇,表明大数据杀熟得到了专业视角领域的学术关注。在相关领域的研究中(见图 2),法学、经济学、计算机科学的文献数量分别位居前 3 名,哲学、管理学领域也均有所涉及,表明大数据杀熟属于多学科领域共同关注的话题,具体研究内容与研究特征如表 1 所示。图 2 国内大数据杀熟研究文献学科领域占比分布表 1 国内大数据杀熟相关文献研究领域、特征与内容学科领域特征研究内容法学揭示大数据杀熟的法律侵权行为和法律治理对策电子商务法、个人信息安全、价格欺诈、隐私权、公平交易权、知情权经济学大数据杀熟的经济原理和效果研究价格歧视、反垄断、消费者权益保护、差别化定价、精准营销、个性化定价、数字经济哲学大数据杀熟的伦理思辨研究算法权力、责任伦理、算法伦理、技术伦理计算机科学以大数据算法为基础的大数据杀熟技术路径研究算法歧视、隐私泄露、数据安全、用户画像、算法陷阱、算法过滤、算法歧视、算法推荐、算法黑箱、算法偏见、数据赋权管理学平台、政府、用户等多角度的宏观考察演化博弈、公民权利、数据认知、公共事务、信息茧房、信息推荐、算法传播、信息传递、媒介赋权、政治安全、政府监管、政府规制3 大数据杀熟性质界定3.1 价格歧视大数据杀熟借助数字经济平台,对不同的消费者以区别性定价,形成了经济学上的价格歧视,因此被学者定性为价格歧视行为。价格歧视理论最早由英国学者庇古于 1920 年提出,从客户分离和直接销售的假设出发,定义为垄断厂商为利润最大化所做出的行为,界定了价格歧视的 3 种理论模型,即一级价格歧视、二级价格歧视和三级价格歧视。菲利普斯在此基础上,强调同一商品价格和边际成本的不同差额。曼昆提出市场支配力的影响要素,认为企业在具有一定市场支配力的情况下有可能实施价格歧视。价格歧视为经济学中的中性名词,受成本、销售者、市场条件等多重因素影响,数字平台经济的发展加剧了信息不对称行为的产生,基于用户特征的大数据杀熟被视为价格歧视,研究者基于经济学理论,研究大数据杀熟的特征与定性,关注价格歧视产生的影响。一是大数据杀熟的本质认定,企业使用算法对商品进行定价,构成了大数据杀熟中差异化定价结果。大数据杀熟被认定是本质上的完全价格歧视行为,属于经济学的市场细分定价行为,与差异化定价有着效率关系上的差别8。大数据杀熟被看作是大数据与算法技术发展到一定阶段的产物,如果不加以规制会造成负面影响9。二是大数据杀熟的正当性。大数据杀熟是否应定性为价格歧视行为,梁正和曾雄10认为,导致不同用户不同价格的因素众多,大数据杀熟的部分行为是正当的价格歧视,不应该完全被否定或禁止。朱程程认为,大数据杀熟行为被视为法学上的价格歧视行为,主要表现为:对实施者进行限制,具有交易商品的相似性与价格的歧视性,严重损害市场竞争秩序11。3.2 价格欺诈差别化定价是大数据杀熟的重要表现,从法律角度来看,有可能涉及价格欺诈。按照相关法律的解释,价格欺诈是“经营者利用虚假的或者使人误解的标价形式或者价格手段,欺677骗、诱导消费者或者其他经营者与其进行交易的行为”12。从主观目的出发,大数据杀熟被法学领域的研究者界定为价格欺诈行为,并对其进行了法律定性。依据电子商务法价格法消费者权益保护法等法律法规,大数据杀熟是经营者滥用信息优势、在主观上故意实施的行为,违背消费者的真实意愿,与现实中的差别定价行为有着明显区别,违反了公平交易原则和消费者的知情权13,属于法律意义上的价格欺诈,在主观上有着直接故意欺诈的心理,在客观上违背了告知说明的义务,在损害后果上造成了消费者不必要的财产损失14。邹开亮和彭榕杰15指出,大数据杀熟是对商业伦理和商业文明的背弃,应定性为平台商家的价格欺诈行为,此处的“欺诈”概念宜扩展其认定外延,采用价格法中的经济法属性和立法目的定位更为适合,商家应秉承诚信原则告知消费者,否则便构成了消极价格欺诈。3.3 算法歧视大数据杀熟依托于特定的算法,考察其形成过程,研究者将其定性为算法歧视。由大数据“数据采集、数据存储、数据计算和商业应用”的技术路径出发,朱建海16将大数据杀熟的实质认定为算法价格歧视,并认为杀熟主要体现在算法与应用两个方面。廖建凯17指出,大数据杀熟通过算法的设计,运用计算机技术对消费者的个人数据进行分析与处理,构建消费者的精准画像,具有突出的技术特征,是经营者滥用算法权力的典型表现。企业通过授权条款或用户协议等越权采集用户数据,掌握用户的注册信息、实用信息、“对撞”信息等个性化特征,为不同的用户提供不同性质的商品和价格,实行精细化营销,实质上是网络平台对用户数据过度利用的后果14。4 大数据杀熟研究主题分析为方便对相关文献进行主题分析,本文对文献关键词进行词频统计,通过高频词汇归纳出学者关注的大数据杀熟主题,共得到 28 个词频大于 30 的高频词,具体如表 2 所示:表 2 国内大数据杀熟研究高频词序号关键词词频序号关键词词频1数据44815伦理532算法24316权益533价格21617反垄断514歧视21418互联网505消费者16719市场506平台10620技术447杀熟9121监管448信息8522人工智能439规则8023用户4110保护7424在线5911法律7225网络3712个人6526大数据3413旅游5527治理3314定价5428电商30DOI:10.13266/j.issn.2095-5472.2022.054知识管理论坛,2022(6):674-691知识管理论坛2022 年 第 6 期(总第 42 期)678大数据杀熟相关的高频词汇具有以下特征:以“数据”为中心的词汇占比较高,数据(448 次)、大数据(34 次)、信息(85 次)等反映了大数据杀熟的主要焦点为数据问题。围绕算法治理的话题,算法(243次)、伦理(53次)、人工智能(43 次)等是大数据杀熟的技术难点。涉及经济学领域的词汇数量最多,消费者(167 次)、定价(54 次)、反垄断(51次)等体现了大数据杀熟实际作用于经济领域之中。词频在 100 次以上的关键词有:数据、算法、价格、歧视、消费者、平台,表明学者对大数据杀熟的研究集中于用户数据、算法规则、平台和效果影响,尤其以杀熟的基础(即数据)和过程(即算法)的研究居多。词频在50 次以上的关键词有:杀熟、信息、规则、保护、法律等,大数据杀熟涉及现有法律的诸多问题,如何保护个人信息是需要考虑的首要问题。词频在 50 次以下的关键词有:技术、监管、人工智能等,人工智能环境下的监管问题受到重视。其中,算法领域的关键词词频中,算法伦理、算法治理、算法权力、算法黑箱、算法规制分别占比 15.33%、10.95%、5.84%、5.84%、4.38%,属于大数据杀熟算法研究的高频词汇;数据领域的关键词词频中,信息保护、数据权利、用户隐私、数据