温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
删除:大数据取舍之道
维克托·迈尔
删除
数据
取舍
维克托
迈尔
版权信息本书纸版由浙江人民出版社于2012年12月出版作者授权湛庐文化(Cheers Publishing)作中国大陆(地区)电子版发行(限简体中文)版权所有侵权必究书名:删除:大数据取舍之道著者:(英)维克托迈尔-舍恩伯格字数:180000电子书定价:24.99美元中文版序 大数据取舍之道几乎没人能够想象,没有了互联网的世界将会怎样。互联网赋予了公民权利,大大提升了经济效率,带来了不计其数的创新爆发。数以亿计的人正在使用互联网购物,便捷轻松地与人沟通,分享观点。然而,互联网的全球化意味着,完整的数字化记忆以及“记忆成为常态”所带来的诸多挑战,不仅存在于伦敦和旧金山,在北京和上海也同样令人关注。跨越了地理上的界线,完整的数字化记忆正在挑战着我们所有人。因此,本书所传达的信息对于亚洲的互联网用户同样也很重要。有人认为,完整的数字化记忆在非民主社会更加危险,因为非民主社会中公民无法直接限制政府利用从网上收集到的海量私人信息。但是,这种观点却遗漏了关键的一点,那就是:大量数字化的私人信息不仅可能在今天被滥用,在几年甚至几十年后仍然可能被滥用。所以,从某种程度上讲,一个人是否生活在民主社会,与数字化记忆是否被滥用并无必然关系。如果私人信息被抓取后,以数字形式在未来被储存了很久很久,那么,即便生活在民主社会,它仍然像一颗定时炸弹因为,未来任何非民主政府都可以利用这极具价值的信息权力宝藏。假设真正的危险并非来自于政府机构滥用信息权力,而是来自于巨大的商业机构这些商业机构借助自己位于全球信息流中战略瓶颈的优势地位,获得我们相当多的私人信息流,那么又将会怎样呢?就像对政府那样,我们只能希望,像Google和facebook这样的巨型网络公司能够清楚地知道,他们对于收集并保存的几十亿项私人信息所负有的责任。我们不知道未来将会怎样:会拥有什么样的商业平台以及他们会以何种目的去挖掘自己积累的私人信息宝藏?他们会不会滥用我们的私人信息?正因如此,我们要开始思考减少我们的数字足迹:不是通过戒掉互联网,而是通过塑造互联网及其服务,以使得数字信息能够真正在一段时间之后被渐渐遗忘。如此看来,数字化记忆给所有互联网用户带来了一连串的挑战,不管他们生活在世界的哪个角落。这也许是我们需要牢牢记住的最根本最重要的信息。我不是新勒德分子1,不鼓吹与全球互联网断开连接。我的建议恰恰相反,那就是:充分运用互联网使其发挥全部潜能;并且,通过给互联网设置遗忘的功能,以确保互联网被那些大权在握之人当作工具滥用的可能性越来越小,而让互联网一直充当创新、沟通和赋予权利的工具。我在书中描述过的许多情况每天仍然在发生:被互联网抓取到的信息量在突飞猛进地增加。在2000年,世界范围内绝大部分信息是以模拟形式记录的,而今天,世界上90%以上的信息是数字形式的因此能够毫不费力地进行存储、加工、操作和发送。不仅在电脑上浏览互联网时如此,智能手机里的多种传感器也是如此。它们能够抓取日期、时间、地理位置,甚至是从汽车的加速度、行驶方向到大气压强等一切信息。手机上安装的应用程序使得置于床垫下面的智能手机能够获取我们的夜间睡眠模式,而嵌在小手镯里的芯片能够记录我们的运动。一家美国运动服装公司现在甚至在出售拥有内置显示器的滑雪眼镜,这款眼镜不仅能够捕捉我们的位置以及我们滑下坡时的速度,而且还能告诉我们要找的朋友在哪里。这一切都很重要,运用强大的统计工具,我们能够理解抓取到的大量数据,而且能够提取其中一些潜在的价值。“大数据”运动就像互联网一样,将会在世界和社会的运行方式上带来跨越式的变革。借助大数据,我们会有更好的医疗措施,更少的意外事故,更高效的市场格局,以及对社会更好的理解与认知。但是,“大数据”也会增加抓取更多数据以及将它存储更长时间的压力,对数据的过分痴迷会让人唯恐丢失一些可能获得的潜在价值。在这个背景下,完整数字化记忆的隐患需要的不仅仅是重复提醒它们需要被不断强调!我相信,删除将会在未来很多年对我们理解互联网具有深远的价值。只有这样做,才能确保互联网一直是经济和社会进步的智慧源泉,而非大权在握之人赋权的工具。而且,只有这样做,才能确保在进入“大数据”时代后,我们不必害怕会失去隐私,会失去人性化的生活与行动。我是一个乐观主义者,所以我会乐观地号召所有人,要在大数据时代始终记得遗忘的美德。1 勒德,19世纪初参加捣毁机器运动的英国手工业工人,强烈反对机械化或自动化。后用勒德主义者指仇视一切新奇发明乃至科技进步的人。作者注推荐序 因意义而智慧中国社科院信息化研究中心秘书长互联网周刊主编姜奇平维克托的删除:大数据取舍之道到底在讲什么?英美人写书,总爱从细节到细节,进行无穷无尽的经验归纳,就像素描一样,一笔一笔地在相近的地方重复描摹。大家的时间都有限,让我用演绎的方法,谈谈这本书的逻辑,就像速写那样,几笔让你看出画的是什么。大艺术家罗丹说:“什么是雕塑?就是在石料上去掉那些不要的东西。”删除,就是当大数据这堆石料越来越多后,去掉那些不要的东西。去掉不要的,为的是让雕像留下来。雕像就是意义所在。简单地说,大数据的取舍之道,就是把有意义的留下来,把无意义的去掉。这本书到此就可以算读完了。不过也许你还有五分钟时间,那就可以听我多说两句,以便对这本书更加知其然。删除这本书为什么值得你读?一个重要原因是它来得恰是时机。大数据刚刚兴起,在你被数据灌满之前,先教你如何删除,省得你的硬盘和大脑,在数据海啸到来后,成了无用信息的垃圾场。删除这本书的缘起,是2007年作者偶然产生的“被遗忘的权利”这个灵感。作者的一位朋友向他鼓吹计算“无处不在”,他却反其道强调遗忘的重要,也就是不要让数据“无处不在”。大家都有这种体会,信息少的时候,脑子还清楚;等到信息爆炸后,脑子反而乱了。删除这本书,像念经似的,翻来覆去就在重复两个词:记忆,遗忘。这不奇怪,因为记忆与遗忘的斗争,构成了数据的核心矛盾。正如作者所说:“在数字时代,或许人类发生的最根本的改变,就是记忆和遗忘的平衡已经反转了。将信息提交给数字存储器已经成为默认状态,而遗忘则成了例外。”以前数据过少的时候,想记、该记的没记下来;如今数据过多的时候,想忘、该忘的忘不了。大脑就像仓库一样,没用的东西占的地方太多了,需要清一清。删除就在教你如何清扫大脑内的垃圾。作者写这本书,是为了向你说明“怎样才能够确保在数字时代的未来我们还会记得遗忘的重要性”,并为此“恢复我们遗忘的能力”。也就是不要让乱七八糟的东西过多占据我们的大脑和硬盘。作者教给你的,相当于罗丹的石料去除术。如果你还有十分钟,我还想跟你谈谈,如何理解这本书的所以然。如果你光就这本书读这本书,可能也会被绕进去。因为作者把主要篇幅,都用在教你如何去掉石料中不需要的部分,但是并没有讲透石料中保留的雕像到底是什么。其实,你只有明白自己到底要雕的是什么,才能明白去掉石料的所以然。换句话说,你只有理解了在大数据中,你需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。否则,你就会一直凿,直到石料都快没了的时候,才忽然问自己:咦,我凿它干什么呢?雕像是意义。意义是决定哪些数据值得保留(记忆),哪些数据需要删除(遗忘)的根据。罗丹在雕塑的时候,不是在做刀削面,不是为了把东西全去掉完事,而是为了一件正事,就是雕出像来。维克托在新作大数据时代中解决了前面遗留的问题,他对大数据进行了详细的解释。大数据只是客体,本身并不能决定自己有用还是没用。有用还是没用,是相对于主体来说的。对人有意义的数据,就是雕像,就是该保存的回忆;对人没意义的数据,就是应去掉的石料,就是该删除的垃圾。对这个人有意义的,对那个人可能没有意义。因此,不同的人,要根据自己认同的特殊意义,来决定数据的取舍。智慧与非智慧,是取舍的结果。取有意义的,舍无意义的,叫智慧;取无意义的,舍有意义的,叫愚蠢。大数据因有意义而变得智慧,这就是取舍中“取”这一半的道,它是删除“舍”那一半道的所以然。合在一起,才是取舍之道。进一步,取之有道,这个道可以点破了说,就是要明白在决定遗忘什么的时候,先明白到底要回忆什么。其中的道,在于柏拉图意义上的回忆。其实,回忆与遗忘,是欧洲文化中一个经典隐喻,有特别的含义。例如贝尔纳斯蒂格勒技术与时间:爱比米修斯的过失谈的记忆与遗忘,就是这种意义上的。对柏拉图来说,真正的回忆,不是对现世的回忆(即一件事一件事的回忆),而是对彼岸的回忆(即对“人是什么”的认同,也就是对意义的认同)。他在斐德若中说“见到尘世的美,就回忆起上界里真正的美”。还原到现实中来,就是各种回忆中与自己的存在意义最息息相关的回忆。在数据这堆石料背后,真正存在的“雕像”,就是人的意义本身。罗丹心目中的雕像,反映的正是他所认同的意义。他根据这种认同,来决定“删除”哪些石料,那一定是同意义无关的。同样,在未来的大数据时代,每个人都是罗丹,每个人只需要保留那些可供“回忆”有意义事物的数据,而删除那些无意义的数据。删除的对与不对,有效与无效,完全取决于我们对自己的认识。从这个意义上说,“认识你自己”这句阿波罗神庙上的箴言,应该成为删除行为的真正标准。删除的最高境界,就是不删除,也就是知道你需要保留的东西。目录第一部分 大数据时代为什么要进行信息的取舍01 当遗忘变成例外,而记忆成了常态:大数据时代的隐忧喝醉的海盗一个没有遗忘的时代抹不掉的致幻剂阴影Google记得你的一切大数据的信息力量人类住进了数字圆形监狱让我们学会遗忘02 遗忘,人类的天性:遗忘的作用与人类记忆的演进人类的本能记忆语言记忆外部记忆:绘画与文本共享记忆介质记忆:摄影、磁带与胶片第二部分 大数据时代如何进行信息的取舍03 世界已经被设置成记忆模式:数字化记忆发展的4大驱动力小黑盒子与麦克斯存储扩展器驱动力1:数字化驱动力2:廉价的存储器驱动力3:易于提取驱动力4:全球性覆盖04 一个没有安全与时间的未来:数字化记忆的两大威胁信息富民VS信息贫民:信息控制权的威胁永久的过去VS被忽视的现在:时间的威胁05 来一场“互联网遗忘”运动:应对数字化记忆与信息安全的6大对策对策1:数字化节制对策2:保护信息隐私权对策3:建设数字隐私权基础设施对策4:调整人类的现有认知对策5:打造良性的信息生态对策6:完全语境化06 给信息一个存储期限:应对数字化记忆与信息安全的关键对策cookie的警告信息的存储期限元信息,设定信息的寿命9个月,不断缩短的存储期限设定存储期限的技术措施不是用技术删除,而是让遗忘复活谁来掌控存储期限我们需要“能衰退”的存储系统07 让遗忘回归常态:大数据时代数字化记忆的未来后记第一部分 大数据时代为什么要进行信息的取舍01 当遗忘变成例外,而记忆成了常态:大数据时代的隐忧对于人类而言,遗忘一直是常态,而记忆才是例外。然而,由于数字技术与全球网络的发展,这种平衡已经被打破了。如今,往事正像刺青一样刻在我们的数字皮肤上,遗忘已经变成了例外,而记忆却成了常态在这个记忆已经成为常态的时代,难道每个公开自己信息的人只能永远对信息束手无策吗?我们真的想要一个由于无法遗忘,而永远不懂得宽恕的未来吗?未来可能遭遇到的悲剧,会对我们现在的行为产生寒蝉效应。借助数字化记忆,圆形监狱能够随时随地监视我们。事实上,并不是技术迫使我们去记忆。技术只是促进了遗忘的终止而只有当我们迫切想要记住的时候,遗忘才会被终止。喝醉的海盗史黛西施奈德(Stacy Snyder)最大的梦想就是成为一名教师。在2006年春天,这位25岁的单身母亲已经完成了她的学业,并且对她未来的事业充满了期待。但是她的梦想破碎了。她心仪的学校明确地告诉她,她不能成为一名教师,虽然她已经修满了所有的学分,通过了所有的考试,完成了所有的实习训练而且在许多方面成绩优异。然而,她被取消了当教师的资格,理由是,她的行为与一名教师不相称。她的行为?校方指的是一张网上的照片,照片里的她头戴一顶海盗帽子,举着塑料杯轻轻啜饮着。史黛西施奈德曾将这张照片放在MySpace她的个人网页上,并且取名为“喝醉的海盗”。这张照片她是给朋友看的,也许只是为了搞怪而已。然而,在史黛西