分享
大数据:从基础理论到最佳实践.pdf
下载文档

ID:2356715

大小:55.90MB

页数:342页

格式:PDF

时间:2023-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
数据 基础理论 最佳 实践
内容简介本书侧重于大数据的实践性技术,系统地介绍了主流大数据平台及工具的安装部署、管理维护和应用开发。平台和工具的选择均为当前业界主流的开源产品,因此,对于读者来说,有很强的可操作性。本书涉及的开源技术包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Stom、Kaka、Flume等。除介绍一般性的背景知识、安装部署、管理维护和应用开发技术外,还特别注重案例实践,重要的技术点以实际工作场景或案例为依托,使读者能快速入门,参考案例动手实践,通过具体深入的实践,体会大数据的技术本质特征,领略大数据技术带来的创新理念,更好地理解和把握信息技术的发展趋势。本书主要内容包括以下几大部分。大数据存储篇:以HDFS为基础,介绍分布式文件系统的原理、安装、s命令的使用、编程,介绍如何用HDFS实现,并通过HTTP调用。大数据计算篇:以MapReduce、YARN为基础,介绍分布式计算的原理、部署,以及编程案例。非关系型数据库篇:以HBase为基础,重点介绍非关系型数据库的优势、原理、部署,以及命令行使用,编程案例,与Sqoop配合使用等。大数据仓库篇:以Hv、数据仓库等为基础,重点介绍数据的抽取、原理、部署、分析与编程。大数据实时计算篇:以Stom、Kafka为基础,介绍实时计算的架构、组成、使用与开发。本书非常适合从事大数据技术开发与使用的初学者,以及从事大数据技术研发的企事业单位工程师学习和参考,也适合高校计算机相关专业的专科生、本科生和研究生学习使用。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。版权所有,侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(CP)数据大数据:从基础理论到最佳实践/祁伟主编.一北京:清华大学出版社,2017ISBN978-7-302-45743-5I.大.祁.数据处理W.TP274中国版本图书馆CIP数据核字(2016第290300号责任编辑:杨作梅装帧设计:杨玉兰责任校对:张瑜责任印制:出版发行:清华大学出版社网址:http:/.cm,http:/地址:北京清华大学学研大厦A座邮编:100084社总机:010-62770175邮购:010-62786544投稿与读者服务:010-62776969,c-质量反馈:010-62772015,印刷者:装订者:珍销:全国新华书店本:185mm260mm印张:21.5字数:499千字版次:2017年1月第1版印次:2017年1月第1次印刷印数:13000定价:59.80元产品编号:069305-01

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开