分享
开源大数据分析引擎Impala实战.pdf
下载文档

ID:2361935

大小:39.64MB

页数:348页

格式:PDF

时间:2023-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
开源大 数据 分析 引擎 Impala 实战
内容简介Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala 1.0版比原来基于MapReduce的Hive SQL查询速度提升390倍,因此,Impala有可能完全取代Hive。作者基于自己在本职工作中应用mpala的实践和心得编写了本书。本书共分10章,全面介绍开源大数据分析引擎Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。本书紧扣目前计算技术发展热点,适合所有大数据分析人员、大数据开发人员和大数据管理人员参考使用。本书封面贴有清华大学出版社防伪标签,无标签者不得销售版权所有,侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(CP)数据开源大数据分析引擎Impala实战/贾传青著.-北京:清华大学出版社,2015ISBN978-7-302-39002-2I.开.贾L.关系数据库系统IV.TP311.138中国版本图书馆CP数据核字(2015)第005181号责任编辑:夏非彼封面设计:王翔责任校对:闫秀华责任印制:出版发行:清华大学出版社网址:http:/.cm,http/地址:北京清华大学学研大厦A座邮编:100084社总机:010-62770175邮购:010-62786544投稿与读者服务:010-62776969,c-service(质量反馈:010-62772015,zhiliangtup.tsinghua.edu.cm印刷者:装订者:经销:全国新华书店开本:190mm260mm印张:21.75字数:557千字版次:2015年3月第1版印次:2015年3月第1次印刷印数:13000定价:59.00元产品编号:057645-01Cloudera官方推荐序(中文)大数据,作为目前工业界的主要技术趋势,定位于转化工业界的每一个细分市场,推动企业运用其数据开展业务的革命,并从根本上改变了支撑现代社会的T基础架构。毫无疑问,大数据对中国意义重大,它给中国T业的创新带来了巨大机会,没有其他任何一个国家比中国有更多的人口、更多的设备和更多的数据。目前Hadoop是用于大数据的优选平台解决方案。作为Hadoop技术以及提供Hadoop解决方案的领导者,Cloudera不仅提供经过了业界验证的Hadoop平台解决方案,也提供功能强大的工具帮助企业用户充分利用Cloudera企业版Hadoop解决他们的业务问题。Impala就是Cloudera开发的众多强大工具之一。Impala是为了在Hadoop上实现低延迟的SQL查询而设计开发的,它原生地运行在Hadoop/HBase存储系统和元数据之上,因此它继承了Hadoop的灵活性、伸缩性和经济性,具有分布式本地化处理的特性以避免网络瓶颈,它与现有Hadoop/CDH的、基于工业标准的SQL接口兼容。它支持交互式SQL,比最新版本的Hive快很多倍。由于Impala的这些优势,它受到了全球企业用户的热烈欢迎。看到将为中国读者发布的这一本中文版Impala书籍,我非常欣喜,这无疑对中国用户更好地使用Hadoop,解决他们的业务问题有很大帮助。因此,我要感谢所有为发布本书做出贡献的人们。最后,也要感谢广大读者对Impala的喜爱,以及你们在大数据一这一令人激动的T发展方向上所做的贡献!苗凯翔博士Cloudera副总裁

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开