温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
深入浅出Python机器学习
深入浅出
Python
机器
学习
_14495477
版权所有,严禁传桶,.iJj者自负法律责任?目录第1章概述1.1 什么是机器学习一一从一个小故事开始I002 1.2 机器学习的一些应用场景一一蝙蝠公司的业务单元I003 1.3 机器学习应该如何入门一一世上无难事I005 1.4有监督学习与无监督学习I007 1.5 机器学习中的分类与回归I008 1.6 模型的泛化、过拟合与欠拟合I008 1.7 小结I009 第2章基于Python语言的环境配置2.1 Python的下载和安装I012 2.2 Jupyter Notebook的安装与使用方法I013 2.2.1 使用pip进行JupyterNotebook的下载军!安装I013 2.2.2运行Jupyter Notebook I 014 2.2.3 Jupyter Notebook的使用方法I015 2.3 一些必需库的安装及功能简介I017 2.3.1 Numpy一一基础科学计算库I017 2.3.2 Scipy一一强大的科学计算工具集I018 2.3.3 pandas一数据分析的利器I019 2.3.4 matplotlib一画出优美的图形I020 深入浅出Pytho门机器学习2.4 scikit-leam一一非常流行的Python机器学习库I021 2.5 小结I022 第3章K最近邻算法一一近朱者赤,近墨者黑3.1 K最近邻算法的原理I024 3.2 K最近邻算法的用法I025 3.2.1 k最近邻算法在分类任务中的应用I025 3.2.2 K最近邻法处理多元分类任务I029 3.2.3 K最近邻算法用于回归分析I031 3.3 K最近邻算法项目实战一一酒的分类I034 3.3.1 对数据集进行分析I034 3.3.2 生成训练数据集和测试数据集I036 3.3.3 使用K最近邻算法进行建棋I038 3.3.4 使用模型对新样本的分类进行预测I039 3.4 小结I041 第4章广义线性模型一一“耿直”的算法模型4.1 线性模型的基本概念I044 4.1.1 线性模型的一般公式I044 4.1.2 线性模型的图形表示I045 4.1.3 线性模型的特点I049 4.2 最基本的线性模型一一线性回归I050 4.2.1 线性回归的基本原理I050 4.2.2 线性回归的性能表现I051 4.3 使用L2正则化的线性模型一一岭回归I053 4.3.1 岭回归的原理I053 4.3.2 岭回归的参数调节I054 4.4 使用Ll正则化的线性模型一一套索回归I058 4.4.1 套索回归的原理I058 4.4.2 套索回归的参数调节I059 4.4.3 套索回归与岭回归的对比I060 卫D4.5 小结I062 第5章朴素贝叶斯一一打雷啦,收衣服啊5.1 朴素贝叶斯基本概念I064 5.1.l 贝叶斯定理I064 5.1.2 朴素贝叶斯的简单应用I064 5.2 朴素贝叶斯算法的不同方法I068 5.2.1 贝努利朴素贝叶斯I068 5.2.2 高斯朴素贝叶斯I071 5.2.3 多项式朴素贝叶斯1on 5.3 朴素贝叶斯实战一一判断肿瘤是良性还是恶性I075 5.3.1 对数据集进行分析I016 5.3.2 使用高斯朴素贝叶斯进行建模I071 5.3.3 高斯朴素贝11十斯的学习曲线I078 5.4 小结I080 第6章决策树与随机森林一一会玩读心术的算法6.1 决策树I082 6.1.1 决策树基本原理I082 6.1.2 决策树的构建I082 6.1.3 决策树的优势和不足I088 6.2 随机森林I088 6.2.1 随机森林的基本概念I089 6.2.2 随机森林的构建I089 6.2.3 施机森林的优势和不足I092 6.3 随机森林实例一一要不要和相亲对象进一步发展I093 6.3.1 数据集的准备I093 6.3.2 用get_dummies处理数据I094 6.3.3 用决策树建模并做出预测I096 6.4 小结I098 互目三要深入浅出Python机器学习第7章支持向量机SVM一一专治线性不可分7.1 支持向量机SVM基本概念I100 7.1.l 支持向盘机SVM的原理I100 7.1.2 支持向盘机SVM的核函数I102 7.2 SVM的核函数与参数选择I104 7.2.l 不同核函数的SVM对比I104 7.2.2 支持向量机的gamma参数调节I106 7.2.3 SVM算法的优势与不足I108 7.3 SVM实例一一波士顿房价回归分析I108 7.3.1 初步了解数据集I109 7.3.2 使用SVR进行建模I110 7.4 小结I114 第8章神经网络一一曾入“冷宫”,如今得宠8.1 神经网络的前世今生I116 8.1.l 神经网络的起源I116 8.1.2 第一个感知器学习法则II 16 8.1.3 神经网络之父一一杰弗瑞欣顿I117 8.2 神经网络的原理及使用I118 8.2.l 神经网络的原理I118 8.2.2 神经网络中的非线性矫正I119 8.2.3 神经网络的参数设置I121 8.3 神经网络实例一一手写识别I127 8.3.1 使用MNIST数据集I128 8.3.2 训练MLP神经网络I129 8.3.3 使用模型进行数字识别I130 8.4 小结I131 三曰乏善第9章数据预处理、降维、特征提取及聚类一一快刀斩乱麻9.1 数据预处理I134 9.1.1 使用StandardScaler进行数据预处现I134 9.1.2 使用MinMaxScaler进行数据预处理I135 9.1.3 使用RobustScaler进行数据预处理I136 9.1.4 使用Normalizer进行数据预处理I137 9.1.5 通过数据预处理提高模型准确率I138 9.2 数据降维I140 9.2.1 PCA主成分分析原理I140 9.2.2 对数据降维以便于进行可视化I142 9.2.3 原始特征与PCA主成分之间的关系I143 9.3 特征提取I144 9.3.1 PCA主成分分析法用于特征提取I145 9.3.2 非负矩阵分解用于特征提取I148 9.4 聚类算法I149 9.4.1 K均值聚类算法I150 9.4.2 凝聚聚类算法I153 9.4.3 DBSCAN算法I154 9.5 小结I157 第10章数据表达与特征工程一一锦上再添花10.1 数据表达I160 l 0.1.1 使用哑变量转化类型特征I160 10.1.2 对数据进行装箱处理I162 10.2 数据“升维”I 166 10.2.1 向数据集添加交互式特征I166 10.2.2 向数据集添加多项式特征I170 10.3 自动特征选择I173 10.3.1 使用单一变量法进行特征选择I173 互深入浅出Pytho门机器学习10.3.2 基于模型的特征选择I178 10.3.3 迭代式特征选择I180 10.4 小结I182 第11章模型评估与优化一一只有更好,没有最好11.1 使用交叉验证进行模型评估I184 11.1.1 scikit-learn中的交叉验证法I184 11.1.2 随机拆分和“挨个儿试试”I 186 l 1.1.3 为什么要使用交叉验证法I188 11.2 使用网格搜索优化模型参数I188 11.2.l 简单网格搜索I189 11.2.2 与交叉验证结合的网格搜索I191 11.3 分类模型的可信度评估I193 11.3.1 分类模型中的预测准确率I194 11.3.2 分类模型中的决定系数I197 11.4 小结I198 第12章建立算法的管道模型一一团结就是力量12.1 管道模型的概念及用法I202 12.1.1 管道模型的基本概念I202 12.1.2 使用管道模型进行网格搜索I206 12.2 使用管道模型对股票涨幅进行回归分析I209 12.2.l 数据集准备I209 12.2.2 建立包含预处理和MLP模型的管道模型I213 12.2.3 向管道模型添如特征选择步骤I214 12.3 使用管道模型进行模型选择和参数调优I216 12.3.1 使用管道模型进行模型选择I216 12.3.2 使用管道模型寻找更优参数I217 12.4小结I220 卫第13章艾本数据处理一一亲,见字如“数”13.l 文本数据的特征提取、中文分词及词袋模型I222 13.1.1 使用CountVectorizer对文本进行特征提取I222 13.1.2 使用分词工具对中文文本进行分词I223 13.1.3 使用词袋模型将文本数据转为数组I224 13.2 对文本数据进一步进行优化处理I226 13.2.1 使用n-Gram改善词袋模型I226 13.2.2 使用tf-idfl模型对文本数据进行处理I228 13.2.3 删除文本中的停用词I234 13.3 小结I236 第14章从数据获取到话题提取一一从“研究员”到“段子手”14.l 简单页面的爬取I238 14.1.1(ft二备Requests库和Us巳IAgent I 238 14.1.2 确定一个目标网站并分析其结构I240 14.1.3 进行爬取并保存为本地文件I241 14.2 稍微复杂一点的爬取I244 14.2.1 确定目标页面并进行分析I245 14.2.2 Python中的正则表达式I247 14.2.3 使用BeautifulSoup进行HTML解析I251 14.2.4 对目标页面进行爬取并保存到本地I256 14.3 对文本数据进行话题提取I258 14.3.J 寻找目标网站并分析结构I259 14.3.2 编写爬虫进行内容爬驭I261 14.3.3 使用潜在狄利克雷分布进行话题提取I263 14.4 小结I265 GD 目兰运深入浅出Python机器学习第15章人才需求现状与未来学习方向一一你是不是下一个“大牛”15.l 人才需求现状I268 15.1.1 全球AI从业者达190万,人才需求3年翻8倍I268 15.1.2 AI人才需求集中于一线城市,七成从业者月薪过万I269 15.1.3 人才困境仍难缓解,政策支援亟不可待I269 15.2 未来学习方向I210 15.2.1 用于大数据分析的计算引擎I270 15.2.2 深度学习开源框架I271 15.2.3 使用概率模型进行推理I272 15.3 技能磨炼与实际应用I212 15.3.J Kaggle算法大赛平台和IOpenML平台I272 15.3.2 在工业级场景中的应用I273 15.3.3 对算法模型进行NB测试I273 15.4 小结I214 参考文献I215 豆第1章概述近年来,全球新一代信息技术创新浪潮迭起。作为全球信息领域产业竞争的新一轮焦点,人工智能的发展迎来了第二次浪潮,它正在推动工业发展进入新的阶段,掀起第四次工业革命的序幕。而作为人工智能的重要组成部分,机器学习也成了炙手可热的概念。本幸将向读者介绍机器学习的基础知识,为后面的学习打好基础。本幸主要涉及的知识点有:9什么是机器学习机器学习的主要应用场景9机器学习应该如何入门有监督学习和无监督学习的概念分类、回归、j乏化、过拟合与欠拟合等概念气,牛二二:气.飞;品主:r;,窍靠t.y二、.岳、;t,t;;、J川飞:有l!:,司:.,;.,s:-:i鼠忌:t、在送三哈成二.工们f.,.,一,.深入浅出Python机器学习1.1 什么是机器学习一一从一个小故事开始要搞清楚什么是机器学习,我们可以从一个小故事开始。小C是一个即将毕业的大学生、单身的小伙子,他一直在暗地里喜欢隔壁班的女神,可是又苦于没有机会接近她,于是在很长一段时间里,小C只能保持这种暗恋的状态。突然有一天,在一个很偶然的机会下,小C得到了女神的微信号,并且添加了她。然后开始密切关注她的朋友圈,观察她的一举一动。不久小C就有了重大发现,女神在朋友圈经常发三种类型的内容:书籍、电影和旅游。这可是个了不起的发现,对于小C来说,千载难逢的机会来了。接下来,小C把女神喜欢的书名和特征(Features)保存在电脑上,做成一个数据集(Data