封面
版权页
内容提要
大数据专业系列图书专家委员会
序
前言
第1章 Python概述
1.1 Python简介
1.1.1 Python语言
1.1.2 Python与机器学习
1.1.3 Python环境配置
1.2 Python基础知识
1.2.1 固定语法
1.2.2 运算符
1.2.3 数据类型
1.2.4 Python I/O
1.3 控制语句
1.3.1 条件语句
1.3.2 循环语句
1.4 函数
小结
课后习题
第2章 NumPy数值计算
2.1 ndarray的创建与索引
2.1.1 创建ndarray
2.1.2 ndarray的索引和切片
2.2 ndarray的基础操作
2.2.1 变换ndarray的形态
2.2.2 排序与搜索
2.3 ufunc
2.3.1 ufunc的广播机制
2.3.2 常用ufunc运算
小结
课后习题
第3章 pandas基础
3.1 pandas常用类
3.1.1 Series
3.1.2 DataFrame
3.1.3 Index
3.2 DataFrame基本操作
3.2.1 索引
3.2.2 排序
3.2.3 合并
3.3 其他数据类型操作
3.3.1 时间操作
3.3.2 文本操作
3.3.3 category操作
小结
课后习题
第4章 pandas进阶
4.1 数据的读取与写出
4.1.1 CSV
4.1.2 Excel
4.1.3 数据库
4.2 DataFrame进阶
4.2.1 统计分析
4.2.2 分组运算
4.2.3 透视表和交叉表
4.3 数据准备
4.3.1 缺失值处理
4.3.2 重复数据处理
4.3.3 连续特征离散化处理
4.3.4 哑变量处理
小结
课后习题
第5章 Matplotlib绘图
5.1 Matplotlib绘图基础
5.1.1 编程风格
5.1.2 动态rc参数
5.2 分析特征关系常用图形
5.2.1 散点图
5.2.2 折线图
5.3 分析特征内部数据状态常用图形
5.3.1 直方图与条形图
5.3.2 饼图
5.3.3 箱线图
小结
课后习题
第6章 scikit-learn
6.1 数据准备
6.1.1 标准化
6.1.2 归一化
6.1.3 二值化
6.1.4 独热编码
6.2 降维
6.2.1 PCA
6.2.2 ICA
6.2.3 LDA
6.3 分类
6.3.1 Logistic回归
6.3.2 SVM
6.3.3 决策树
6.3.4 KNN
6.3.5 朴素贝叶斯
6.3.6 随机森林
6.3.7 多层感知机
6.4 回归
6.4.1 最小二乘回归
6.4.2 岭回归
6.4.3 Lasso回归
6.5 聚类
6.5.1 K-Means
6.5.2 层次聚类
6.5.3 DBSCAN
6.5.4 GMM
6.6 模型验证
6.6.1 数据集划分
6.6.2 交叉验证
6.6.3 自动调参
6.6.4 模型评价
小结
课后习题
第7章 餐饮企业综合分析与预测
7.1 餐饮企业需求分析
7.1.1 餐饮企业现状与需求
7.1.2 餐饮企业数据基本状况
7.1.3 餐饮企业数据分析的步骤与流程
7.2 数据准备
7.2.1 统计每日用餐人数与销售额
7.2.2 数据预处理
7.3 使用K-Means算法进行客户价值分析
7.3.1 构建RFM特征
7.3.2 构建K-Means模型
7.3.3 K-Means模型结果分析
7.4 使用决策树算法实现餐饮客户流失预测
7.4.1 构建客户流失特征
7.4.2 构建客户流失预测模型
7.4.3 分析决策树模型结果
小结
课后习题
第8章 通信运营商用户流失分析与预测
8.1 通信运营商用户流失需求分析
8.1.1 通信运营商现状与需求
8.1.2 通信运营商数据基本情况
8.1.3 通信运营商用户流失分析与预测的步骤与流程
8.2 数据准备
8.2.1 数据去重与降维
8.2.2 数据清洗
8.2.3 数据合并
8.3 特征工程
8.3.1 独热编码
8.3.2 合并预处理后的数据集
8.4 使用MLP算法实现通信运营商用户流失预测
8.4.1 数据集划分与数据标准化
8.4.2 构建用户流失预测模型
8.4.3 模型评价
小结
课后习题
更新时间:2025-04-01 15:05:55