《统计学习导论:基于R应用》读者对象是那些希望运用统计学习前沿技术分析数据的人士,既包括统计学专业的师生,也包括非统计学专业的从业者。
......(更多)
作者:(美国)加雷斯·詹姆斯(Gareth James) (美国)丹妮拉·威滕(Daniela Witten) (美国)特雷弗·哈斯帖(Trevor Hastie) (美国)罗伯特·提布施瓦尼(Robert Tibshirani) 译者:王星
......(更多)
目录
中文版序
译者序
前言
第1章导论
1.1统计学习概述
1.2统计学习简史
1.3关于这本书
1.4这本书适用的读者群
1.5记号与简单的矩阵代数
1.6本书的内容安排
1.7用于实验和习题的数据集
1.8本书网站
1.9致谢
第2章统计学习
2.1什么是统计学习
2.2评价模型精度
2.3实验:R语言简介
2.4习题
第3章线性回归
3.1简单线性回归
3.2多元线性回归
3.3回归模型中的其他注意
事项
3.4营销计划
3.5线性回归与K最近邻法的
比较
3.6实验:线性回归
3.7习题
第4章分类
4.1分类问题概述
4.2为什么线性回归不可用
4.3逻辑斯谛回归
4.4线性判别分析
4.5分类方法的比较
4.6R实验:逻辑斯谛回归、LDA、QDA和KNN
4.7习题
第5章重抽样方法
5.1交叉验证法
5.2自助法
5.3实验:交叉验证法和自助法
5.4习题
第6章线性模型选择与正则化
6.1子集选择
6.2压缩估计方法
6.3降维方法
6.4高维问题
6.5实验1:子集选择方法
6.6实验2:岭回归和lasso
6.7实验3:PCR和PLS回归
6.8习题
第7章非线性模型
7.1多项式回归
7.2阶梯函数
7.3基函数
7.4回归样条
7.5光滑样条
7.6局部回归
7.7广义可加模型
7.8实验:非线性建模
7.9习题
第8章基于树的方法
8.1决策树基本原理
8.2装袋法、随机森林和提升法
8.3实验:决策树
8.4习题
第9章支持向量机
9.1最大间隔分类器
9.2支持向量分类器
9.3狭义的支持向量机
9.4多分类的SVM
9.5与逻辑斯谛回归的关系
9.6实验:支持向量机
9.7习题
第10章无指导学习
10.1无指导学习的挑战
10.2主成分分析
10.3聚类分析方法
10.4实验1:主成分分析
10.5实验2:聚类分析
10.6实验3:以NCI60数据为例
10.7习题
......(更多)
It turns out that R2 will always increase when more variables are added to the model, even if those variables are only weakly associated with the response.
1. 是否至少一个自变量能够预测因变量 2. 预测因变量的究竟是所有自变量,还是部分自变量 3. 模型究竟有多准? 4. 就已有的自变量数据,究竟该预测怎样的因变量,以及预测地有多准
......(更多)