好书推荐 好书速递 排行榜 读书文摘

统计学习方法(第2版)

统计学习方法(第2版)
作者:李航
出版社:清华大学出版社
出版年:2019-05
ISBN:9787302517276
行业:学术研究
浏览数:76

内容简介

统计学习方法即机器学习方法,是计算机及其应用领域的一门重要学科。本书分为监督学 习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k 近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM 算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配和 PageRank 算法等。除有关统计学习、监督学习和无监督学习的概论和总结的四章外,每章介绍一种方法。叙述力求从具体问题或实例入手, 由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。 为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。 本书是统计机器学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。

......(更多)

作者简介

李航 日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任职于日本NEC公司中央研究所,微软亚洲研究院高级研究员及主任研究员,现任华为诺亚方舟实验室首席科学家。北京大学、南开大学、西安交通大学客座教授。研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘。

......(更多)

目录

第一篇 监督学习

第二篇 无监督学习

第13章 无监督学习概论

13.1.1 无监督学习基本原理

13.1.2 基本问题

13.1.3 机器学习三要素

13.1.4 无监督学习方法

第14章 聚类方法

14.1 聚类的基本概念

14.1.1 相似度或距离

14.1.2 类或簇

14.1.3 类与类之间的距离

14.2 层次聚类

14.3 k均值聚类

14.3.1 模型

14.3.2 策略

14.3.3 算法

14.3.4 算法特点

本章概要

继续阅读

习题

参考文献

第15章 奇异值分解

15.1 奇异值分解的定义与性质

15.1.1 定义与定理

15.1.2 紧奇异值分解与截断奇异值分解

15.1.3 几何解释

15.1.4 主要性质

15.2 奇异值分解的计算

15.3 奇异值分解与矩阵近似

15.3.1 弗罗贝尼乌斯范数

15.3.2 矩阵的优近似

15.3.3 矩阵的外积展开式

本章概要

继续阅读

习题

参考文献

第16章 主成分分析

16.1 总体主成分分析

16.1.1 基本想法

16.1.2 定义和导出

16.1.3 主要性质

16.1.4 主成分的个数

16.1.5 规范化变量的总体主成分

16.2 样本主成分分析

16.2.1 样本主成分的定义和性质

16.2.2 相关矩阵的特征值分解算法

16.2.3 数据局正的奇异值分解算法

本章概要

继续阅读

习题

参考文献

第17章 潜在语义分析

17.1 单词向量空间与话题向量空间

17.1.1 单词向量空间

17.1.2 话题向量空间

17.2 潜在语义分析算法

17.2.1 矩阵奇异值分解算法

17.2.2 例子

17.3 非负矩阵分解算法

17.3.1 非负矩阵分解

17.3.2 潜在语义分析模型

17.3.3 非负矩阵分解的形式化

17.3.4 算法

本章概要

继续阅读

习题

参考文献

第18章 概率潜在语义分析

18.1 概率潜在语义分析模型

18.1.1 基本想法

18.1.2 生成模型

18.1.3 共现模型

18.1.4 模型性质

18.2 概率潜在语义分析的算法

本章概要

继续阅读

习题

参考文献

第19章 马尔可夫链蒙特卡罗法

19.1 蒙特卡罗法

19.1.1 随机抽样

19.1.2 数学期望估计

19.1.3 积分计算

19.2 马尔可夫链

19.2.1 基本定义

19.2.2 离散状态马尔可夫链

19.2.3 连续状态马尔可夫链

19.2.4 马尔可夫链的性质

19.3 马尔可夫链蒙特卡罗法

19.3.1 基本想法

19.3.2 基本步骤

19.3.3 马尔可夫链蒙特卡罗法与统计学习

19.4 Metropolis-Hastings算法

19.4.1 基本原理

19.4.2 Metropolis-Hastings算法

19.4.3 单分量Metropolis-Hastings算法

19.5 吉布斯抽样

19.5.1 基本原理

19.5.2 吉布斯抽样算法

19.5.3 抽样计算

本章概要

继续阅读

习题

参考文献

第20章 潜在狄利克雷分配

20.1 狄利克雷分布

20.1.1 分布定义

20.1.2 共轭先验

20.2 潜在狄利克雷分配模型

20.2.1 基本想法

20.2.2 模型定义

20.2.3 概率图模型

20.2.4 随机变量序列的可交换性

20.2.5 概率公式

20.3 LDA的吉布斯抽样算法

20.3.1 基本想法

20.3.2 算法的主要部分

20.3.3 算法的后处理

20.3.4 算法

20.4 LDA的变分EM算法

20.4.1 变分推理

20.4.2 变分EM算法

20.4.3 算法推导

20.4.4 算法总结

本章概要

继续阅读

习题

参考文献

第21章 PageRank算法

21.1 PageRank的定义

21.1.1 基本想法

21.1.2 有向图和随机游走模型

21.1.3 PageRank的基本定义

21.1.4 PageRank的一般定义

21.2 PageRank的计算

21.2.1 迭代算法

21.2.2 幂法

21.3.3 代数算法

本章概要

继续阅读

习题

参考文献

第22章 无监督学习方法总结

22.1 无监督学习方法的关系和特点

22.1.1 各种方法之间的关系

22.1.2 无监督学习方法

22.1.3 基础及其学习方法

22.2 话题模型之间的关系和特点

参考文献

附录A 梯度下降法

附录B 牛顿法和拟牛顿法

附录C 拉格朗日对偶性

附录D 矩阵的基本子空间

附录E KL散度的定义和狄利克雷分布的性质

索引

......(更多)

读书文摘

算法 2.2 (感知机学习算法的对偶形式) ... (3) 如果 y_i(\sum_{j=1}^N \alpha_j y_j x_j \dot x_i+b) \le 0, \alpha_i \leftarrow \alpha_i+\eta b \leftarrow b + \eta y_i

......(更多)

猜你喜欢

点击查看