本书以统计学史上著名人物的伟大成就为脉络,将数据分析这一学科的发展历程娓娓道来。从开普勒仰望星空拉开统计学序幕,贝叶斯提出主观概率,到人工智能、深度学习逐步渗透今天的日常生活。本书带领读者在数据科学的熠熠星光下,看透大数据的深邃内核。
......(更多)
项亦子,毕业于于上海海洋大学信息与计算科学,毕业后长期从事数据分析领域的工作,对统计学和数据分析有浓厚的兴趣和独到的见解。
......(更多)
001/序言
007/前言
009/第1 章 开普勒拉开序幕
013/ 1.1 托勒玫的谢幕与哥白尼的登场
018/ 1.2 开普勒及其处女作《宇宙的奥秘》
022/ 1.3 开普勒与第谷的世纪合作
024/ 1.4 研究从地球开始的第二定律——面积律
027/ 1.5 研究火星轨道得到的第一定律——椭圆律
030/ 1.6 第三定律及《宇宙和谐论》横空出世
037/第2 章 统计学的早期思想
041/ 2.1 讲课风格如孔子的康令
044/ 2.2 格朗特及其《观察》
046/ 2.3 《观察》中的创新思想
049/ 2.4 后继者配第
051/ 2.5 掷骰子显明上帝的旨意
055/ 2.6 从意大利到法国
061/ 2.7 惠更斯和数学期望
063/ 2.8 雅各布·伯努利和他的《猜度术》
065/ 2.9 天才棣莫弗和他的《偶然论》
068/ 2.10 科尔莫戈罗夫与现代概率论
075/第3 章 异端贝叶斯的传世遗作
084/ 3.1 神秘的贝叶斯
086/ 3.2 正概率问题和逆概率问题
087/ 3.3 什么是条件概率
089/ 3.4 因为对称而美丽的贝叶斯定理
093/ 3.5 主观概率是什么
097/ 3.6 杰弗里斯发现地核组成
100/ 3.7 图灵破译“恩尼格码”密码机
103/ 3.8 现代精算师和贝叶斯统计学
106/ 3.9 瓦尔德和萨维奇的贝叶斯决策论
110/ 3.10 珀尔和他的贝叶斯网络
115/ 3.11 诠释思考的贝叶斯方法
125/第4 章 数学王子高斯的误差分布
129/ 4.1 最小二乘法的问世与他的主人勒让德
132/ 4.2 众人探索误差分布
135/ 4.3 数学王子高斯登场
142/ 4.4 拉普拉斯的贡献
145/ 4.5 社会物理学鼻祖——凯特勒
148/ 4.6 高尔顿提出“回归”概念
153/ 4.7 计算机视觉里用于曲线拟合的最小二乘法
163/第5 章 统计学之父皮尔逊
167/ 5.1 埃奇沃思——一位喜欢文艺的理科男
170/ 5.2 后正态分布初期世人盲目
176/ 5.3 皮尔逊用矩法导出皮尔逊曲线族
179/ 5.4 1900年诞生的x2统计量
181/ 5.5 1901年主成分分析被引入统计学
189/第6 章 第一次统计学革命
195/ 6.1 费希尔与皮尔逊令人唏嘘的争论
199/ 6.2 论战的调停者——“student”戈塞特
202/ 6.3 沿着高斯的路前进
205/ 6.4 著名的实验——“女士品茶”
209/ 6.5 费希尔用方差分析提出挑战
213/ 6.6 奈曼和艾贡·皮尔逊的合作
216/ 6.7 指数族以及广义线性模型
219/ 6.8 费希尔的又一杰作
221/ 6.9 费希尔信息量拉开统计学新篇章
231/第7 章 扎德独辟蹊径
236/ 7.1 大哲人罗素和“模糊性”
239/ 7.2 康托尔留下的“后遗症”
244/ 7.3 扎德的模糊集合
249/ 7.4 模糊逻辑之你的头发都被数算过
251/ 7.5 模糊逻辑之模糊推理入门
253/ 7.6 模糊数学与你家的洗衣机有何关系
257/ 7.7 被日本模糊数学家改造后的数据分析
267/ 7.8 模糊现象和随机现象到底不同在哪里
270/ 7.9 模糊数学与人工智能之间的联系
279/第8 章 分形统计学进驻金融领域
283/ 8.1 从早期的数学怪物谈起
288/ 8.2 芒德布罗和他的分形几何
293/ 8.3 1919年豪斯道夫提出连续空间概念
300/ 8.4 巴舍利耶开创传统金融理论
303/ 8.5 现代金融大厦
308/ 8.6 芒德布罗与棉花之谜
310/ 8.7 由尼罗河洪水谜团引出的长期记忆性
316/ 8.8 为什么分数维可以比较好地度量股票风险
318/ 8.9 分形分布能撼动正态分布吗
323/ 8.10 新的阵地:当今复杂网络研究中的幂律分布
333/第9 章 用作绩效管理的数据包络分析
341 / 9.1 数据包络分析的先驱法雷尔和思想源头帕累托
347/ 9.2 数据包络分析是一种极具特色的非参数方法
350/ 9.3 建立在线性规划理论上的数据包络分析
355/ 9.4 丹齐格与线性规划中的单纯形法
358/ 9.5 线性规划中的对偶问题
360/ 9.6 查恩斯和库珀的第一个数据包络分析模型
366/ 9.7 数据包络分析在企业绩效评价中的应用
370/ 9.8 中国学者的重大贡献
372/ 9.9 数据包络分析与传统回归方法
374/ 9.10 数据包络分析潜入数据挖掘领域
383/第10 章 不愧为“暴力美学”的计算统计
388/ 10.1 现代蒙特卡洛方法
394/ 10.2 计算统计中的蒙特卡洛方法源头
398/ 10.3 用蒙特卡洛方法求解定积分
400/ 10.4 马尔科夫的杰作
405/ 10.5 20世纪十个最重要的算法之一
406/ 10.6 马尔科夫链蒙特卡洛方法应用于贝叶斯分析
410/ 10.7 重采样方法的思想来源和孟买码头上的大批黄麻
412/ 10.8 刀切法开创近代重采样方法
415/ 10.9 埃弗隆对刀切法的再思考——自助法
418/ 10.10 埃弗隆用图展示自助法的几何图景
420/ 10.11 重采样方法是如何应用在集成学习中的
431/第11 章 辅佐人工智能的第二次统计学革命
435/ 11.1 听司马贺讲讲到底什么是“学习”
438/ 11.2 群星璀璨达特茅斯会议
443/ 11.3 感知器的诞生与“学习理论”
446/ 11.4 瓦普尼克提出的统计学习理论“高观点”
451/ 11.5 专家系统堪比行业专家
453/ 11.6 辛顿对瓦普尼克的反击
456/ 11.7 乐存与卷积神经网络
463/ 11.8 1995年瓦普尼克开创支持向量机
467/ 11.9 辛顿发起深度学习的成功逆袭
471/ 11.10 “女性化”的学习方法——转导推理
473/ 11.11 天下没有免费的午餐
474/ 11.12 通往通用人工智能之路
485/第12 章 谷歌式大数据分析
489/ 12.1 大数据确切指什么
491/ 12.2 大数据的统计限制“邦弗朗尼原理”
494/ 12.3 大数据时代重要的思维——关联规则
499/ 12.4 佩奇和布林创始谷歌网页排名算法
507/ 12.5 谷歌的广告算法
509/ 12.6 谷歌云计算之MapReduce算法
516/ 12.7 云计算后谷歌公司去向哪里
518/ 12.8 “谷歌式”科技将取代人类智慧吗
520/ 12.9 大数据对我们日常生活的影响
......(更多)
机器学习是如今红透了的人工智能的一个子领域,研究的是如何让计算机模拟人类的学习行为,从经验数据出发,通过学习不断提高自己完成某项任务的能力。机器学习的三大主题是预测、聚类和分类,朴素贝叶斯分类器属于其中的一个主题一分类,简单来说分类是从一系列给定类别的数据出发,为下一个未知类别的数据归类。
......(更多)