本书由微信公众号“狗熊会”(ID: CluBear)创始人王汉生教授(熊大)及其核心团队联合创作完成。本书可以被看作商业分析领域入门级通俗且有趣的读物,深入浅出,雅俗共赏,适合数据分析师、工程师、产品经理、销售人员、商务拓展人员以及数据企业高管阅读。
本书主要由六章组成。第一章介绍了熊大朴素的数据价值观,解读数据与价值的逻辑关系;第二章介绍了最基本的数据可视化方法(统计图表)的规范与有趣应用;第三章介绍了回归分析,通过精彩案例展示了如何将一个业务问题定义成一个数据可分析问题;第四章介绍了机器学习,可以看作对第三章技术上的一个重要补充;第五章展示了各种常见的非结构化数据(文本、图像)分析的有趣案例;第六章介绍了数据合规的相关内容。
......(更多)
王汉生,北京大学光华管理学院商务统计与经济计量系教授、博士生导师。曾获国家杰出青年科学基金项目资助。教育部“长江学者”特聘教授,全国工业统计学教学研究会青年统计学家协会创始会长,美国数理统计学会(IMS)会员,美国统计协会(ASA)会员,国际统计学会(ISI)当选会员。历任9种国际学术期刊副主编。在国内外各种专业刊物上发表文章100余篇,与人合著英文专著1本,与人合著中文教材4本。爱思唯尔中国高被引学者(数学类,2014—2019年;应用经济学类,2020年;统计学类,2021—2022年)。主要研究领域为变量选择、数据降维、高维数据分析以及复杂网络数据分析,所有这些研究都以大规模、复杂、超高维数据分析为核心,其相关应用领域包括但不局限于中文文本、网络结构、位置轨迹。
曾担任博雅立方科技有限公司首席科学家(2009—2015年)、百分点首席统计学家(2015年至今)。此外,和量邦科技、考拉征信、彩虹无线、蓬景数字、西门子、三一重工、格灵深瞳、天罡仪表、广联达等众多企业有联合研究工作,涉及量化投资、互联网征信、车联网、移动设备广告实时竞价、搜索引擎营销、电子商务、重装制造业等多个重要行业。
......(更多)
绪论 大数据时代之“皇帝的新装”
第一章 朴素的数据价值观
什么是数据?
数据的商业价值
数据到价值的转化:回归分析的道与术
弄清客户需求
关于p值的争论与思考
第二章 数据可视化
实力派:准确+有效
偶像派:简洁+美观
柱状图
堆积柱状图
柱状图之妙用
饼 图
直方图
折线图
散点图
箱线图
茎叶图
统计表
第三章 回归分析
什么是回归分析?
线性回归:北京市二手房房价影响因素分析
线性回归:电影票房影响因素分析
线性回归:数据分析岗位招聘情况解析
0-1回归:某移动通信公司客户流失预警分析
0-1回归:车险数据分析与商业价值
0-1回归:点击率预测在RTB广告投放中的应用
定序回归:信用卡逾期数据分析
计数回归:英超进球谁最强
生存回归:新产品在架时长研究
第四章 机器学习
朴素贝叶斯:政府热线电话
朴素贝叶斯:基于商品名称的多分类问题
决策树:什么因素决定非诚勿扰
决策树:二手车保值比率
回归树与提升算法:旅游产品销量影响因素
深度学习:图像自动识别
深度学习:LSTM模型自动作曲
深度学习:打麻将
聚类分析:狗熊牌皮鞋的广告投放
第五章 非结构化数据
文本分析:《琅琊榜》的小说三要素
文本分析:《倚天屠龙记》
文本分析:从用户评论看产品改善
文本分析:网易云音乐评论数据分析
网络结构数据:《甄嬛传》中的爱恨情仇
网络结构数据:统计期刊合作者社区发现
图像数据:通过图片识别PM2.5
第六章 数据合规
我国cookie隐私第一案
“被遗忘权”第一案
数据安全第一案
......(更多)
......(更多)