我们已经见证了社交媒体、智能手机以及其他科技奇迹的诞生与进化,这些科技工具让我们能够以前所未见的规模和深度采集并处理有关人类行为的数据,从而为研究人类社会提供了一个全新的路径。这本书是一部里程碑式的作品,它将彻底改变下一代社会科学家和数据科学家探索世界的方式。
大数据的10个共同特征是什么?
如何通过数据预测美国总统大选的结果?
如何在短时间内对100万个星系进行分类?
大规模数据采集面临着怎样的道德伦理困境?
科技公司是否在监视我们的行为,数字时代是不是将我们带进了“全景监狱”呢?
在计算社会学这一新兴领域,作者阐述了数字革命如何扭转了社会科学家和数据科学家观察行为、提出问题、开展实验和进行大规模协作的方式,详细描述了大批真实的案例,并且划定了面临伦理挑战时需要遵循的4项原则。
这本书用全新的数据模式解锁了社会学。对社会科学家来说,它是一本跨界指南之书;对数据科学家来说,它是一本素养提升之作。
......(更多)
马修•萨尔加尼克(Matthew J. Salganik)
普林斯顿大学社会学教授,同时任职于该校的信息技术政策中心、数据与机器学习中心等。《科学》杂志评价他是“纯然的计算社会学家”。他的研究方向是社会网络、计算社会学。他的研究曾被微软、脸谱网和谷歌资助,并被《纽约时报》《华尔街日报》《经济学人》《纽约客》等主流媒体报道,美国公共广播电台还专题报道过他的研究成果。
......(更多)
前 言 // VII
第 1 章 简介
1.1 一处墨迹 // 003
1.2 欢迎来到数字时代 // 005
1.3 研究设计 // 009
1.4 本书的主题 // 010
1.5 本书梗概 // 013
第 2 章 观察行为
2.1 简介 // 019
2.2 大数据 // 020
2.3 大数据的 10 个共同特征 // 023
2.3.1 海量性 // 024
2.3.2 持续性 // 028
2.3.3 不反应性 // 030
2.3.4 不完整性 // 031
2.3.5 难以获取 // 035
2.3.6 不具代表性 // 037
2.3.7 漂移 // 042
2.3.8 算法干扰 // 044
2.3.9 脏数据 // 046
2.3.10 敏感性 // 049
2.4 研究策略 // 051
2.4.1 计数 // 052
2.4.2 预测和临近预测 // 054
2.4.3 近似实验 // 059
2.5 结论 // 071
第 3 章 提问
3.1 简介 // 077
3.2 提问与观察 // 080
3.3 调查误差总框架 // 081
3.3.1 代表性 // 084
3.3.2 测量 // 087
3.3.3 成本 // 092
3.4 向谁提问 // 092
3.5 提问的新方法 // 102
3.5.1 生态瞬时评估法 // 104
3.5.2 维基调查 // 107
3.5.3 游戏化 // 112
3.6 与大数据资源相结合的调查 // 114
3.6.1 丰富型提问 // 115
3.6.2 扩充型提问 // 121
3.7 结论 // 130
第 4 章 开展实验
4.1 简介 // 133
4.2 什么是实验 // 136
4.3 实验的两个维度:实验室 – 实地以及模拟 – 数字 // 138
4.4 超越简单实验 // 145
4.4.1 效度 // 151
4.4.2 处理效应的异质性 // 156
4.4.3 原理 // 159
4.5 使实验成为现实 // 163
4.5.1 利用现有环境开展实验 // 165
4.5.2 创建自己的实验 // 170
4.5.3 创建自己的产品 // 174
4.5.4 与有能力的组织合作 // 175
4.6 建议 // 181
4.6.1 创造零可变成本数据 // 182
4.6.2 将道德伦理融入你的设计:替代、改进和减少 // 190
4.7 结论 // 196
第 5 章 进行大规模协作
5.1 简介 // 201
5.2 人本计算 // 203
5.2.1 星系动物园 // 205
5.2.2 政治宣言的公众编码 // 212
5.2.3 结论 // 216
5.3 公开征集 // 218
5.3.1 网飞奖 // 219
5.3.2 蛋白质折叠游戏 // 222
5.3.3 公众专利评审 // 225
5.3.4 结论 // 228
5.4 分布式数据采集 // 231
5.4.1 观鸟数据库 // 232
5.4.2 照片城 // 235
5.4.3 结论 // 238
5.5 设计你自己的大规模协作项目 // 241
5.5.1 激励参与者 // 242
5.5.2 利用异质性 // 243
5.5.3 集中注意力 // 244
5.5.4 允许惊喜 // 244
5.5.5 合乎道德伦理 // 246
5.5.6 最后的设计建议 // 247
5.6 结论 // 249
第 6 章 道德伦理
6.1 简介 // 253
6.2 三个事例 // 256
6.2.1 情绪感染项目 // 256
6.2.2 “3T”项目 // 258
6.2.3 “Encore”项目 // 259
6.3 数字时代的不同 // 261
6.4 四项原则 // 267
6.4.1 对人的尊重原则 // 268
6.4.2 有利化原则 // 269
6.4.3 公正原则 // 272
6.4.4 对法律和公共利益的尊重原则 // 273
6.5 两种道德框架 // 276
6.6 困难面 // 278
6.6.1 知情同意 // 278
6.6.2 理解与管理信息化风险 // 282
6.6.3 隐私权 // 291
6.6.4 面对不确定性做出决策 // 295
6.7 实用技巧 // 299
6.7.1 机构审查委员会是底线,不是上线 // 299
6.7.2 换位思考 // 301
6.7.3 将研究伦理视作连续的而非离散的过程 // 302
6.8 结论 // 302
历史附录 // 304
第 7 章 未来
7.1 展望 // 313
7.2 未来主题 // 313
7.2.1 现成品与定制物之间的融合 // 313
7.2.2 以参与者为中心的数据采集 // 315
7.2.3 研究设计中的道德伦理 // 316
7.3 回到开始 // 317
致 谢 // 319
参考文献 // 327
......(更多)
《贝尔蒙报告》认为,遵循有利化原则是研究人员对参与者的义务,它涉及两部分:(1)不伤害,(2)最大程度保障有利及最小程度造成伤害(如果无法避免)。
......(更多)