《网站运维:保持数据实时的秘技》的各位合作者以自己的亲身经历,从不同的侧面讲述了一个正在发展中的新兴技术领域——网站运维:职业特点、技术架构、测量与监控、开发与部署、用户体验、后端存储,以及如何应对流量激增、如何优雅地失败,特别是如何将软件开发领域中的敏捷方法应用于网站运维。阅读《网站运维:保持数据实时的秘技》,读者不仅能够学到一些具体的技术,还能够开阔眼界,因为书中不仅有具体方法的讨论,更有基于十多年运维经验的哲理思考。
《网站运维:保持数据实时的秘技》适合网站架构师、开发人员、运维人员(包括但不限于数据库管理员、系统管理员、网络管理员、发布管理员等)阅读,同时也适合项目经理等管理人员阅读。
......(更多)
......(更多)
目录
序 xi
前言 xiii
第1章 作为职业的Web运维 1
Theo Schlossnagle
为什么Web运维如此艰难? 1
从学徒到师傅 4
结语 9
第2章 Picnik如何应用云计算:所学到的教训 10
Justin Huff
什么地方适合云计算(以及为什么!) 11
什么地方不适合云计算(对Picnik而言) 17
结语 18
第3章 基础架构与应用程序测量 19
John Allspaw, Matt Massie
时间分辨率和存留时间的考虑 20
测量数据采集与存储的地点 21
测量数据的层次 22
为异常检测和报警提供环境 25
日志记录也是测量数据 26
将变化管理和事件的时间线建立关联 27
给测量数据加入报警机制 28
使用测量数据建立加载-反馈机制 29
展示一个测量数据采集系统:Ganglia 32
结语 43
第4章 连续部署 44
Eric Ries
小批量意味着更快的反馈 44
小批量意味着问题即刻被本地化 44
小批量能够减少风险 45
小批量可以降低总开销 45
质量卫士的挽歌 47
让我们开始吧 50
连续部署用于关键任务应用 54
结语 57
第5章 作为代码的基础架构 58
Adam Jacob
面向服务体系结构 60
结语 71
第6章 监控 72
Patrick Debois
故事:“旅程的开端” 72
步骤1:理解你在监控什么 76
步骤2:理解正常行为 84
步骤3:有备而学 90
结语 93
第7章 复杂系统是如何失败的 94
John Allspaw和Richard Cook
复杂系统是如何失效的 94
进一步的读物 101
第8章 社区管理与Web运维 103
Heather Champ和John Allspaw
第9章 处理非预期的访问量激增 112
Brian Moon
一切是如何开始的 112
警报连连 113
扑灭烈火 114
周末逃生 115
未雨绸缪 116
救命稻草CDN 116
代理服务器 116
围剿踩踏 117
将代码基流水化 118
我们怎么知道它能否工作? 119
真实测试 120
学到的教训 120
自那以来的改进 121
第10章 开发者与运维者的协调与合作 122
Paul Hammond
部署 123
共享、开放的基础架构 126
信任 128
随叫随到的开发人员 131
避免指责 135
结语 137
第11章 你的访问者感觉怎么样:面向用户的测量 139
Alistair Croll和Sean Power
为什么要采集面向用户的测量数据? 140
是什么使网站变得很慢? 144
测量延迟 147
编写SLA 153
访客结果:分析 155
市场营销关心的其他测量数据 160
用户体验如何影响Web运维 161
Web监控的未来 162
结语 167
第12章 将关系数据库用于Web的战略战术 169
Baron Schwartz
Web数据库需求 170
典型的Web数据库是如何增长的 175
对集群的渴望 181
数据库战略 186
数据库战术 193
结语 198
第13章 如何优雅地失败:事后处理的艺术与科学 200
Jake Loomis
最糟的事后分析 200
什么是事后分析? 201
什么时候引入事后分析 203
邀请谁参加事后分析 204
进行事后分析 204
事后分析的后续工作 205
结语 207
第14章 存储 208
Anoop Nagwani
数据资产的库存 208
数据保护 211
容量规划 218
存储大小的变化 219
运维 221
结语 223
第15章 非关系数据库 224
Eric Florenzano
NoSQL数据库概览 225
某些系统细节 228
结语 238
第16章 敏捷基础架构 239
Andrew Clay Shafer
敏捷基础架构 241
那么,问题是什么? 244
兴趣与实践的社区 253
贸易区和道歉 253
结语 256
第17章 夜间鬼魅(以及如何高枕无忧) 257
Mike Christina
术语 258
多少个9? 259
影响持续时间对事件持续时间 260
数据中心数量(footprint) 261
逐渐失效 262
不信赖任何人 263
故障转移测试 264
监控和历史模式 264
高枕无忧 265
合作者 267
索引 271
......(更多)
甚至还有一个OpenGL应用,将集群中的每个节点描绘为一条鱼。。。
一旦用户的迁移任务进入队列,则锁定该用户的帐号。。。
Experience is, in its very essence, making good judgements, and it is gained by making bad ones. Watching theory and practice collide is both scary and beautiful.
......(更多)