书目

Ganglia系统监控

内容简介

《Ganglia系统监控》由Ganglia的设计者和维护人员亲自执笔,知识性和权威性毋庸置疑。本书不但展示了如何从任意规模的集群、网格或云基础架构中收集系统指标并使其可视化,而且为如何针对20000台主机每10秒跟踪一次CPU利用率等问题提供答案。一旦你知晓Ganglia的主要部件如何协同工作,就会明白Ganglia是解决上述问题的最佳选择。本书颇具实践性,可以帮助经验丰富的系统管理员更好地运用Ganglia3.X。《Ganglia系统监控》还可以帮助你了解如何扩展基本的指标库,取回当前指标数值,查看指标的汇聚视图,观察数据时序的趋势。你也可以通过一些实际Ganglia案例了解它是如何满足监控的一些需求的。■判断Ganglia是否适合你的工作环境。■了解Ganglia的gmond和gmetad后台程序是如何建立一个临时指标集合的。■根据一些有价值的提示和建议,在部署Ganglia的早期制订可扩展的计划。■利用gweb和Ganglia的Web客户端进一步可视化数据。■编写插件来扩展gmond的指标集。■如何解决安装Ganglia时可能遇到的问题。■如何将Ganglia和sFlow以及Nagios监控系统集成。

作者简介

MattMassie,2000年在加利福尼亚大学伯克利分校担任研究员时开发了Ganglia。他设计的Ganglia实现了对遍布整个美国,用于科学研究的共享计算机网格集群的监控。2010年,在O扲eilly出版的由JohnAllspaw和JesseRobbins编写的WebOperations:KeepingtheDataOnTime一书中,他撰写了关于集群监控的一个章节。Matt现在Cloudera担任软件工程师,聚焦于ApacheHadoop企业管理与监控。BernardLi,担任劳伦斯伯克利国家实验室高性能计算系统工程师,目前也是Ganglia系统的维护工程师。他从2003年开始涉及高性能计算领域并致力于很多开源项目,如OSCAR、SystemImager和Warewulf。BradNicholes,是Apache软件基金会的成员,目前在Novell担任软件工程师顾问。除了参与ApacheHTTPD和APR项目,Brad也是Ganglia项目的开发者和管理员。作为Ganglia项目的开发人员,Brad开发了C/C++和Python指标模块,并将其集成至GangliaV3.1.x。目前Ganglia系统提供的部分指标模块,最初是由他开发贡献的。Brad毕业于犹他大学(UniversityofUtah)和杨百翰大学(BrighamYoungUniversity),拥有计算机科学学位。VladimirVuksan(Broadcom),在技术操作、系统工程和软件开发领域工作超过15年。就职于Broadcom之前,他曾在RaveMobileSafety、Demandware和新墨西哥大学(UniversityofNewMexico)开发高可用性解决方案和使管理和基础设施运行更容易的工具。

目录

丛书

O’Reilly精品图书系列

—  END  —