项目背景
某国有大型银行总行数据中心大规模使用云计算平台,在虚拟化环境中,部署着几千台虚拟机。为了保证云计算平台的稳定性和可用性,需要大量的运维人员进行日常维护,不但增加了运维成本,而且无法做到故障的提前预警。
数据中心经过长时间的对比,于2010年采购了Foglight来对云平台进行管理。
系统架构
实施效果

建立起对整个虚拟资源池容量和利用率的可见性

建立起分析模型,模拟容量变化的影响

预测容量不足,使数据中心容量服务能够始终满足业务的需求

建立起从应用系统的角度来监视性能的机制

对虚拟环境的性能进行预警

和数据中心M2平台整合,将虚拟化环境的报警通过短信方式提醒管理人员

建立性能报表,管理人员可以直观的了解整个虚拟化环境状态

提前了解到虚拟化环境可能出现的问题,避免故障发生,减少故障率

减少虚拟化环境的运维压力

建立重点虚拟平台的性能视图,使运维人员可以直观的了解平台性能,避免因性能导致宕机从而影响业务

根据历史记录可以快速定位导致故障的原因

能够对各种平台的虚拟机进行混合管理,包括VMWARE,HYPER-V

基于服务水平等级、基础架构费用及自定义的硬件成本,建立起计费模型

帮助数据中心分析各应用系统所占用的成本,同时使得业务部门可以了解其运作的IT成本

针对总行将来日益增加的子公司的托管以及资源申请需求,数据中心内部云落地后,也可通过该模式探索各种托管服务水平下产生的费用计算问题