X XX X 服务器硬件运维服务
年
月巡检报 告
XXXX 工程师:XXXX
一、
物理环境检查 检查内容 检查结果 备注 环境温度 正常 □异常 ;
环境湿度 正常 □异常 ;
清洁状况 □不清洁;□一般;□清洁;
通风状况 □一般;□好;□良好;
线缆状况 □一般;□好;□良好;
二、
服务器检查
(1) 每日上下午进行机房巡检,确认硬件没有故障,仔细聆听有无杂音和报警音。查看服务器前后指示灯有无异常,线缆链接情况。
(2) 对异常服务器进行故障诊断,通过告警灯,诊断版和诊断码进行故障的确认,有些复杂的故障则由远程 ssh 进行 cpu,磁盘和内存占用的情况查看。有条件的进行 IPMI 的管理接口链接查看日志,分析故障。
(3) 在确认故障后对保内机器提交厂家维护,过保机器则由 XX 维保。与用户协调迅速有效的解决故障。
(4) 对故障原因进行分析,故障类别进行整理,以方便建立常用操作及运行故障应急处理资料库 (5) 整理备件库,针对故障情况的分析调整备件库,以形成高效的备件库应对多发故障。
三、
故障服务器 服务器【 001 】
品牌型号:
序列号:
安装地址:X XX 机房 X XX 机柜
XX- - XXU U
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常 异常
电源指示灯
正常 □异常
磁盘指示灯
正常 □异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
正常 □异常
U CPU 使用情况
正常 □异常
内存使用情况
正常 □异常
磁盘使用情况
正常 □异常
网络连接
正常 □异常
系统日志检查
系统日志检查
正常 □异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【 002 】
品牌型号:
序列号:
06ZD337
安装地址:X XX 机房 X XX 机柜
XX- - XXU U
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
正常 □异常
电源指示灯
正常 □异常
磁盘指示灯
□正常 异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
正常 □异常
U CPU 使用情况
正常 □异常
内存使用情况
正常 □异常
磁盘使用情况
正常 □异常
网络连接
正常 □异常
系统日志检查
系统日志检查
正常 □异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【 003 】
品牌型号:
序列号:
安装地址:X XX 机房 X XX 机柜
XX- - XXU U
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常 异常
电源指示灯
正常 □异常
磁盘指示灯
正常 □异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
正常 □异常
U CPU 使用情况
正常 □异常
内存使用情况
正常 □异常
磁盘使用情况
正常 □异常
网络连接
正常 □异常
系统日志检查
系统日志检查
正常 □异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【 004 】
品牌型号:
序列号:
安装地址:X XX 机房 X XX 机柜
XX- - XXU U
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常 异常
电源指示灯
正常 □异常
磁盘指示灯
正常 □异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
正常 □异常
U CPU 使用情况
正常 □异常
内存使用情况
正常 □异常
磁盘使用情况
正常 □异常
网络连接
正常 □异常
系统日志检查
系统日志检查
正常 □异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
服务器【 005 】
品牌型号:
序列号:
安装地址:X XX 机房 X XX 机柜
XX- - XXU U
发现故障
解决故障
硬件指示灯检查
检查项目
检查结果
异常问题记录
前面板指示灯
□正常 异常
电源指示灯
正常 □异常
磁盘指示灯
□正常 异常
主机硬件检查
检查项目
检查结果
异常问题记录
系统风扇运转
正常 □异常
U CPU 使用情况
正常 □异常
内存使用情况
正常 □异常
磁盘使用情况
正常 □异常
网络连接
正常 □异常
系统日志检查
系统日志检查
正常 □异常
故障处理
解决方案
处理流程
更换备件
故障分析
备注
四、
巡检结果以及总结 巡检日期
2018 年 3 月 5 日---2018 年 3 月 31 日
巡检内容
此月巡检包括 XX 机房以及 XX 的灾备机房所有 x86 服务器 XXX 台。每日上下午各巡检一次。主要负责硬件故障的发现与排除。
检查结果
本月共巡检服务器机房:
次。其中:发现故障
处;修复故障
个;顺延至下个月的故障
个,并进行移机
台。
故障以及处理措施
1. XXX 专有云/曙光 I620-G20 内存损坏,更换内存。
2. XXX 专有云/曙光 I620-G20 主板损坏,更换主板。
3. VMware 集群 inside/浪潮 NF5280M4 内存损坏,更换内存。
4. 统计分析报送-数据节点 6/华为 RH2288HV3 硬盘损坏,更换硬盘(SAS 900GB 10K 02311HAL)。
5. 网络监控/
XXX 硬盘损坏,更换硬盘( IBM SAS 300G 10K MODEL:ST9300603SS )。
五、
服务器位置更新
于 3 月 26 下班后对以下两台服务器进行移机操作 序号
机器型号
产品序列号
应用名称
机房
位置
1
B6 31-32U->A4 7-8U 2
B6 31-32U->A4 4-5U
客户:
巡检工程师:
相关热词搜索: 巡检 维护保养 服务器