AIX巡检报告以及操作手册.docx
- 文档编号:8919437
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:12
- 大小:18.65KB
AIX巡检报告以及操作手册.docx
《AIX巡检报告以及操作手册.docx》由会员分享,可在线阅读,更多相关《AIX巡检报告以及操作手册.docx(12页珍藏版)》请在冰点文库上搜索。
AIX巡检报告以及操作手册
巡检报告单
机器型号:
序列号:
检查时间:
_______年____月____日
1. 机房环境:
温度 □符合要求 □不符合
湿度 □符合要求 □不符合
2. 机器清洁(根据需要清洁机器各部件):
□已清洁□不需要
3. 检查系统硬件情况:
设备故障灯是否有亮 □有 □无
是否有其他否异常情况(如硬盘、风扇异常的声音,电缆破损)
□有 □无
4. 系统错误报告(ErrorLog):
有否硬件故障 □有 □无
故障内容:
若有硬件,运行故障诊断分析错误报告(eg:
diag-edhdisk1)
结论(如SRN,FRU等):
有否软件故障 □有 □无
故障内容:
结论:
5. 有否发给root用户的错误报告(mail):
□有 □无
结论:
6. 检查hacmp.out,smit.log,bootlog等:
□正常 □不正常
7. 文件系统的使用率不大于80%:
□是 □否
8. 查看卷组信息(lsvg-lvg_name),有没有"stale"状态的逻辑卷:
□是 □否
若有,用syncvg命令修复"stale"逻辑卷。
备注:
9. 系统性能,有否性能瓶颈(topas,vmstat等):
□有 □无
交换区使用率是否超过70%(lsps-s),实际值____
CPU是否繁忙(sar110),idle值_____
I/O平衡(iostat1)
10. 备份:
有否合符要求的系统备份:
□有 □无
最近一次系统备份的时间_________
有否符合要求的用户数据备份:
□有 □无
有否符合要求的用户数据备份:
□有 □无
磁带机是否需要清洗:
□需要 □不需
11. 通信:
网卡的状态、IP地址、路由表等:
□正常 □不正常
网卡通信(ping):
□正常 □不正常
/etc/hosts文件或DNS设置:
□正常 □不正常
12. 系统DUMP设置是否正确:
□正常 □不正常
13. HACMP测试:
ClusterVerification:
□正常 □不正常;
相关参数设置检查:
□正常 □不正常
(根据需要)接管测试:
□正常 □不正常
14. 系统硬件诊断:
系统板、CPU、内存、I/O板:
□正常 □不正常
网卡、SCSI卡、SSA卡:
□正常 □不正常
系统其他扩展卡:
□正常 □不正常
硬盘、磁盘阵列:
□正常 □不正常
磁带机、磁带库:
□正常 □不正常
15. 查系统参数是否正确:
□是 □否
I/Opacing:
HighWaterMark/LowWaterMark:
33/24
Syncd:
10
Aio:
available
/etc/environment文件中TZ不应有夏时制
Hacmp系统中PowerMonitor子系统应关闭
16. 补丁程序(PTF)检查,现有补丁维护版本为_____:
根据系统运行状况决定是否安装新的PTF。
需要安装的补丁程序:
17. 运行#snap–ac,生成文件命名为snap+s/n.pax.Z。
18. 检查errdemon,srcmstr是否正常运行:
□是 □否
巡检内容及操作指导
1.IBMRS6000小型机机房要求:
1. 机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。
2. 温度(摄氏℃)
10℃-40℃
湿度(%)
8%-80%
2. 设备故障灯分类:
主机故障灯
面板上不能有数字显示,如果有的话,说明系统有故障。
FAStT700磁盘阵列故障灯
告警灯为黄色表示有故障
磁带机故障灯
告警灯为黄色说明有故障或磁带机太脏,须清洗。
3. 系统错误报告(ErrorLog)的检查:
硬件故障检测命令:
#errpt-dH-TPERM
若有故障执行命令#errpt-a-dH-TPERM>/tmp/harderror.log保存,分析结果报告给客户
软件故障检测命令:
#errpt-dS-TPERM
若有故障执行命令#errpt-a-dS-TPERM>/tmp/softerror.log保存,分析结果报告给客户
4. 有否发给root用户的错误报告(mail):
1. 观察所有未读消息,注意有关diagela的消息。
2. 常用命令:
h[
t[
n Displaynextmessage.
q Quit
3. 对发现的问题详细分析,结果报告给客户
5. 文件系统的检查:
命令:
#df–kP
%Used为文件系统的使用率。
所有文件系统的使用率不能大于80%
6.磁带机清洁的检查:
命令:
#/usr/lpp/diagnostics/bin/utape-cdrmt0–n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。
6. 通信系统的检测:
1. 网卡的状态
命令:
#ifconfig–a
输出判断:
en0:
flags=7e080863
inet192.168.1.3netmask0xffffff00broadcast192.168.1.255
主备网卡的flag为UP属正常。
同时检查ip地址和netmask是否正确。
2. 路由的检测
命令:
#lsattr–Elinet0
hostname shaixsvrHostName True
gateway Gateway True
route Route True
bootup_optionno SerialOpticalNetworkInterfaceTrue
rout6 FDDINetworkInterface True
authm 65536 AuthenticationMethods True
3. 网络的检测
命令:
#ping[ipaddress]
输出判断:
用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。
RAID的Hotspare属性是否打开
#smittyssaraidChange/ShowAttributesofanSSARAIDArray
检查EnableUseofHotSpares属性是否为YES
8.系统DUMP设置的检查
命令:
#sysdumdev–l
输出判断:
结果应为
primary /dev/hd6
secondary /dev/sysdumpnull
copydirectory /var/adm/ras
forcedcopyflag TRUE
alwaysallowdump FALSE
dumpcompression OFF
若不正确请用下列命令修改:
#sysdumdev–P–p/dev/hd6–s/dev/sysdumpnull
9.HACMP配置检测:
ClusterVerification:
命令:
#/usr/sbin/cluster/diag/clconfig-v'-tr'
输出判断:
结果无Fail项输出。
10.系统硬件诊断:
命令顺序为:
1.#diag
2.Enter
3.DiagnosticRoutines
4.SystemVerification
5.AllResources
6.F7
输出判断:
结果应为Notroublewasfound.
11.补丁程序(PTF)的检查
1. 系统维护补丁版本为ML05,检查命令为:
#instfix–i|grepML
12.系统参数的检查
1.HIGHwatermarkforpendingwriteI/Os
#lsattr-Elsys0|grepmaxpout
输出判断:
结果应为
maxpout 33 HIGHwatermarkforpendingwriteI/Osperfile True
2.LOWwatermarkforpendingwriteI/Os
#lsattr-Elsys0|grepminpout
输出判断:
结果应为
minpout 24 LOWwatermarkforpendingwriteI/Osperfile True
更改命令为:
#chdev-lsys0-amaxpout='33'-aminpout='24'
3.Syncd参数
#grepsyncd/sbin/rc.boot
输出判断:
结果应为
nohup/usr/sbin/syncd10>/dev/null2>&1&
更改命令为:
#vi/sbin/rc.boot
4.aio参数
#lsdev-Ccaio
输出判断:
结果应为
aio0Available AsynchronousI/O
#lsattr-Elaio0
输出判断:
结果应为
minservers1 MINIMUMnumberofservers True
maxservers10 MAXIMUMnumberofservers True
maxreqs 4096 MaximumnumberofREQUESTS True
kprocprio 39 ServerPRIORITY True
autoconfigavailableSTATEtobeconfiguredatsystemrestartTrue
fastpath enable Stateoffastpath True
更改命令为:
#smittyaio
5.Limits文件的设置:
#ulimit–a
输出判断:
结果应为
time(seconds) unlimited
file(blocks) 2097151
data(kbytes) 262144 //尤其是这项参数
stack(kbytes) 32768
memory(kbytes) 32768
coredump(blocks) 2097151
nofiles(descriptors)2000
更改命令为:
#vi/etc/security/limits
更改data为524288
巡检内容及操作指导
1.IBMRS6000小型机机房要求:
1. 机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。
2. 温度(摄氏℃)
10℃-40℃
湿度(%)
8%-80%
2. 设备故障灯分类:
主机故障灯
面板上不能有数字显示,如果有的话,说明系统有故障。
FAStT700磁盘阵列故障灯
告警灯为黄色表示有故障
磁带机故障灯
告警灯为黄色说明有故障或磁带机太脏,须清洗。
3. 系统错误报告(ErrorLog)的检查:
硬件故障检测命令:
#errpt-dH-TPERM
若有故障执行命令#errpt-a-dH-TPERM>/tmp/harderror.log保存,分析结果报告给客户
软件故障检测命令:
#errpt-dS-TPERM
若有故障执行命令#errpt-a-dS-TPERM>/tmp/softerror.log保存,分析结果报告给客户
4. 有否发给root用户的错误报告(mail):
1. 观察所有未读消息,注意有关diagela的消息。
2. 常用命令:
h[
t[
n Displaynextmessage.
q Quit
3. 对发现的问题详细分析,结果报告给客户
5. 文件系统的检查:
命令:
#df–kP
%Used为文件系统的使用率。
所有文件系统的使用率不能大于80%
6.磁带机清洁的检查:
命令:
#/usr/lpp/diagnostics/bin/utape-cdrmt0–n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。
6. 通信系统的检测:
1. 网卡的状态
命令:
#ifconfig–a
输出判断:
en0:
flags=7e080863
inet192.168.1.3netmask0xffffff00broadcast192.168.1.255
主备网卡的flag为UP属正常。
同时检查ip地址和netmask是否正确。
2. 路由的检测
命令:
#lsattr–Elinet0
hostname shaixsvrHostName True
gateway Gateway True
route Route True
bootup_optionno SerialOpticalNetworkInterfaceTrue
rout6 FDDINetworkInterface True
authm 65536 AuthenticationMethods True
3. 网络的检测
命令:
#ping[ipaddress]
输出判断:
用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。
RAID的Hotspare属性是否打开
#smittyssaraidChange/ShowAttributesofanSSARAIDArray
检查EnableUseofHotSpares属性是否为YES
8.系统DUMP设置的检查
命令:
#sysdumdev–l
输出判断:
结果应为
primary /dev/hd6
secondary /dev/sysdumpnull
copydirectory /var/adm/ras
forcedcopyflag TRUE
alwaysallowdump FALSE
dumpcompression OFF
若不正确请用下列命令修改:
#sysdumdev–P–p/dev/hd6–s/dev/sysdumpnull
9.HACMP配置检测:
ClusterVerification:
命令:
#/usr/sbin/cluster/diag/clconfig-v'-tr'
输出判断:
结果无Fail项输出。
10.系统硬件诊断:
命令顺序为:
1.#diag
2.Enter
3.DiagnosticRoutines
4.SystemVerification
5.AllResources
6.F7
输出判断:
结果应为Notroublewasfound.
11.补丁程序(PTF)的检查
1. 系统维护补丁版本为ML05,检查命令为:
#instfix–i|grepML
12.系统参数的检查
1.HIGHwatermarkforpendingwriteI/Os
#lsattr-Elsys0|grepmaxpout
输出判断:
结果应为
maxpout 33 HIGHwatermarkforpendingwriteI/Osperfile True
2.LOWwatermarkforpendingwriteI/Os
#lsattr-Elsys0|grepminpout
输出判断:
结果应为
minpout 24 LOWwatermarkforpendingwriteI/Osperfile True
更改命令为:
#chdev-lsys0-amaxpout='33'-aminpout='24'
3.Syncd参数
#grepsyncd/sbin/rc.boot
输出判断:
结果应为
nohup/usr/sbin/syncd10>/dev/null2>&1&
更改命令为:
#vi/sbin/rc.boot
4.aio参数
#lsdev-Ccaio
输出判断:
结果应为
aio0Available AsynchronousI/O
#lsattr-Elaio0
输出判断:
结果应为
minservers1 MINIMUMnumberofservers
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIX 巡检 报告 以及 操作手册