系统健康检查服务方案Word文档格式.docx
- 文档编号:8638536
- 上传时间:2023-05-12
- 格式:DOCX
- 页数:23
- 大小:78.57KB
系统健康检查服务方案Word文档格式.docx
《系统健康检查服务方案Word文档格式.docx》由会员分享,可在线阅读,更多相关《系统健康检查服务方案Word文档格式.docx(23页珍藏版)》请在冰点文库上搜索。
5
依次按照巡检内容对系统设备进行逐项巡检,并填写巡检报告
6
巡检过程中如果发现任何系统问题,双方将协调处理
服务销售
7
巡检过程中如果发现任何突发事件,请参考本文档5。
步骤3.服务收尾工作
8
提交现场巡检报告,客户签字
大约1个小时
9
请客户填写服务满意度评价表
10
双方交流
11
五个工作日内提交巡检分析报告
--
4.应急计划
本次巡检服务中的设备为在线系统,理论上讲,巡检只是对系统状态进行查看,本身不会对系统产生影响,只是在极少数情况下,系统本身已经有故障隐患,因为巡检触发,可能会影响系统的运行,必须通过事先充分准备,识别可能的风险,并进行规避和控制。
通过以下方法来尽可能减少风险:
✓服务工程师在开始实施巡检时,应首先向客户了解自前一次维护服务以来所发现的异常和问题,并采取必要的措施
✓在对系统采取任何行动之前,应确保已经采取必要的数据信息保护措施,如系统的备份或数据转存等;
✓服务工程师在巡检过程中记录操作步骤,一旦发生突发问题,也有据可查,方便问题的定位。
✓服务工程师在巡检过程中如果发现设备有重大问题,必须尽快进行处理的事件,由现场巡检工程师向本次用户通报,由用户同XXX服务销售进行协商进行处理。
5.备件计划
针对本次健康检查服务,我方主要提供对SUN系统以及ORACLE数据库的检查服务为主,如果在检查过程中,发现有备件坏,我们会第一时间跟用户通报,并从XXX广州备件库调相应备件进行更换;
如果备件更换处于合同覆盖范围,我们将不收取备件费用,如果合同未覆盖,我们将收取备件物料成本费;
为此次检查服务准备的备件清单包含但不限于:
型号
描述
数量
SunV480整机
带cpu,内存,硬盘
X6805A
73.4GB,10000RPM硬盘
ST3310
带控制器,无硬盘
XTA-SC1NC-73G10K
73GB,3310阵列硬盘
XTA-SC1NC-146G10K
6.文档信息
本文档由XXX负责起草
附录
SUN系统巡检报告及相关命令说明
ORACLE数据库巡检报告及相关命令说明
系统配置信息
SUN系统巡检报告
日期:
年月日报告编号:
客户名称
检查地点
主机型号
IP地址
主机SN
HostID
配
置
部件
型号/数量
CPU
主板
内存
CPU/内存板
硬盘
I/O板
显卡
存储阵列
电源
磁带驱动器
SCSI型号
外扩网卡型号
其它卡型号
系统盘Raid情况
管理软件名称
版本
RAID类型
硬
件
检查项目
结果
不正常请注明原因
显示器
□正常□不正常
光驱
键盘
软驱
鼠标
线缆
磁带机
板卡
系
统
内容
系统指示灯状态
FrontPanelLEDS
PowerSupplyLEDS
DiskLEDS
SystemControllerBoardLEDS(CPU/Memory、I/Oetc.)
系统messages信息
cd/var/adm
grepWARNmessages*
greperrormessages*
greppanicmessages*
/var/adm/messages
/var/adm/messages.0
/var/adm/messages.1
/var/adm/messages.2
/var/adm/messages.3
硬件运行状态
/usr/platform/sun4u/sbin/prtdiag-v
文件系统利用率
df–k
df–oi
/利用率%
/usr利用率%
/var利用率%
其它分区
Ionde利用率(是否有空闲)
Swap分区
swap–s
usedkavailablek
CPU负载
sar110
%idle
内存剩余量
vmstat1
KBytes
I/O资源
iostat–En
网络接口流量
netstat–i1
网口以及IP状态
ifconfig-a
网络传输率
ping网关(1分钟)
averagems
NTP状态
ntpq-p
远程登录设置
/etc/inetd.conf
ftp
□开启□关闭
telnet
进程总数
ps–ef|wc-l
个进程
核心Patch版本
uname–a
冗余软件
DiskSuite状态(没有的不填)
metastat
输出结果是否正常
metadb
Metadb建立在有个备份
VolumeManager状态(没有的不填)
vxdisklist
vxdglist
有磁盘组
Vxprint-ht
高可用性软件
SunCluster状态
scstat
备注
存储
ST3310阵列
外观及指示灯
是否正常
show-config
固件版本
SUN主机巡检相关命令及说明
使用的命令及相关目录
内容及其说明
外观检查
无
检查机器的指示灯情况、看有无故障指示
主机的总体情况
通过该命令,可以查看到CPU的数量、主频、CACHE大小,内存、板卡、风扇转速、环境温度等情况
查看文件系统挂接情况
df-k
可以查看到文件系统的挂接、使用量等情况,如果某个文件系统使用大于85%,则要提请注意,大于90%则要对其进行清理,删除废文件,如果根文件系统使用量达到100%,会造成系统崩溃
检查系统日志文件
greppanic/var/adm/messages*greperror/var/adm/messages*grepWARN/var/adm/messages*
检查系统的日志文件,看有无panic、error、WARN等和错误有关的关键字,其中,panic关键字一般出现在操作系统因软件或硬件故障崩溃的时候,error则是系统因软件或硬件产生了错误,WARN则相对关注级别较低,属于警告,这2种情况,都要根据系统的日志提示,进一步检查系统情况
检查CPU使用情况
检查CPU的IDEL值,越大越好,这里给出的命令是指间隔1秒,检查10次
交换分区使用情况
swap-s
查看交换区(即虚拟内存)的使用情况
内存使用情况
检查内存的使用情况,尤其检查其中的剩余内存量,如内存剩余过少,则要检查进程及应用的情况,如无异常,则意味着系统需要更多的物理内存
硬盘数量及容量
format
通过该命令,可以查看到硬盘的容量大小、数量等情况,
硬盘及其他存储设备的情况
iostat-E
这个命令可以看到硬盘的运行情况,包括:
厂商、序列号,有无运行错误等
网络情况
netstat-i1
查看网络的包吞吐情况以及冲突、包错误率等情况
网络的IP设置
查看系统中的IP地址设置
查看操作系统的核心版本
uname-a
该命令除了能查看到操作系统的核心版本外,还可以查看到主机的硬件型号
主机的厂商ID号
hostid
可以查看到厂商为主机设置的唯一ID
统计系统当前进程数量
ps-ef|wc-l
可以查看到系统当前进程数量
grepftp/etc/inetd.confgreptelnet/etc/inetd.conf
可以查看系统的远程登录是否打开
网络流通情况
ping
ping网络中的另一设备,通常是缺省网关,以检查网络的流通延时情况
检查SUNCLUSTER管理的双机系统状态
scstat
该命令可以显示SUNCLUSTER双机系统的和配置、状态有关的信息
通过Web方式管理SUNCLUSTER双机系统
通过浏览其,输入主机的IP地址,端口号为3000,可以通过Web的方式管理SUNCLUSTER双机系统
存储及冗余软件相关检查及其命令
ST3x10阵列检查
通过串行口连接到阵列的串口,利用其设置界菜单检查,具体的参数为:
波特率38400,数据位8,停止位1,奇偶校验无,流控无
ST3x10阵列检查(通过sccli工具检查)
连接了ST3x10阵列的主机,如果安装了sccli工具,通过输入sccli命令,选择了控制器后,在其界面下输入的命令
用VaritasVolumeManager管理的硬盘检查其管理下硬盘的状态
检查VaritasVolumeManager管理下硬盘的状态
用VaritasVolumeManager管理的硬盘检查其管理下磁盘组的状态
vxprint-ht
检查VaritasVolumeManager管理下磁盘组的状态,包括其划分的子磁盘的、所做的卷等的状态
用SDS管理软件管理的磁盘及其虚拟设备状态
对于用SolsticeDiskSuite(SDS,新的版本改为SolarisVolumeManager,简称SVM)管理的磁盘,在操作系统下,输入该命令,检查其管理的磁盘以及虚拟磁盘(md)的状态
用SDS管理软件管理的磁盘,检查起状态数据库的状态
对于用SolsticeDiskSuite(SDS,新的版本改为SolarisVolumeManager,简称SVM)管理的磁盘,在操作系统下,输入该命令,检查其管理数据库(用户保存SDS的设置等)的状态
ORACLE数据库系统维护检查报告
报告编号:
用户基本信息
用户名称:
联系人:
电话/传真:
地址:
应用系统名称:
巡检时间:
主机厂商/型号:
操作系统/版本:
CPU数/硬件内存:
数据库服务器运行方式:
Oracle产品/版本:
系统运行状况检测
序号
检测内容
检测指令
检测结果
建议
检查alert日志,是否有ora错误提示
Alert文件
数据库名
SQL>
showparameterdb_name
实例名
showparameterinstance_name
数据库版本
select*fromv$version;
是否归档模式
archiveloglist
安装组件
select*fromv$option;
初始化参数
showparameters
SGA区
showsga
用户检查
selectusername,account_status,default_tablespace,temporary_tablespace,createdfromdba_users
用户权限检查
select*fromdba_role_privs;
是否存在失效对象
selectowner,object_name,object_typefromdba_objectswherestatus=‘INVALID’
12
检查控制文件
select*fromv$controlfile
13
检查联机日志
select*fromv$logfile;
14
检查数据文件
select*fromv$datafile;
15
查看现有回滚段及其状态
SELECTSEGMENT_NAME,OWNER,TABLESPACE_NAME,SEGMENT_ID,FILE_ID,STATUSFROMDBA_ROLLBACK_SEGS;
16
是否有异常等待事例
selectevent,sum(decode(wait_Time,0,0,1))"
Prev"
sum(decode(wait_Time,0,1,0))"
Curr"
count(*)“Tot”fromv$session_Waitgroupbyeventorderby4;
17
检测连接数情况
SELECTstatus,count(*)"
count"
FROMv$sessionGROUPBYstatus;
selectsid,serial#,username,program,machine,statusfromv$session;
18
检查表空间使用情况
19
备份策略的讨论与实施
20
listener可用性检查
lsnrctlstatus
listener.log
21
CRS进程检查
ps–df|grepd.bin
结论:
1、alert文件:
有无错误?
2、表空间使用情况:
setlinesize300
SELECTupper(f.tablespace_name)"
tablespace_name"
d.Tot_grootte_Mb"
tablespace(M)"
d.Tot_grootte_Mb-f.total_bytes"
used(M)"
round((d.Tot_grootte_Mb-f.total_bytes)/d.Tot_grootte_Mb*100,2)"
use%"
f.total_bytes"
free_space(M)"
round(f.total_bytes/d.Tot_grootte_Mb*100,2)"
free%"
FROM
(SELECTtablespace_name,
round(SUM(bytes)/(1024*1024),2)total_bytes,
round(MAX(bytes)/(1024*1024),2)max_bytes
FROMsys.dba_free_space
GROUPBYtablespace_name)f,
(SELECTdd.tablespace_name,round(SUM(dd.bytes)/(1024*1024),2)Tot_grootte_Mb
FROMsys.dba_data_filesdd
GROUPBYdd.tablespace_name)d
WHEREd.tablespace_name=f.tablespace_name
ORDERBY4DESC
/
3、SharedPoolSize命中率:
selectround((sum(gets)-sum(reloads))/sum(gets)*100,1)"
libiarycachehitratio%"
fromv$librarycachewherenamespace
in('
SQLAREA'
'
TABLE/PROCEDURE'
BODY'
TRIGGER'
);
4、数据字典命中率:
selectround((1-sum(getmisses)/sum(gets))*100,1)"
datadictionaryhitratio%"
fromv$rowcache;
5、锁竞争:
selectsubstr(ln.name,1,25)Name,
l.gets,l.misses,
100*(l.misses/l.gets)"
%Ratio(STAYUNDER1%)"
fromv$latchl,v$latchnameln
whereln.namein('
cachebufferslruchain'
)
andln.latch#=l.latch#;
6、排序命中率:
selecta.value"
Sort(Disk)"
b.value"
Sort(Memory)"
round(100*(a.value/decode((a.value+b.value),0,1,(a.value+b.value))),2)"
%Ratio(STAYUNDER5%)"
fromv$sysstata,v$sysstatb
wherea.name='
sorts(disk)'
andb.name='
sorts(memory)'
;
7、数据缓冲区命中率:
selectround((1-(phy.value/(cur.value+con.value)))*100,1)||'
%'
ratio
fromv$sysstatphy,v$sysstatcur,v$sysstatcon
wherephy.name='
physicalreads'
andcur.name='
dbblockgets'
andcon.name='
consistentgets'
8、v$session_wait:
selectsid,seq#,event,WAIT_TIME,SECONDS_IN_WAITfromv$session_waitwhereeventnotlike'
SQL%'
andeventnotlike'
rdbms%'
9、回滚段的争用情况:
selectname,waits,gets,waits/gets"
Ratio"
fromv$rollstata,v$rollnameb
wherea.usn=b.usn;
10、无效对象情况:
colOBJECT_NAMEfora36
SELECTobject_name,object_type,statusFROMdba_objectsWHEREstatuslike'
INVALID'
客户签名:
工程师签名:
日期:
alert文件
alertXXX
在sqlplus命令行状态下,检查日志文件,其中XXX是只alert文件名
显示数据库名
显示数据库实例名
显示数据库版本
归档设置
显示归档设置,状况
显示已安装的组件
显示初始化参数
SGA
showsg
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 健康 检查 服务 方案