系统及数据库性能巡检模板.docx
- 文档编号:17835099
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:34
- 大小:65KB
系统及数据库性能巡检模板.docx
《系统及数据库性能巡检模板.docx》由会员分享,可在线阅读,更多相关《系统及数据库性能巡检模板.docx(34页珍藏版)》请在冰点文库上搜索。
系统及数据库性能巡检模板
XXX客户
巡检报告
修改记录
日期
作者
版本
修改记录
调整文档格式
添加应用巡检内容;
数据库巡检中增加“对象空间占用”
将操作系统部分独立出来,补充分项
审阅记录
安全级别
秘密□内部使用□公开□
巡检人
巡检日期
审阅人
审阅日期
复批领导
复批日期
1.
应用巡检
1.1.检查介绍
应用系统巡检通过XX系统自带的监控系统获取历史数据。
1.1.1.应用监控
进入http:
//应用IP:
端口/应用上下文根/monitoring获取按天、按周、按月的系统运行历史报告:
进入监控系统页面,选择时间周期天、周、月:
1.1.2.连接池监控
1.2.系统概要
系统主要包括的应用服务器,具体情况如下:
名称
应用名称
应用简介
J2EE服务器版本
JAVA版本
虚拟机参数
应用部署目录
应用日志存储目录
应用服务器日志存储目录
日志滚动策略
日志归档方式
外接存储目录
1.3.CPU使用情况
CPU数量:
CPU运行图表:
近一月:
近一周:
近一天:
峰值:
均值:
建议:
1.4.内存使用情况
堆内存配置:
永久代配置:
内存使用图表:
近一月:
近一周:
近一天:
峰值:
建议:
1.5.线程运行状态
线程池配置:
线程使用图表:
近一月:
近一周:
近一天:
峰值:
建议:
1.6.数据源状态
1.6.1.数据源XX
配置最小值:
配置最大值:
使用峰值:
峰值出现时间:
建议:
1.6.2.数据源XX
2.操作系统巡检
2.1.检查介绍
2.1.1.检查系统
系统主要包括1个数据库,具体情况如下:
项目
值
业务名称
主机名
CPU
物理内存
操作系统
RDBMS版本
IP
2.1.2.检查范围
本次检查仅限于操作系统。
在这次检查中对操作系统配置和数据库性能进行了分析。
本报告提供的检查和建议不涉及具体的安全分析和应用程序的具体细节。
检查方面
具体检查内容
系统信息
系统信息
硬件配置
主机配置
资源使用率
硬盘可用空间及趋势
CPU利用率
内存利用率
IO使用率
网络连通性
安全性
日志
启动服务列表
防火墙状态及策略
sysctl.conf配置
系统安全
账户口令安全
服务及授权安全
补丁安全
日志审计
登录通讯安全
2.2.硬件配置
以下列出系统主机的主要配置情况
2.2.1.主机配置
机器名
用途(Prod,Test,Development)
所在城市,物理位置(机房,远程)
操作系统及版本
内存
cpu
建议:
目前系统配置满足数据库要求,操作系统参数设置合理。
2.3.资源使用率
2.3.1.硬盘可用空间
硬盘可用情况如下示:
数据库XXXX的硬盘使用率情况如下:
Filesystem
kbytes
used
Avail%used
Mountedon
数据库YYYY的硬盘使用率情况如下:
Filesystem
kbytes
used
Avail%used
Mountedon
剩余空间折线图:
建议:
目前该数据库服务器中还没有其他硬盘空间使用率超过90%的分区。
如果有需要引起注意并且及时增加硬盘空间的容量。
2.3.2.CPU利用率
CPU利用率的统计时间是:
yyyy-mm-ddhh:
mi—-yyyy-mm-ddhh:
mi
top/glance
vmstat220
参考值:
最大CPU使用率:
60%–70%
系统进程与用户进程占用CPU最大比率:
40/60
数据库XXXX:
数据库YYYY:
从上述的情况中看出,数据库:
服务器CPUidle基本在75%以上,CPU资源较为空闲。
建议:
当CPU的使用率超过80%,要注意监控是否有僵死进程,如果有僵死进程占用CPU,需要将僵死进程kill掉。
如果有正常进程占用大量CPU,需要查看是否属于正常业务进程等。
2.3.3.内存利用率
如果SWAP的值不为0,或者还比较大,比如超过100M了。
且SI,SO的值长期不为0,此时说明MEM资源使用紧张。
Vmstat220
Free-m
建议:
2.3.4.IO使用率
iostat查看IO信息。
如果%util接近100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。
另外还需要注意iowait这个值,iowait值高就意味着磁盘缓慢或负载过大。
Iostat–x25
2.3.5.网络连通性
应用服务器或客户端与数据库服务器进行ping包测试。
ping-s4096-c5 192.0
关注图中红色标记部分,若高于0%,认为数据库到该目标IP之间的网络不稳定,存在丢包,系统存在风险。
2.4.安全性
2.4.1.日志
检查近三天操作系统日志,是否有报错或告警。
/var/log/message系统启动后的信息和错误日志
/var/log/secure与安全相关的日志信息
2.4.2.数据库相关服务及配置
序号
检查项
输出
备注
1
启动服务列表
是否关闭无用服务,比如samba服务
2
防火墙状态及策略
是否开启防火墙策略
3
sysctl.conf配置
输出sysctl.conf策略
2.5.系统安全
建议从账户口令安全、服务及授权安全、补丁安全、日志审计、登录通讯安全五个维度考虑,并参考公司自有安全规范。
比如补丁安全,是否有利用安全扫描工具,定期对系统进行安全扫描,及时更新相关漏洞补丁。
3.数据库巡检
3.1.检查介绍
3.1.1.检查系统
系统主要包括1个数据库,具体情况如下:
数据库名称
数据库实例名
应用名称
应用类型OLTP/DSS/Batch
开发工具
应用简介
RDBMS版本
CRS版本
所有数据文件所占磁盘空间
SGAtargetsize
DB_BLOCKSize
表空间个数
数据文件个数
控制文件个数
日志文件大小
日志组数目
每组日志文件成员数量
归档方式
并发用户量
性能需求
3.1.2.检查范围
本次检查仅限于数据库。
在这次检查中对数据库配置和数据库性能进行了分析。
本报告提供的检查和建议不涉及具体的安全分析和应用程序的具体细节。
以下提请注意:
本次检查仅历时1天,其中还包括了提交分析报告的时间,所以在具体的应用程序性能方面并不加以深入。
3.2.数据库安全性
3.2.1.日志
Oracle数据库进程生成跟踪文件来记录错误或冲突,这些跟踪文件可以用来进一步分析问题。
数据库参数’max_dump_file_size’限制了这些跟踪文件的大小(以操作系统块的大小为单位)。
应当有足够的硬盘空间来容纳最大值的设置,否则的话应当修改上述参数的设置。
如果参数’max_dump_file_size’设得太大,会超过硬盘空间容量;如果设得太小,又不能容纳足够的出错信息供oracle支持服务部门分析问题。
此参数可以在数据库会话级设置,这样可以有选择性地设置较大值。
注意每天监控运行日志文件中的出错信息,以便于在问题还是隐患的时候及时发现并解决掉。
建议每月初将当前的alert.log重新命名以作备份,同时也可以避免alert.log文件变得太大不易管理。
在数据库:
实例的运行日志文件发现的最近一月内的主要错误如下所示:
建议:
4.8控制文件
每个数据库至少有一个控制文件。
控制文件记录了数据库的物理结构及同步信息。
3.2.2.备份
每天对数据库做全库备份。
建议:
使用RMAN对数据库进行备份或用逻辑导出备份
3.2.2.1.备份策略
本地及异地备份策略,是否涵盖所有需备份内容
3.2.2.2.备份及数据增长表
RMAN全备份估计大小(G)
增长百分比
数据文件容量(G)
时间
14
16.3
2016-02-26
14.5
4%
17.47
2016-07-05
3.2.3.恢复演练
3.2.3.1.恢复策略
建议:
定期进行恢复测试以确保备份的可用性和恢复步骤的熟悉。
1、根据不同的数据库失败情况制定相应的恢复策略。
l 数据库全库恢复
l 表空间恢复
l 数据文件恢复
l 数据表恢复
2、根据制定的恢复策略进行恢复测试。
3.2.3.2.恢复记录
时间
恢复策略
备份文件大小
备份恢复异机用时
备注
2016/2/26
RMAN全备恢复至异机1.1.1.1
14
1h
2016/7/5
存储快照恢复至灾备机
14.5
1.1h
3.2.4.安全策略
以下安全策略只列举重要部分,其他部分视公司需求而定。
3.2.4.1.DatabaseAdministratorUsernames/Passwords
Oracle自动生成两个用户,并授予DBA权限:
SYS
SYSTEM
经检查,SYS和SYSTEM都没有使用初始缺省密码。
这样有利于维护数据库的安全性,否则任何具有Oracle知识背景的人都能进入数据库。
建议:
目前数据库用户安全方面设置良好,设置安全合理。
3.2.4.2.SYSDBAUsers
被授予SYSDBA权限的用户能够进行DBA的操作,包括建立数据库,关闭数据库。
建议:
目前数据库不存在具有DBA权限的业务用户,用户权限管理情况较好。
3.2.4.3.口令策略
对于采用静态口令认证技术的数据库,需对口令策略进行安全设置。
1、参考配置操作
为用户建profile,设置
PASSWORD_VERIFY_FUNCTION8,密码复杂度8个字符
PASSWORD_LIFE_TIME90,口令有效期90天
PASSWORD_REUSE_MAX5,5个不同口令使用后可重复使用
PASSWORD_GRACE_TIME5,更改密码宽限期5天
2、补充操作说明
建议:
设置口令策略,定期更改密码
3.2.4.4.账号密码策略
对于采用静态口令认证技术的数据库,应配置当用户连续认证失败次数超过X次(不含X次),锁定该用户使用的账号。
建议:
如果连续X次连接该用户不成功,用户将被锁定
3.2.4.5.IP访问限制
设置网络连接限制,只允许安全的IP地址连接数据库进行操作。
不必要的网络连接增加了攻击者入侵系统的机会,可能危胁系统安全。
建议:
允许安全的IP地址连接数据库进行操作
3.2.5.权限
使用数据库角色(ROLE)来管理对象的权限,使用Grant命令将相应的系统、对象或Role的权限赋予应用用户
grant 权限 tousername;给用户赋相应的最小权限
revoke权限 fromusername;收回用户多余的权限
建议:
数据库用户应设置最小权限
3.2.6.审计
数据库建议配置日志功能,记录对与数据库相关的安全事件
判定条件
SQL>showparameteraudit
SQL>selectname,valuefromv$parameterwherenamelike'audit%';
补充说明
AUDIT_TRAIL取值为:
NONE(不审核),DB(记录到数据库),OS(记录到系统日志)。
启用审核并设置审核级别,记录对数据库的操作,便于日后检查。
登陆审核:
auditsession;
只记录失败登陆:
auditsessionwhenevernotsuccessful;
只记录成动登陆:
auditsessionwheneversuccessful;
建议:
记录对与数据库相关的安全事件
3.3.数据库稳定性
本次检查工作主要针对数据库XXXX。
3.3.1.数据库版本和单独补丁
目前已经安装的单独补丁列表如下:
opatchlsinventory-oh$ORACLE_HOME
Patch
BaseBug(s)
Installedon
建议:
3.3.2.CRS版本和单独补丁
CRS安装单独补丁列表如下:
opatchlsinventory-oh$ORA_CRS_HOME
Name
Version
Installedon
建议:
3.3.3.ORACLECLUSTER配置
OCR使用和备份都正常。
相关CRS的资源和服务都正常。
$olsnodes
$ocrcheck
$ocrconfig-showbackup
$crsctlcheckcrs
CSSappearshealthy
CRSappearshealthy
EVMappearshealthy
$crs_stat-t
3.3.4.CRS日志文件
从Oracle10gRAC版本开始,新增加CRS组件。
CRS对于RAC使用是必不可少,因此crs的稳定对于RAC数据库的正常运行至关重要。
在健康检查中会检查CRS、CSS和EVM的LOG信息。
.
建议:
2.检查CRS其他相关进程日志,没有发现问题。
3.3.5.初始化参数文件
数据库SPFILE参数指定了当前使用的数据库配置参数,在数据库启动时被使用。
在附录A列出了数据库所有的非默认值的参数。
建议:
数据库的参数可以看出大部分都是经过精心设置的。
建议调整的参数值,请在测试环境数据库中测试确认之后,再调整于生产环境数据库。
3.3.6.Control文件
控制文件路径如下:
Name
Status
目前所有的控制文件文件存储在已经做了硬件RAID的磁盘阵列上面,提供了硬件级别的保护。
建议:
3.3.7.Redolog文件
对于恢复操作,最为关键的结构是在线RedoLog。
在线RedoLog一般由两个或两个以上预先分配的存储数据库变化的文件组成。
为了防止例程故障,每个数据库的实例都有相关的在线RedoLog。
每个数据库至少有两个RedoLog组,每组至少有一个日志文件。
Oracle的多重在线RedoLog文件可以确保在线日志文件的安全。
对于多重在线RedoLog文件,LGWR同时将相同的RedoLog信息写入不同的RedoLog文件中,从而减少单个文件丢失的损失。
当Oracle无法访问一个RedoLog文件时,这个文件状态变为INVALID。
当Oracle推测一个RedoLog文件不完整或者不正确时,它的状态变为STALE。
当一个STALE的文件被重用时,即其所在日志文件组活动时,此文件也能够使用。
在线RedoLog文件减少了数据库数据丢失的损失,比如当发生例程故障时,没有被写入数据文件的数据可以从在线RedoLog文件中恢复。
Group#
Thread#
Sequence#
Bytes
Members
Archived
Status
FirstChange#
FirstTime
建议:
3.3.8.数据文件
数据文件是数据库分配的物理文件。
在Oracle数据库中,一个表空间可以包含一个或多个物理文件。
而一个数据文件则只能关联一个表空间和一个数据库。
Oracle通过分配一定的磁盘空间以及所需要的文件头空间,为每个表空间创建一个数据文件。
3.3.8.1.Datafilelocations
检测数据文件的位置。
当数据文件增长过度,数据库中必须添加数据文件。
应该避免“哪里有空间,哪里建文件”的错误方法,因为这样会增加备份策略和文件维护的复杂性。
下面列出部分数据文件的位置。
Status
Name
Tablespace
FileNumber
RelativeFileNumber
Size
Used(MB)
Used(%)
Autoexten
建议:
目前看来,数据文件存放位置基本准确。
3.3.8.2.Autoextendcapabilities
通过自动扩展命令进行数据文件的自动扩展。
假定数据文件无法分配所需空间,那么它将提高数据文件的大小以获得更多空间。
建议:
3.3.9.归档log文件
Oracle允许将写满的在线RedoLog文件存放在一个或多个脱机位置,即归档RedoLog。
在线日志文件通过归档写入归档日志文件。
后台进程ARCn自动进行归档操作。
您能通过归档日志进行:
在线备份
基于时间的恢复
3.3.9.1.ArchivedRedoLogSettings
Parameter
Value
建议:
这里能够很好地在运行环境中使用归档RedoLog。
这样就能够进行基于时间的恢复。
监控归档日志文件所暂时存放的磁盘空间,根据实际情况调整归档日志文件备份到磁带的频度。
3.3.10.表空间
每个数据库由一个或多个逻辑存储单位,即表空间,所组成。
而表空间则由逻辑存储单位段所组成。
而段将被分为多个片。
以下是关于数据库表空间管理的信息。
Status
Name
Type
ExtentManagement
SegmentSpaceManagement
Size(MB)
Used(MB)
Used(%)
建议:
3.3.10.1.TablespaceDefaultStorageManagement
每个表空间中,可以为创建的对象指定缺省的存储参数。
创建对象时指定的存储参数将覆盖缺省值。
如果在创建对象时没有指定存储参数,那么系统将使用缺省值。
表空间缺省存储情况:
Name
Type
InitialExtent
NextExtent
LargestFreeExtent
MinimumExtents
MaximumExtents
MinimumExtentLength
Increase(%)
数据库表空间的管理方式均为本地管理,这有利于减少表空间级别的碎片,同时避免了DB在进行空间管理时对数据字典表(FET$、UET$)的争用。
我们知道系统中存在越多的空闲extent,越容易发生碎片问题。
其中空闲extent的大小非常重要,如果在表空间上有许多个无法满足指定的next大小的空闲extent,那这个空闲extent就无法被重新使用并成为碎片,这时就需要重新整理碎片;我们可以使用COALESCE命令合并相邻的extent,来减少系统中的碎片。
如果系统中不连续的小空闲extent过多,也就是碎片过多,则可能需要通过重建表空间的方式来消除碎片。
系统多数表空间使用ASSM,ASSM使用位图而不是传统的FreeList来管理段内的freedbblock,大大提升了空间管理的性能。
同时显著的减少segmentheader类型的bufferbusywait等待事件。
建议:
表空间的管理方式选择合理。
3.3.10.2.NextExtent
保证段能够增长是很重要的,因此在必要时分配nextextent。
如果在表空间中没有足够的空余空间,那么nextextent无法分配,对象也无法增长。
在数据库中没有发现无法分配NEXTEXTENT的段。
3.3.10.3.TemporaryTablespace
临时表空间用于存放临时段。
为了维护数据库的性能,临时表空间的维护方法有别于其他一般表空间。
缺省情况下,所有表空间都创建为PERMANENT。
所以在创建临时段时,需要保证表空间类型为TEMPORARY。
由于这些表空间中的排序段不被清除,所以减少了空间事务争夺,同时减少了SMON对于CPU的使用率。
当进行长时间清理时,用户无法进行排序操作。
在这种情况下,可以指定用户使用状态为PERMANENT的临时表空间。
这有可能会引起空间事务争夺,但是可以允许用户在磁盘上进行排序操作。
由于表空间的extent使用了localmanagement方式,对表空间采用位图管理,更利于空间的使用及回收管理。
Status
Name
Size(MiB)
MinimumExtents
MaximumExtents
MinimumExtentLength
Increase(%)
建议:
在数据库TEMP为TEMPORARY类型的表空间,ExtentManagement方式为LOCAL。
保证
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 数据库 性能 巡检 模板