Vmware常见故障处置.docx
- 文档编号:11951622
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:10
- 大小:20.16KB
Vmware常见故障处置.docx
《Vmware常见故障处置.docx》由会员分享,可在线阅读,更多相关《Vmware常见故障处置.docx(10页珍藏版)》请在冰点文库上搜索。
Vmware常见故障处置
Vmware故障处置
1、为主机应用HostProfiles提示compliance错误
故障状态:
为主机应用HostProfiles失败,提示如下错误:
01.Specificationstateabsentfromhost:
device'
02.Hoststatedoesn'tmatchspecification:
device'
03.Specificationstateabsentfromhost:
device'
04.Hoststatedoesn'tmatchspecification:
device'
故障分析:
这是由于PSA组件致使的;
解决方案:
1、右击HostProfiles后点击Enable/DisableProfiles配置选项;
2、展开“StorageConfiguration”选项,展开“PluggableStorageArchitecture”那个uxanxiang;
3、去掉“PSADeviceConfiguration”;
4、展开“NativeMuti-Pathing(NMP)”那个选项后,接着展开“PSPandSATPconfigurationforNMPdevi”选项;
5、去掉“PSPconfigurationfor”那个选项后点击OK即可。
2、分析、解决IOPS致使的虚拟机/存储性能下降和虚拟机磁盘延时较大的问题
故障状态:
1、虚拟机性能较低;
2、在执行备份时磁盘延时很厉害;
3、虚拟磁盘vmdk延时较大;
故障分析:
这种问题大体都是由于虚拟机没有足够的IOPerSecond(IOPS),或IOPS低于30;
解决方案:
在解决问题前,第一要解决以下两个问题:
问题1:
什么是IOPS?
IOPS全称为Input/OutputPerSecond,它是衡量一个磁盘(虚拟磁盘和物理磁盘)、存储的大体也是十分重要的标准。
不同的磁盘、存储有着不同的IOPS。
IOPS的高低直接会阻碍着系统的性能。
当前,VMware虚拟化环境中最大的瓶颈也就在于那个IOPS。
针对数据密集型业务的数据库业务和流媒体业务,由于它们的IOPS专门大,因此在虚拟化环境中部署它们必然要充分考量它们的负载,也确实是IOPS大小,结合实际的存储性能来查看是不是符合业务标准。
问题2:
如何计算IOPS?
如何计算每台虚拟机的IOPS?
要想计算每一个虚拟机的总的IOPS数量,第一就要确认磁盘类型和它们的IOPS是多少。
处于RAID阵列里面的每一个盘的IO有利于增加整体存储的可用IOPS。
而位于那个存储上面的单台虚拟机的IOPS,那么能够通过将那个存储的总IOPS除掉虚拟机数量即可大体取得单台虚拟机的IOPS。
现实案例:
假定有6颗10000RPM的磁盘,那么它们的总的可用IOPS大约为150x6=900。
若是LUN上面运行的虚拟机数量为50个,那么单台虚拟机的IOPS为900/50=18IOPS。
若是以那个为标准,那么意味着虚拟机的性能相对底下。
若是想要知足虚拟机的大体IOPS需求,那么应该为900/30=30,也确实是说同一个Volume里IOPS为30(最低要求)虚拟机需要数量操纵在30台以下。
备注:
备份存储会消耗更多的IOPS,同时也会给Volume带来更多额外的符合。
若是是如此,那么需要用额外手腕解决备份时的额外资源消耗(能够通过I/Ometer软件来测试IOPS)
3、丢失或锁定文档致使虚拟机无法PowerOn
故障状态:
1、虚拟机无法开启;
2、尝试开启虚拟机时,看到类似如下错误信息:
•UnabletoopenSwapFile;
•Unabletoaccessafilesinceitislocked;
•UnabletoaccessVirtualmachineconfiguration;
3、在/var/log/vmkernel文件里能够看到类似如下信息:
WARNING:
World:
VMxxxx:
xxx:
Failedtoopenswapfile
WARNING:
World:
VMxxxx:
xxx:
Failedtoinitializeswapfile
4、当尝试开启虚拟机的console操纵台时,可能会收到如下错误信息:
Errorconnectingto
5、在开启虚拟机时,卡在95%位置无响应;
6、从模板部署一台新的VM以后无法开启虚拟机;
7、虚拟机在vCenterServer和ESXi/ESX主机之间报告操纵台电源状态冲突;
故障分析:
致使那个问题的因素可能很多,可是众多问题中,都穿插或包括着文件损坏或文件被锁定等问题的可能。
虚拟机经常使用的文件包括:
•*.vswp
•
•
•*.vmx
•*.log
解决方案:
第一需要确认哪些文件处于锁定状态:
1、利用vSphereClient登录ESXi/ESX主机、vCenterServer主机;
2、在Datastore里找到想要开启可是无法开启的虚拟机所在位置;
3、尝试开启虚拟机,若是无法开启且console显示错误,先查阅日记文件的相关信息来确认问题;
4、利用SSH或COS选用root权限登录到ESXi/ESX主机以后执行下面的命令查看虚拟机的完整途径:
#vmware-cmd-l
系统将输出类似如下信息来显示注册到ESXi/ESX主机的虚拟机:
/vmfs/volumes/
5、执行以下命令切入到那个虚拟机所在的目录:
#cd/vmfs/voluems/
6、然后查阅日记,在文件的尾部查看什么缘故致使那个问题后再针对性的分析。
准确信位并删除掉锁定文件
由于虚拟性能够在主机之间移动,若是虚拟机注册到的主机维持对文件的锁定状态,那么,那个锁定文件能够有效保障ESXi/ESX主机对虚拟机文件的操纵权和有效爱惜虚拟系统。
主机由ServiceConsole接口的MAC来确信。
lock由VMkernel或ServiceConsole负责保护;
备注:
ESXi效劳器没有ServiceConsole因此,lock由VMkernel单独负责保护;
第一要确信VMkernel可能锁定的文件:
1、执行下面的命令来报告锁定目录所在的MAC地址:
#vmkfstools-D/vmfs/volumes/
2、由于负责锁定.vmdk文件的主机遇将MAC地址写入到vmkernel日记里面,那么能够用下面的命令查阅:
#tail/var/log/vmkernel
4、StoragevMotion失败:
lookingforlinesstaringwith"CBTMotion"
故障状态:
1、执行StoragevMotion失败;
2、系统提示如下错误信息:
01.Ageneralsystemerroroccurred:
StorageVMotionfailedtocopyoneormoreoftheVM'sdisks.PleaseconsulttheVM'slogformoredetails,lookingforlinesstartingwith"CBTMotion-".
复制代码3、文件里有类似如下信息:
01.Failedwitherror340983807:
StorageVMotionfailedtocopyoneormoreoftheVM'sdisks.PleaseconsulttheVM'slogformoredetails,lookingforlinesstartingwith"CBTMotion".
复制代码故障分析
可能由于虚拟机的硬件版本号过老致使;
解决方案:
关掉虚拟机后右击uxniji选择UpgradeVirtualMachineHardware即可。
5、添加LUN时提示
故障状态:
系统能够扫描到DevicesLUN,可是在添加进程中却提示如下错误信息:
HostDatastoreSystem.QueryVmfsDatastoreCreateOptions,如下图:
故障分析:
如此的问题一样都是由于LUN的尺寸过大致使,一样来讲,VMwareESXi/ESXServer标准支持最大的LUN尺寸为2TB-512Byte,可是由于国内很多技术人员对那个-512Byte并非太在意,因此适应型的讲成2TB,这就致使很多用户在利历时,直接分派了2TB的空间,这就可能致使了上述问题;
解决方案:
针对如此的问题,建议如下:
1、若是已经分好了2TB的LUN,建议调整为左右后再尝试添加;
2、新LUN计划用户那么请严格参照官方文档的参数设计,建议是左右为一个LUN生成Datastore
6、vCenterConverter推送Agent犯错:
ConverterAgentinstaller/uninstallerFailed
故障状态:
1、利用vCenterConverter推送Agent到WindowsServer2003效劳器上时,失败;
2、系统提示类是如下错误信息:
01.ConverterAgentinstaller/uninstallerfailedon'xxxxxxxxx'.
3、VMwarevCenterConverter的日记文件里面有类似如下错误提示:
04.[#7][2020-01-2111:
18:
37.47603976error'App']FounddanglingSSLerror:
[0]error:
00000001:
lib(0):
func(0):
reason
(1)
7.[#7][2020-01-2111:
19:
32.44503976info'App'][diagnosticManager,357]GeneratingConverter.Serverlogbundle.
故障分析:
以下几种情形可能致使如此的问题:
1、445端口没能打开;
2、曾经手动安装过Agent后卸载;
3、Windows效劳治理其中的server效劳没有启动致使的IPC$连接失败;
4、防火墙阻绝;
解决方案
1、确认445端口或NetBIOS协议能正常利用;
2、建议在Converter时关闭防火墙;
3、若是仍然有问题,尝试用ConverterStandardalone版本迁移或采纳ConverterCD进行冷克隆。
7、解决在里开启HA时,提示:
DatastoreHeartbeating不足的问题
故障状态:
为配置HA时,提示如下信息:
故障分析:
这是由于里的HA部份已经重写,而且新增了DatastoreHeartbeating用于网络Partition心跳检测支持;
解决方案:
有2个选择,一个是加多存储用于心跳检测,这也是正确的选择,就不多讲,另一个确实是忽略掉那个问题,方式如下:
1、vSphereClient登录到后,右击HACluster,点击Edit,然后找到高级选项设定:
2、再如上图所示的内容中,添加下参数:
备注:
缺省情形下,那个参数的值是false的。
8、通过vSphereClient登岸ESXi主机提示“正在更新”的问题
故障状态:
通过vSphereClient登岸正常,登岸ESXi主机提示如以下图:
故障分析:
需要通过‘’来更新Client说明客户端存在问题,由于登岸不存在任何问题,因此大体确信版本的问题。
查看ESXi版本和vSphereClient,发觉Client的版本低于ESXi版本。
解决方案:
由于Client所在网络无法上Internet,因此无法更新Client客户端,能够通过安装高版本的Client来解决此问题。
PC效劳器日常保护故障处置
标题
PC服务器无法正常启动进入操作系统
发生日期
发现日期
现象:
PC服务器(多种厂商),在开机或者重启系统时,经过很长时间未启动,通过终端显示器看到如下提示:
“strikeF1keytocontinue,f2torunthesetup”。
检查与分析:
服务器在引导系统内核前,需要对服务器的各种硬件进行自检,包括(CPU、内存、硬盘、RAID卡、远程管理接口等等),在硬件检测报错或者出现警告,但是这种错误并不致命,不影响系统正常启动,就会提示:
“strikeF1keytocontinue,f2torunthesetup”。
处理:
针对上述分析,在服务器无法正常启动自动进入操作系统是由于硬件检测失败,所以首先必须检查硬件的报警信息,并及时处理故障。
在硬件无故障而是由于配置问题或者可以忽略时可以通过F2进入BIOSsetup进行配置,常见的现象有如下:
1.内存冗余安装警告:
有些服务器内存安装需要冗余对称安装,如果没有冗余安装将出现警告。
A.正确解决办法:
操作服务器安装手册,调整内存的安装方式。
B.忽略方式:
F2进入setupmemoryinformationredundantmemorydisabled
2.网络方式引导失败:
如果服务器之前是配置的网络方式启动操作系统。
A.正确解决办法:
检查网络接口IP设置,与网线连接状态。
B.忽略方式:
F2进入setupbootsequence去掉网络启动选项
3.集成设备检测失败:
集成设备,如RAIDcontroller、USBports、IDECD-ROMcontroller等等。
A.正确解决办法:
检查集成设备的健康状态,连接线是否有松动。
B.忽略方式:
F2进入setupEmbeddeddeveices将对应的设备设置成off
(本次故障就是由于CD-ROM设备检测失败导致,将IDECD-ROMcontroller设置为off后,服务器能正常的自动引导操作系统)。
解决结果
故障修复完成
解决日期
解决人
备注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Vmware 常见故障 处置