欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    FusionCompute日常维护与故障处理介绍.pptx

    • 资源ID:2021651       资源大小:1.75MB        全文页数:51页
    • 资源格式: PPTX        下载积分:12金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    FusionCompute日常维护与故障处理介绍.pptx

    1、,FusionCompute日常维护与故障处理介绍,技术创新,变革未来,前言FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日 常维护和故障处理方法,可以更好的部署和维护企业云计算环境。通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。,第页,目标学完本课程后,您将能够:描述日常维护操作区分FusionCompute告警分析常见故障处理步骤描述FusionCompute常见故障处理方法,第页,目录维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,日常维护操作,为了保证系统长期正常、稳定的运行

    2、,维护工程师需要定期对系统进行检查,并根据检 查出的异常结果排除故障。,维护项目,第页,检查项,正常状态,维护周期,FusionCompute上的告警健康检查报告,无新增告警无“不合格”检查项,每天每天,查看系统告警检查FusionCompute 健康状态检查设备运行状态,服务器、交换机和存储设备的指示灯状态,每天,检查设备运行环境,指示灯显示正常符合运行环境对温度和湿度的要求。每周符合运行环境对空气质量的要求 每周 无明显尘土附着每周,查看预警整改公告,温湿度空气质量 防尘情况“http:/se”,选择“公告 产品公告 预警公 告 IT 云 计 算 数 据 中 心 FusionSphere

    3、FusionSphere”,查 看预警整改公告。,满足预警通知的要求,每月,查看告警,第页,实时监控,管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运 行状态,第页,目录1.维护管理 日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,系统配置(1),第页,管理员可以根据业务需求对FusionCompute系统配置参数作出调整。配置域认证信息更新License修改系统Logo配置登录超时时间配置资源调度周期配置SNMP管理站VRM单节点扩展为主备部署,系统配置(2),第页,任务管理,管理员可以通过FusionCompute查看操作任务的

    4、进度,第页,目录维护管理日常监控配置管理用户管理 FusionCompute备份与恢复2.故障管理,第页,FusionCompute账户,第页,FusionCompute账户分为:本地用户、域用户、接口对接用户。本地用户用于登 录、管理系统;在配置域后可用域用户登录系统;接口对接用户用于其他用户对接。FusionCompute登录账户如下表:,目录维护管理日常监控配置管理用户管理FusionCompute备份与恢复2.故障管理,第页,备份与恢复策略,第页,维护工程师在对系统进行重大操作(如升级、重大数据调整等)前,为了保证 FusionCompute在出现异常或未达到预期结果时可以及时进行数据

    5、恢复,将对业务的影响 降到最低,需要提前对VRM节点的数据进行备份。FusionCompute同时支持对关键数据 进行自动备份和手工备份。在对系统部件进行重大操作(如升级、重大数据调整等)后,系统有可能出现异常或未达到预 期结果。此时,需要对其进行回退,回退过程中需要进行数据恢复操作。,本节小结,本节介绍了FusionCompute系统的日常管理内容,包括监控管理、配置管理、用 户管理和管理数据备份等内容。,第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,主机和集群创建流程,FusionCompute主机和集群的故障处理,可以参考该流程顺序进行检

    6、查。,主机和集群的故障可能会涉及到如下关键 故障点:,站点故障集群故障主机故障系统接口故障,创建集群,向集群添加主机,设置主机时钟同步,添加主机存储接口,存储设备 厂商,其他 修改主机存储多路径,否,华为,存储类型 为SAN?是,第页,主机和集群故障点,不能使用Fus站ion点C故om障pute,不能配置级联,不能创建、修改、集移群除故集群障,集群配置故障,不能添加、修改、主移机除故主机障,主机配置故障,网口绑定异常系统接口故障业务管理接口异常,存储接口异常,第页,站点、集群故障点分析,不能使用FusionCompute不能配置级联不能创建、修改、移除集群集群配置故障,故障点,网络异常,VRM

    7、节点异常站点配置异常集群配置异常,可能的故障原因,排除网络故障排除VRM节点故障修复站点配置修复集群配置,排除故障,第页,FusionCompute使用VRM节点对资源统一调度管理,站点、集群故障和VRM节点强相关。,站点、集群故障案例-VRM虚拟机无法启动,收集 信息,FusionCompute服务异常,无法启动VRM虚拟机,定位 故障,可能在FusionCompute中对VRM虚拟机执行过关机操作可能在VRM虚拟机上执行过关机命令可能VRM操作系统异常而引发VRM自动关机,排除 故障,使用“PuTTY”,登录VRM节点所在主机切换至“root”用户:su-root查找VRM虚拟机id启动虚

    8、拟机:virsh start 虚拟机ID,检查 确认,告警消失业务正常,第页,主机故障点分析,不能添加、修改、移除主机主机配置故障,故障点,可能的故障原因网络异常代理服务异常系统异常,排除网络故障修复代理服务重装系统,排除故障,第页,主机上的计算资源经过虚拟化后,形成计算资源池,并分配给虚拟机 使用。如果主机出现故障,将影响上层的虚拟机和业务。,主机故障案例-添加主机失败,收集 信息,在FusionCompute界面上添加主机失败,定位 故障,VRM与CNA节点网络链路不通添加主机失败后,主机上可能残留网络配置数据,导致再次添加主机失败,排除 故障,检查VRM与故障CNA节点网络连接删除故障C

    9、NA节点残留网络数据,检查 确认,告警消失业务正常,第页,系统接口管理,第页,FusionCompute管理如下几类系统接口:绑定网口绑定主机的网口,以提高网络的可靠性。存储接口在主机中添加存储接口,实现主机与存储设备对接。添加多个存储接口,可以实现存储的多路径传输。业务管理接口承载一些特殊业务流量的系统接口,这些特殊业务包括热迁移虚拟机、虚拟机主机容灾、虚拟 化SAN存储心跳检测等。,系统接口故障点分析,网口绑定异常业务管理接口异常存储接口异常,故障点,可能的故障原因网络异常主机异常VRM异常,排除网络故障修复主机修复VRM,排除故障,第页,系统接口涉及到底层网络硬件,主机和VRM节点,排除

    10、故障时可自顶 向下快速定位故障层次,然后再自底向上逐步排除故障点。,系统接口故障案例-删除存储接口路由导致异常,收集 信息,删除存储接口路由后,提示存储链路中断,关联虚拟机不能使用,定位 故障,主机与存储设备通过三层网络连接,主机的存储接口和存储设备的存储IP地址 不在同一网段,需要设置静态路由,使存储平面能够互通,排除 故障,登录主机为主机存储接口配置静态路由,检查 确认,告警消失业务正常,第页,目录维护管理故障处理 主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,存储资源池配置流程,FusionCompute存储池的故障处理,可以 参考该流程顺序进行检查。存储池可能会

    11、涉及到如下关键故障点:,存储资源故障存储设备故障数据存储故障虚拟磁盘故障,添加站点的存储资源,判断存储设 备类型,Advanced SAN Fusionstorage,向主机关联存储资源,扫描存储设备添加数据存储 创建磁盘,NAS FC/IP SAN,第页,本地存储,存储资源池故障点,不能添加、修改、,删存除储存资储资源源故障,不能关联存储资 源,存储设备 故障扫描不到存储设 备,添加、修改、移 除数据存储异常数据存储故障关联、解关联主 机异常,数据存储异常,创建、绑定、解,绑定、删除虚拟,虚磁拟盘磁异常盘 故障,调整容量异常,快照异常,迁移异常,第页,存储资源、存储设备故障点分析,不能添加、

    12、修改、删除 存储资源不能关联存储资源扫描不到存储设备,故障点,可能的故障原因存储网络链路异常对端存储设备异常主机存储接口异常,排除存储网络链路故障排除对端存储设备故障修复主机存储接口配置,排除故障,第页,FusionCompute存储资源、存储设备故障涉及到对端存储设备配置,存储链 路,存储接口等,需要逐步排错。,存储资源故障案例-存储资源管理链路中断,收集 信息,FusionCompute上报告警信息:存储资源管理链路中断,定位 故障,网络异常存储资源网口故障,排除 故障,查看故障的存储资源的名称及出现故障的存储资源管理IP登录VRM节点查看VRM与故障的管理链路的IP能否正常通信网络排查、

    13、修复,检查 确认,告警消失业务正常,第页,数据存储故障点分析,不能添加、修改、移除数 据存储关联、解关联主机异常数据存储异常,故障点,可能的故障原因存储网络故障虚拟化的本地存储文件 系统损坏对应存储设备损坏,排除存储网络故障修复文件系统损坏修复磁盘损坏,排除故障,第页,FusionCompute数据存储涉及到虚拟化和非虚拟化数据存储,也就是文件系 统和块存储,需要重点关注这两类故障。,数据存储故障案例-VIMS文件系统损坏,收集 信息,共享存储的VIMS文件系统损坏,定位 故障,系统文件元数据损坏或用户文件元数据损坏超级块损坏或文件系统根目录损坏,排除 故障,停止故障存储设备上的业务运行fsc

    14、k修复只读卷恢复故障存储设备上的业务运行,检查 确认,告警消失业务正常,第页,虚拟磁盘故障点分析,不能创建、绑定、解绑定、删除虚拟磁盘调整容量异常快照异常磁盘迁移异常,故障点,可能的故障原因数据存储异常磁盘类型限制磁盘配置模式限制虚拟机状态限制,修复数据存储更改磁盘类型更改磁盘配置模式更改虚拟机状态,排除故障,第页,FusionCompute上的虚拟机,如果绑定的虚拟磁盘出现故障,会影响到业务 和数据,故障排除时需提前备份数据。,虚拟磁盘故障案例-磁盘无法在线扩容,收集 信息,虚拟机磁盘不能在线扩容,定位 故障,磁盘所属的数据存储类型不支持扩容磁盘配置模式不支持在线扩容虚拟机操作系统不支持在线

    15、扩容,排除 故障,迁移磁盘到支持扩容的数据存储上更改磁盘配置模式重启虚拟机,检查 确认,磁盘扩容成功,业务正常,第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理 虚拟机和模板故障处理,第页,网络池创建流程,FusionCompute网络池的故障处理,可以参考该 流程顺序进行检查。网络池可能会涉及到如下关键故障点:分布式交换机故障上行链路故障VLAN池故障子网故障端口组故障因网络池的各个组件关联紧密,可以统一概括成 如下故障:虚拟机之间通讯故障虚拟机和外部网络通讯故障,创建分布式交换机,已有可用的分 布式交换机?,否,添加上行链路,添加VLAN池(可选),添加子网(可选),配

    16、置VTEP(可选),是,创建端口组,第页,虚拟机之间通讯故障,同一主机上,虚拟机之间 通讯故障不同主机上,虚拟机之间 通讯故障,故障点,端口组可配能置异的常故障原因分布式交换机配置异常VLAN池配置异常子网配置异常,修复端口组配置修复分布式交换机配置修复VLAN池配置修复子网配置,排除故障,第页,虚拟机可能分别属于不同分布式交换机,归属于不同端口组,使用不 同上行链路,需要逐一进行故障排除。,虚拟机之间通讯故障案例-两台虚拟机无法通讯,收集 信息,同一主机上的两台虚拟机无法通讯,定位 故障,虚拟机自身网络异常虚拟机所属的端口组不同虚拟机所属的分布式交换机不同,排除 故障,修复故障虚拟机自身网络

    17、配置更改故障虚拟机所属端口组检查所属的分布式交换机,检查 确认,网络正常,业务正常,第页,虚拟机和外部网络通讯故障,虚拟机不能访问外部网 络虚拟机访问外部网络慢,故障点,可能的故障原因上行链路异常主机网络服务异常外部交换机配置异常硬件故障,修复上行链路修复主机网络服务修复外部交换机配置排除硬件故障,排除故障,第页,虚拟机和外部网络通讯涉及到底层主机、网卡、外部交换机等,需要 逐一进行故障排除。,网络通讯故障案例-绑定网口后网络不通,收集 信息,FusionCompute绑定网口后网络不通,定位 故障,上行链路绑定模式外部交换机链路汇聚模式,排除 故障,修改上行链路绑定模式修改外部交换机端口汇聚

    18、模式,检查 确认,网络正常,业务正常,第页,目录维护管理故障处理主机和集群故障处理存储故障处理网络故障处理虚拟机和模板故障处理,第页,虚拟机创建方式,创建空虚拟机,创建空虚拟机时,可选择创 建在主机或集群上,并可自 定义CPU、内存、磁盘、网 卡等规格。空虚拟机创建完成后,需要 在上面安装操作系统。,使用模板创建虚拟机,按模板部署虚拟机或模板导入 虚拟机时,以下属性继承自模 板,其他属性可自定义。虚拟机的操作系统类型和操作 系统版本号虚拟机磁盘的数量和容量虚拟机的网卡数,使用虚拟机创建虚拟 机,克隆虚拟机过程中,以下属 性继承自原虚拟机,其他属 性可自定义。虚拟机的操作系统类型和操 作系统版本

    19、号虚拟机磁盘的数量和容量虚拟机的网卡数如果有一个要经常克隆的虚 拟机,可以将该虚拟机转换 为模板。,第页,虚拟机创建流程,FusionCompute三种虚拟机创建方式都需要经过“选择创建位置”、“设置虚拟机属性”、“设置网卡和磁盘”和“创建虚拟机”四个过程。虚拟机创建、调整、回收、操作和虚拟机模板转换、管理等故障都可以参考该流程逐一检查。,选择创建位置,集群 or 主机,设置虚拟机属性,虚拟机名称操作系统类型、版本号硬件规格(CPU内存磁 盘数网卡数)虚拟机蓝屏策略,设置网卡和磁盘,网卡所属的分布式交换 机和端口组磁盘属性(数据存储、配 置模式、容量、是否受 快照影响、持久化),创建虚拟机,确

    20、认信息,第页,虚拟机和模板故障点分析,创建、调整、回收虚拟机故障模板转换、部署、导入导出、管理故障,故障点,可能的故障原因虚拟机OS不兼容计算资源限制网络资源限制存储资源限制外部共享目录访问异常,更换虚拟机OS满足计算资源限制满足网络资源限制满足存储资源限制修复外部共享目录访问,排除故障,第页,模板故障案例-使用模板部署虚拟机失败,收集 信息,FusionCompute使用模板部署虚拟机失败错误提示“指定Location下不存在网络条件满足虚拟机启动的节点”,定位 故障,待部署虚拟机与模板不在同一集群,排除 故障,更改虚拟机部署位置到模板同一集群,检查 确认,部署正常,业务正常,第页,知识小考

    21、,第页,信息收集需要收集哪些信息?两台虚拟机不能通信,可能的原因有哪些?,本节小结,本节主要介绍了FusionCompute系统常见的故障处理方法和步骤,包括计算、存 储、网络资源模块的故障处理,以及虚拟机和模板的故障处理步骤。故障千万种,思路都一样。,第页,思考题,1.在VRM上添加CNA节点失败,可能的原因是?(),第页,CNA主机BMC未配置CNA节点上网关配置错误CNA与VRM时间不同步接入交换机CPU负载过高,本章总结,本章详细介绍了FusionCompute故障分类,并按照基本原理、资源创建流程,故 障点分析和故障处理案例,分别讲解各类故障的通用处理方法。FusionCompute涉及的故障千差万别,但掌握了本章介绍的故障点分析和处理思 路,并结合自身经验、查找华为文档和support网站,故障的排除就水到渠成,第页,谢 谢,


    注意事项

    本文(FusionCompute日常维护与故障处理介绍.pptx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开