“亚卫生”一词不仅在生活中是广为人知的,而且在每个人经常使用的信息系统中经常遇到。顾名思义,亚卫生状态是存储系统位于健康状态和故障状态之间的状态,并且该系统仍在正常运行和运行,但处于降级模式。它的存在将导致系统性能严重低于预期。 Based on the research on sub-health status, Inspur Storage has carried out technological innovations on a distributed storage platform, developed sub-health status monitoring functions, and conducted real-time monitoring of hardware, systems, networks, etc. When the system finds that there is a sub-health status during operation, it can quickly locate the causes, report them, and perform necessary treatments on components in sub-health status to reduce the impact of sub-health status on the storage system and ensure the reliability and用户数据服务的效率。
过去,由于大多数应用程序系统的规模较小,因此亚卫生状态通常被归类为处理的故障。尽管该系统处于这种情况下的健康状况,但它仍然可以为外界提供服务。次卫生状况中的组件被视为断层治疗,从而扩大了亚卫生状况的影响,有时甚至导致该系统无法提供服务并引起浪费资源。近年来,随着新技术的迅速发展以及分布式系统的部署量表的增加,亚卫生国家对存储系统的影响变得越来越重要。以前的次健康状态处理方法不再适用于当前的大规模系统,需要更智能,更有效的机制来确保存储系统的健康操作。
亚卫生状态是一个无形的系统杀手
以网络亚卫生为例,网络卡故障,驾驶员故障,设备故障,布线松动,温度太低可能会导致网络较低的状态。尽管网络亚卫生状态的原因有很多,但其外部表现相对简单,这主要是由于网络延迟的增加和网络数据包损耗率的增加。以下显示网络数据包损耗率和延迟对分布式存储系统性能的影响。
在分布式存储系统中,当网络数据包损耗率或网络延迟增加一个节点时,存储系统的性能将非常迅速。 5%的数据包损耗率或50ms延迟足以将存储系统的性能降低约一半。
可以从网络次卫生示例中可以看出,次健康状况对系统的危害,即使是稍微的亚卫生状况,对系统性能都有巨大的影响。此外,硬件组件,例如CPU,内存,硬盘模块,网卡等,操作系统和软件操作可能会输入次病状态。
基于企业,大学,实验室和其他案例的大量次卫生状况研究,引入存储进行了故障分类和根本原因分析。可以看出,硬件亚卫生失败占33%,网络子健康失败占38%,这两种失败占整体的70%以上。
亚卫生状态案例比率
亚卫生状态监控使分布式存储运行更加稳定
基于对亚卫生状况的明显根本原因的分析和研究,Inspur在分布式存储中实施了次健康状态监控功能,以及对硬件亚卫生状态,系统次卫生状况和网络次卫生状态的实时监控。当系统在操作过程中发现具有欠佳的状态时,它可以迅速定位及健康状况的原因,报告故障并对亚卫生组件(例如试图恢复,隔离组件等)进行必要的治疗方法,以最大程度地减少亚健康状况对存储系统的影响。
通过配置使用亚卫生状态监控后,Insers分布式存储AS13000可以执行次健康状态监控和警报服务。
首先,精确定位。次健康状况的情况很复杂,具有许多症状和根本原因,因此难以检测。亚卫生状态监控系统通过建立诸如硬件亚卫生检测,网络亚卫生检测和系统亚卫生检测等机制,有效地涵盖了亚卫生状态的各种检测方案。再加上对检测信息的准确分析,可以更准确地定位亚卫生状态。
其次,快速处理它。存储系统在亚身体状态下的长期操作将影响整体绩效。监视功能可以在短期内发现亚卫生状态,并及时进行必要的治疗方法。过去,为了确保系统操作,操作和维护人员的稳定性需要每周执行一次检查脚本,以对整个集群进行健康检查。一方面,这种方法的及时性较差,并且可以在平均3-4天内发现问题。另一方面,检查脚本并不全面。亚卫生监控可以在150秒内检测网络临床状态,并执行网络端口隔离处理,在30分钟内发现系统亚卫生状态并发出警报,并在60分钟内找到磁盘温度异常,并警报等。四分之三缩短了发现系统亚卫生状况和处理的平均时间,检测项目更全面,结果更为准确。
具有亚卫生状态监测功能的分布式存储AS13000已部署在金融,通信,教育,科学研究和医疗等行业中。在操作过程中,次卫生状态监控功能具有快速的响应机制,从而降低了亚卫生状况对存储系统以及运营和维护成本的影响,确保了企业业务的稳定运营,并允许企业轻松应对数字经济时代的大规模数据挑战。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.zgmupai.cn/html/tiyuwenda/1524.html