顾名思义,“容错”是服务器对系统运行所产生的错误、故障的适应、纠错的能力,它是企业级应用对服务器稳定性的追求目标。大家通常所说的99.999%是对服务器系统高稳定性要求的直观体现。容错服务器可以允许某些错误(故障)发生,这些服务器通常具有自动修复和支持冗余的功能模块。在出现错误或故障时,这些错误的部分可以得到及时修复或切换,从而确保服务器不会中断运行。通常容错服务器对CPU、内存、磁盘和网卡甚至是电源实现冗余备份,并且在出现故障时不会导致系统宕机和数据丢失。现在许多基于工业标准的服务器都可以实现这种冗余容错机制,并且是以一种更加经济实惠的方式实现的。
一、服务器的电源供应
保证服务器有多余的电源供应,包括企业级不间断电源,定期检查备用发电机等等。若IDC没有冗余电力,则会导致服务器中断。
二、服务器硬件冗余
不管所租赁的服务器是什么,服务器和网络硬件都应该以冗余的方式构建。以香港的服务器租赁为例,逐步接入BGP、CN2等多种线路,以满足用户不同的需求。而且普通用户可以配置RAID磁盘阵列,提供了更高的数据可靠性。
三、服务器软件更新
在服务期间对软件进行更新,特别是与安全有关的内容。许多服务中断都是由于应用程序失败而造成的,而版本和安全补丁没有及时更新,则更容易被黑客入侵,进而导致更严重的破坏。
四、服务器硬件故障监控
对硬件设备进行严密监控是必不可少的。用户使用服务器时,应随时注意服务器的硬件和软件,并确保在发生故障时能立即提醒。
五、降低人为操作的失误率
一些失败可能是由于应用程序故障、系统缺陷和人为错误操作造成的,实际使用服务器期间。服务器的管理水平也需要进一步提高。
随着信息化的不断深入和业务的发展,服务器的作用对企业来说显地更为重要。如何维护服务器才可以保证7*24全天候稳定运行,这也成为企业思考的问题。
田鑫,专业的企业组网服务商,致力于为企业提供企业组网(SD-WAN、MPLS、云互联),业务云化、数据中心、网络安全、行业IT解决方案等相关服务。
更多相关内容推荐:
改善IDC运营的六大佳实践