< 返回新闻公共列表
如何思考数据中心的冗余
发布时间:2019-01-16
许多公共云服务器租用商在日常运营中一般不可避免地遭遇灾难性事情,而IT管理人员需求从云平台的毛病和经验中学习,并将其应用到内部基础设施当中。 云平台(
许多公共云服务器租用商在日常运营中一般不可避免地遭遇灾难性事情,而IT管理人员需求从云平台的毛病和经验中学习,并将其应用到内部基础设施当中。 云平台(尤其是大型公共云平台)具有多种冗余等级,但没有一个平台可以阻挡呈现的意外停机。云计算平台和数据中心一样,都会遇到导致停机的问题。 安排内部布置的硬件毛病和软件过错是不可避免的,但公共云为IT管理人员供给了应对这些问题的办法。公共云具有可用性调集、冗余数据中心、可用性区域和云区域,使管理人员可以在遭遇中止时更好地规划事务运营。这些战略很重要,但管理员有必要规划牢靠的应用程序,以运用公共云冗余功能。 安排IT财物的弹性更多地取决于应用程序而不是基础设施,这种主意与传统的思维办法不同。在过去的二十年中,管理员经过备份、复制和其他以基础设施为中心的技术坚持弹性。可是关于绝大多数公共云平台来说,此战略不再有用。 近年来,云计算供给商遭受的损失已超过其承受能力。云计算供给商供给的云服务在呈现中止时,行业厂商和用户好像都在学习怎么规划本地云冗余,管理人员希望将这些经验应用于传统的虚拟化数据中心冗余。 从头思考数据中心的冗余 关于大多数传统安排来说,一些基本的服务都是为防止停机而规划的。网络时间协议和网络路由等服务规划一般是高度冗余。然而,只是因为体系应该是冗余的,并不意味着其配置现已为运用自然冗余做好了充分准备。 一些核心服务并没有高度可用的选项。IT部门几乎总是面对有必要处理的技术债务,这就要求对行为并不理想的留传体系供给支撑。例如,一些留传的应用程序身份验证体系只能存在于服务器上,这限制了数据中心的冗余功能。 管理人员不应将所有鸡蛋放在一个篮子里。关于大多数的传统布置,最好在数据中心内部运用冗余硬件。管理人员可以经过运用不共享体系的冗余虚拟化群集来进一步采纳这种战略,这相似于可以供给多个可用性区域的云计算供给商。这可以使应用程序依赖数据中心更高等级的冗余,但只有当事务需求确保该等级的冗余维护时才有价值。 经过在云平台和数据中心之间并行施行这些战略,在选用相似的传统基础设施时,运用公共云供给商的概念(如可用性区域)或许会有所协助。这种术语使开发人员可以更轻松地了解基础设施概念,因为他们或许熟悉相似的云概念。 云计算冗余并不完美,停机中止供给了经验经验 高度冗余的体系不会免受性能下降的影响。在最近的公共云中止事件中,其目录服务无法使服务从一个区域坚持运行到另一个区域。从头调整的流量超过其他区域的能力,使服务无法满意需求。 当管理人员规划数据中心冗余时,他们有必要在发生中止时对负载进行规划。管理人员或许有两台服务器来支撑数据中心冗余,可是其中一台服务器或许无法处理整个负载。关键是需求规划满意正常和异常状态下事务需求的体系。 许多安排都以为假如配置正确,在中止期间会发现其他状况。Netflix公司推出的Chaos Monkey体系就是人们所熟知的模拟中止事件,而其供给的经验经验是,假如管理人员没有操练处理实际的中止,他们永远不会知道IT体系将怎么反应。而没有一个体系是孤岛,每个应用程序和服务都具有进一步使测验复杂化的依赖性。 停机中止在私有数据中心和公共云中并不罕见,但在数据中心内部,管理人员一般需求了解并了解体系的内部工作办法。当云计算供给商的服务呈现中止时,或许会感到并没有从停机中学到什么经验,但这不是事实。虽然公共云供给商运用与传统数据中心不同的工具和办法,但有关构建和调整冗余的经验经验是通用的。