首页 > 案例 > 千万分之一宕机率,这款服务器到底有多安全?

导读

从科学的角度讲,飞机是最安全的交通工具。据统计,其造成的伤亡事故率约为三百万分之一,远低于汽车、火车、轮船等。如果有人每天坐一次飞机,要经历3223年才可能遇上一次飞行事故,发生几率很小。考虑到飞机由几百万个零部件组成,可靠性又如此之高,除惊叹于工程师的智慧,更让人痴迷这是如何做到的?


为保障人们财产和生命安全,降低事故率,人类在打造产品和工具时一直都将安全性放在第一位。特别是随着智能工业的发展,高度自动化的工业系统不允许任何非计划停机事故出现,这不仅关乎人员生命安全,也直接决定了工业生产成本。因此工业企业对系统的可靠性和稳定性要求极高。今天我们要谈的这款产品,其可用性和可靠性比飞机还高,出现故障的概率低于千万分之一。这是什么概念?双色球一等奖中奖概率就是1700万分之一,请问您亲眼见过有人中千万大奖吗?


TITTLE 1

见证传统工业服务器全面换装

随着物联网、云计算、大数据以及人工智能等新兴技术快速融入到各行各业,传统的生产和运营模式正在发生根本性变化。一方面工业的全面数字化和智能化不仅带来的数据量的急速增长,自动化水平的提升也对工业控制系统的安全性带来的极高要求。另一方面经济的高质量发展也驱动绿色工业变革,必须充分考虑节能环保等需求。为增强系统的安全性,实现更高效的能耗利用,在电力、冶金、化工、制药、燃气等行业,企业开始重构从硬件、软件到通信链路等IT平台体系。


例如,在新余钢铁集团,面对市场对长材轧钢的产品质量要求日益提升,传统的管理控制模式已经无法满足当前的生产工艺要求。根据轧钢生产工艺智能化发展的趋势,提升高速棒材生产线的智能水平已成为企业迫切的需求。


为实现高棒线的高效运行,新钢将在现场导入MES系统。系统向下与自动化设备对接实现实时的数据交互,向上与企业ERP管理系统对接,及时获取生产的计划和变动信息。但由于MES需要持续从生产线的PLC获取实时数据,并进行现场的数据处理,因此对现场的数据采集服务器提出了非常苛刻的要求,绝不允许出现短时间的故障,否则将造成生产过程中的损失。而传统的双机热备架构,由于切换过程中存在空窗期,已经不能满足当前的不停机数据采集需求。


为此,企业最终采用了基于ztC的边缘计算方案。Stratus ztC边缘技术容错服务器具有零秒切换冗余能力,通过基于Micro checkpoint的容错同步技术,ztC提供了超过99.99999%的可用性,从而为用户的应用提供了FT容错级别的冗余保护。当ztC边缘计算服务器的硬件出现故障,服务器将自动完成故障的检测、隔离和切换,同时用户的应用不会停机,最大程度保证了用户控制系统运行的可靠性,确保了系统的可靠运行。


在生物制药行业,生产制造数据的全过程可追溯是最基本要求,这使得企业对产品生命周期管理系统的标准要求极高,如果仅依靠人工记录和维护,对实验室、生产车间、仓库关键设备及物质的实施监控管理,不但工作量大,还存在数据不完整性风险。


全球性医药公司TEVA在位于立陶宛的分公司,原来通过引进了KAYE无线实时环境参数监控系统LabWatch EMS,实现对产品生命周期管理。近年来,随着业务需求的飞速增长,KAYE LabWatch EMS开始面临诸多新挑战,比如随着无线监控点的扩充,系统性能逐渐趋于其临界点。


具体表现在:软件架构无法支持更多无线基站。硬件方面,OPC数据服务器分体架构、PC级别主应用、数据服务器的使用也使系统可靠性面临诸多系统安全和数据完整性方面的不确定性。除此之外,公司还得面向零下40度低温冷库搭建有线监控方案,并与原有无线方案实现无缝集成。



在TEVA公司IT部门主导和协助下,通过引入Stratus和洋米信息科技的外部技术力量,TEVA公司成功解决了问题。Stratus ztC Edge由单一系统的两个紧凑坚固的冗余节点组成,由于两个节点分别运行一个虚拟机,并且它根据一根心跳线监控两台服务器的健康状况,如果一个节点出现问题,那么它会启动另一个节点的虚拟机。它可以确保没有业务中断或者运行中数据的丢失,提供集成的灾难恢复功能。专为恶劣工业环境条件设计的 ztC Edge节点可部署在控制室、控制台或车间中,能够保持Windows和Linux应用程序持续运行,确保业务的连续性和数据的完整性并获得类似大型机的可用性。


TITTLE 2

全新高可用的冗余架构设计

在传统工业中,为保证工业系统的稳定性和可靠性,尽可能降低因软硬件故障造成的非计划停机事故,企业通常采用双机热备来提升系统的稳定性和可靠性。所谓双机热备就是使用两台服务器互相备份,当一台服务器出现故障时,另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。


双机热备的部署过程不仅复杂,且成本较高。实际情况是,双机热备切换是有个过程的,这个切换过程可能是一分钟左右。在切换过程中服务是有可能短时间中断的。因此,双机热备不是无缝、不中断的,对于一些完全不允许停机的重要工业场景,双机热备是仍然无法满足需求。


在前面的行业案例中讲过,Stratus ztc Edge边缘服务器是由单一系统的两个紧凑坚固的冗余节点组成,两个节点分别运行一个虚拟机,并且它根据一根心跳线监控两台服务器的健康状况,如果一个节点出现问题,那么它会启动另一个节点的虚拟机。这种架构与传统双机热备架构的最大不同是,可以确保没有业务中断或者运行中数据的丢失,提供集成的灾难恢复功能,真正的做到了业务不中断和无缝衔接。


ztc Edge不仅能做到系统级故障的快速切换,利用虚拟化、高可用容错软件提供节点系统化容错能力,即便是系统硬件模块设备发生故障时,依然可以保证用户数据采集业务的可持续运行。同时用户可以在产线边缘节点上就地处理和分析数据,保证数据的实时性和可靠性,完美替代传统工控机,可保证无人值守,降低了用户的TCO总体拥有成本。


在功能上,ztC Edge支持通用的OT和IT协议,更容易集成到现有的工业自动化环境中。在新余钢铁集团,MES需要持续从生产线的PLC获取实时数据,并进行现场的数据处理,就是通过ztC Edge实现对现场大量数据的采集与分析,真正做到了数据的实时更新,流转有序,也大大减少了操作工的工作压力和工作强度,实现了全流程的无纸化、自动化、智能化。


目前,面对如火如荼的数字化转型和工业智能化升级进程,为支撑工业智能化场景的落地,保证工业智能应用场景的稳定性和可靠性,一方面Stratus与合作伙伴一起,针对不同制造企业的应用需求联合构建高效低成本的平台方案,实现对传统工业服务器的替换。另一方面也通过强化与合作伙伴的合作,针对成熟的工业应用场景构建通用化的平台解决方案,将OT和IT最佳实践结合在一起,发挥数字化转型的潜力,最终实现所有目标。