全景感知的智能运维体系守护数字业务生命力

上海2022年3月2日 /新闻稿网 - Xinwengao.com/ — 近日,凭借智能运维管理体系赋予云原生业务可观测性能力以及保障千行百业数字化业务的高质量发展,天旦荣膺由BP商业伙伴颁发的“智能运维100强”

云原生时代须要可观测性能力

2021年是云原生技术的全面爆发之年,从底层平台到上层应用,云原生技术重塑IT架构的同时,也对运维管理带来挑战。容器、微服务等技术尽管可以承载业务并发量的指数级增长,支持业务需求的频繁变更,但随着应用架构的不断变化,一旦业务出现问题就难以精准定位到发生故障的节点,传统被动响应式的运维管理模式显得捉襟见肘。云原生环境下,新一代的业务运维管理需要更主动、更敏捷、更适应规模化管理的能力升级。

从传统的APM产品到日志监控工具,云原生可观测性概念在智能运维管理领域的热度不断提升。介于传统的智能运维产品仅面向服务端,解决基础运维问题,而云原生环境存在着复杂的分布式系统,需要尽可能多地收集所有系统组件的相关数据(包括云、容器、终端与应用等),实时评估业务的运行状态。此外,大家都知道“Metrics、Tracing与Logging”是“可观测性能力”的三大支柱,在云原生运维实践中,必须建立统一的Metrics、Tracing与Logging规范,才能快速地发现问题,找到问题根因。

(可观测性能力的三大支柱:Metrics、Tracing与Logging)
(可观测性能力的三大支柱:Metrics、Tracing与Logging)

天旦“全景感知”的智能运维体系,守护数字业务生命力

从On Cloud到In Cloud,云原生2.0的时代已经来临。面对敏捷的云原生业务,企业一方面需要应云而变,运用主动发现等可观测性能力实现云原生环境下的智能故障诊断与根因分析;另一方面需要借助更敏捷、智能的网络与业务运维管理产品以解决监控节点数量的成倍增长、监控数据采集难、海量数据处理瓶颈等规模化运维管理难题。为此,天旦通过一项核心技术、三大核心产品帮助企业快速构建全景感知的智能运维体系,通过一体化的性能监控管理灵活应对云原生应用的弹性扩缩与规模化集群,实现实时感知、敏捷扩展的运维管理能力新升级,守护数字业务生命力。

(天旦全景感知的智能运维体系)
(天旦全景感知的智能运维体系)

  • 全景感知”的智能运维体系,具备主动发现能力

云原生环境,由于系统整体行为方式发生变化,导致为这些系统、应用提供的保障与服务也随之改变。即使是智能运维产品也只是报告系统整体的运行状况,被动地呈现“失败”与“故障”。而随着大量分布式系统、规模化的微服务部署之后,影响故障产生的因素可能出现在任意细微的节点,如何主动发现这些问题、调取影响故障的全路径、详细分析故障产生的原因就需要运用主动发现能力。

天旦全景感知的智能运维体系以核心的互联数据技术为基础,首先将云原生、混合云等环境中的网络数据进行全量采集,其次通过分析与解码,理解并还原数据的传输路径、业务与上层应用的表达,将各种各样的业务系统语言、网络传输路径等转换成统一的格式,最后通过建立统一的Metrics、Tracing与Logging数据规范,综合运用“依赖分析”、“剖析”与“排错”等主动发现能力,通过指标实时呈现网络与业务实时动态,调取模块间的交互状态,基于逐层下钻分析获取详细的日志信息,实现智能故障诊断与根因分析。

  • 全景感知”的智能运维体系,具备业务可观测性与云网可观测性能力

传统的智能运维管理已经无法适应云原生环境。智能运维(AIOps)的概念最早由Gartner提出,是指通过将机器学习等人工智能技术应用至运维管理过程中,自动地从海量数据中学习并总结规则,作出相应决策的运维方式。尽管智能运维管理技术改变了传统的运维工作模式,将运维从繁琐的故障排查流程中解放出来,但在云原生环境下,IT架构发生改变,无法感知与预测的因素越来越多,智能运维管理无法再单独以运维的视角,而要融入开发与业务部门的视角,在具备主动发现能力的同时,运用全链路业务可观测性能力与云网可观测性能力保障网络与业务系统的稳定。

天旦运用Cloud Probe云流量可观测性采集产品将公有云、私有云、混合云、虚拟化、容器等环境中的网络流量通过微探针、旁路探针、SDN引流等多种方式进行全量采集与集中管控,再通过互联数据智能解码引擎进行分析与处理,运用具备云网可观测性能力的网络性能管理NPM智能关联中间件、网络与应用交互各节点的逻辑访问关系,综合分析IT基础设施指标与网络指标,构建对云网环境的全景、立体式监测;运用具备业务可观测性能力的业务性能管理BPC,通过全链路监控,提供四大指标与两大维度,实时感知业务变化趋势,实现单个业务请求全生命周期的观测与分析,为云原生、混合云环境下的全链路业务监控提供保障。除此以外,全景感知的智能运维体系还能为企业提供安全审计、监管上报、科技绩效管理等管理能力,实现以业务核心的综合运维管理能力的新升级。

(天旦,智能运维产品体系构建云网可观测性能力 敏捷应对云上业务动态)
(天旦,智能运维产品体系构建云网可观测性能力 敏捷应对云上业务动态)

从恒丰银行、台州银行、联通支付到厦门国际银行,“全景感知”的智能运维体系不仅助力众多国内金融机构的数字化实践,还在制造、医疗、政府、能源电力等众多行业成功落地。随着云原生技术的不断发展、云原生应用程度的不断加深,智能运维管理的难度也在不断上升。除了需要应对新技术应用所带来的挑战外,各行业还需要面临严峻的市场竞争、国际形势变化等众多考验。在迈向云原生2.0的关键时期,天旦将持续以全景感知的智能运维产品体系为依托,运用统一可观测性能力赋能企业的运维管理工作,为企业的数字化业务高质量发展保驾护航。