云智维运维中台V3.0

云智维运维中台,南天信息自主研发的智能化运维管理平台,融合ISO20000、ITIL、DevOps等标准,运用云计算、大数据技术,集一体化监控、自动化运维、IT服务管理等多功能于一体。通过抽象运维基础能力,促进资源、数据互联互通,驱动运维工具从“竖井式”转向“一站式”平台,加速运维场景迭代,构筑绿色数字运营生态。
申请使用

产品名称:

 

云智维运维中台V3.0

 

产品简介:

 

云智维运维中台,南天信息自主研发的智能化运维管理平台,融合ISO20000、ITIL、DevOps等标准,运用云计算、大数据技术,集一体化监控、自动化运维、IT服务管理等多功能于一体。通过抽象运维基础能力,促进资源、数据互联互通,驱动运维工具从“竖井式”转向“一站式”平台,加速运维场景迭代,构筑绿色数字运营生态。

 

产品定位:

 

面向云数据中心,实现对资源、数据的互通互联,支持运维场景的快速迭代开发。全面提升运维工作的标准化及工作效率,大幅降低运维管理成本,推动运维工作由传统数据中心向互联网+数据中心转型升级,助力行业客户打造一体化、智能自动化的双态数据中心。

 

产品说明:

 

云智维运维中台是南天面向云数据中心的一体化智能运维管理平台,该平台基于ISO20000、ITIL、ITSS、DevOps、AIOps等标准及理念,立足于云计算、大数据、移动互联、物联网等先进技术,体现了南天在数据中心运维服务领域的大量最佳实践经验。该平台包含一体化监控、自动化运维、IT服务管理、配置管理、数据操作管理、Devops管理、运维采控、运维大数据、智能运维、移动运维、3D机房可视化、2D可视化、运维报表管理等功能模块。云智维运维中台是南天信息对运维基础能力进行抽象提取,将运维经验、工具及算法下沉,实现对资源、数据的互通互联,推动运维工具建设从“竖井式”向“一站式”、“平台化”转型升级,支持运维场景的快速迭代开发,构建绿色的数字运营生态体系。

 

产品核心功能:

 

(a)统一采控模块

高可用的统一采控框架:采用Server/Proxy/Agent三级部署方式,支持多中心集群部署和各中心分别部署集群的模式。

区域调度优先机制:任务调度支持区域优先的模式,任意的节点出现故障,均可实现秒级的故障转移。

Agent场景兼容性:一个Agent支持完成所有运维管理场景的任务,无需部署多个Agent;支持部署运行在所有主流OS平台。

Agent插件化扩展:支持插件化扩展功能,能够按需增加采集插件,扩展采集能力;能够对插件进行可视化管理。

Agent在线运维能力:支持通过Web管理端进行Agent的远程批量安装及升级;具备Agent自维护能力。

Agent本地缓存转发能力:支持缓存转发,当网络出现故障导致数据无法回传,提供数据缓存功能,等待网络恢复后再次提交缓存的数据。

跨网络域管理能力:通过Proxy的机制支持跨网段Agent与Server的通讯;对目标服务器操作系统的访问同时支持代理与非代理2种访问模式。

Agent资源消耗控制能力:具备多种熔断策略,当系统负载超过设定阈值,能够根据策略进行熔断、告警及自动恢复功能。

自动发现及采集能力:支持通过多种协议对目标网段进行自动发现功能,发现并识别各种资源对象,支持对详细配置信息的深度发现。

统一脚本开发管理平台:志成脚本的在线开发,支持代码补全、高亮显示。支持脚本集中管理;

脚本服务化抽象封装能力:支持将不同操作系统上相同功能脚本发布成一个服务对外提供调用,屏蔽OS的异构性。

命令服务化抽象封装能力: 支持对各种网络设备的访问命令进行封装的能力,屏蔽掉厂商/型号的差异,支持对命令执行结果的加工解析。

统一采集指标管理仓库: 提供统一集中的指标管理功能,实现对各种指标的集中存储。

eBPF采集能力: 具备通过ebpf方式采集数据的能力,支持编写丰富的数据过滤表达式以过滤出符合条件的事件。

日志采集能力: 支持秒级及分钟级采集,支持日志内容压缩传输;支持日志的多行合并及过滤。

 

 

(b)统一监控模块

全栈式监控采集能力:内置丰富监控指标,支持对包含信创在内的常见的配置对象的监控。

可扩展的监控采集指标开发能力:基于平台提供的协议方式,运维人员可进行指标二次开发。

低耦合监控模板:通过提炼监控对象的共性监控指标及阈值,轻松实现批量管理

多维度的监控数据展示大盘:提供灵活的数据面板,直观的展示监控数据,按需打造面向各岗位、各职能的专属监控面板

多种监控告警阈值方式:支持对指标设定固定的单指标阈值,多指标组合阈值。同时也具备联动算法平台,通过机器学习,设置动态阈值。

全景式应用监控视角:支持以应用系统为维度,帮助运维人员把控应用健康。

多源异构日志分析:内置丰富日志解析模板,支持日志秒级采集。支持手工定义应用日志解析规则;具备日志模式识别和异常检能力。

一站式告警事件台:提供集中式告警中心,具备对告警查看、确认、升降级、告警批量处理和关闭、告警导出。

丰富的告警自动处置策略:支持配置灵活策略条件及规则,实现对事件的自动过滤、收敛、升降级、延迟告警等策略的灵活配置。

便捷纳管监控:自动识别配置对象中未监控的对象,并能够自动匹配对应模版实现批量添加监控。

 

 

 

(c)自动化运维模块

应用发布自动化:提供应用发布过程、操作通过自动化流程、脚本重新进行编排和规范,形成一键式、自动化的操作场景。

批量自动化:提供各个系统将分散的日中和夜间执行的批量操作脚本/命令、过程,按批量流程进行周期性的自动化调度场景。

巡检自动化场景:将日常人工例行巡检以自动化的方式实现一键或定时周期巡检的场景,便于运维人员快速掌握系统整体运行状况。

灾备切换自动化:提供业务系统在多数据中心架构下应用、系统、网络等服务与配置的一键自动化灾备切换场景。

应急操作自动化:提供运维中心应急操作处置动作的标准化、规范化的一键执行能力。

软件安装自动化:替代传统的人工安装方式,将主流软件产品操作系统补丁包等进行统一的管理,实现批量静默快速部署。

运维工具箱:将日常运维处置操作以命令、脚本的方式固化成工具,通过平台实现一键自动化操作。

 

 

(d)配置管理模块

拖拉拽的模型及关系建模能力:通过web端的拖拉拽的方式快速创建模型、属性字段、验证规则、CI关系;支持自动采集和人工维护进行属性维护。

预制大量开箱即用的模型及属性:预制数据中心各类常规对象模型及属性,内置8000+项开箱即用的指标。

云原生应用整合能力:通过对K8S的抽象整合,实现云上/云下应用服务模型的整合,通过K8S事件监听保证POD动态漂移信息的保鲜性。

配置自动发现及采集能力:具备通过Agent或协议方式对配置对象信息的采集;支持网络自动扫描;支持云原生的全链路追踪及采集。

健全的数据质量保证措施:支持通过数据质量的检查任务,对现存的配置数据及新增的配置数据质量进行检査。

IP地址的“规划-现网CMDB”三态一致性:可实现IP地址的规划、现网在线、CMDB库存3种形态的一致性。

多视角的配置信息查询能力:支持一键搜能力,实现对模型、对象、关系的查询;支持查询应用关联的各种资源对象;支持关系路径的查询。

全生命周期的资产管理能力:支持通过流程管控对资产的全生命周期进行管理。支持通过二维码、条形码、U位对资产进行精细化的管理。

多维度的配置关系拓扑展示能力:支持多维度的拓扑展现方式;支持拓扑图的自定义分组;支持全链路拓扑査询。

3D可视化的IT资产展示能力:支持数据中心三维空间视图的可视化,具备丰富的设备模型库,支持精细化建模。

 

 

(e)流程低代码

完全自研研发的流程引擎:完全自主研发设计的流程引擎,代码完全自主可控,功能更贴切ITIL业务流程等优势。

可视化流程开发能力:通过图形化拖拉拽这种所见即所得的设计模式能够快速实现流程的编排和部署。

内置丰富的前端页面UI组件:平台提供丰富的UI组件,能够快速完成表单及流程设计;支持对各组件进行相应的个性化属性设定。

可视化的页面逻辑再编程能力:管理员无需学习相应的编程知识,通过流程引擎提供的可视化编排功能即可完成通过写代码才能实现的业务逻辑。

强大的流程流转控制能力:流程具有丰富的业务功能,无需编写任何业务代码。

支持多版本并行:多版本之间互不影响,同时流程管理员可以随时切换版本。

工单委托能力: 支持将本人工单委托给其他人处理,在指定时间内,可将指定类型的工单转移给指定用户代为处理。

SLA及灵活的通知策略配置: 通过SLA或流程策略,可以配置流程处理超时的通知策略及应对方式,为绩效考核提供数据支撑。

提供深度二次开发能力: 流程引擎提供灵活的二次开发能力,客户可通过流程引擎提供的API接口,可以编写自己的业务功能。

开放的的第三方系统集成能力: 通过流程引擎内置的API节点功能,可以快速配置接口信息、报文信息等即可完成与第三方系统接口。

 

 

(f)数据集算法模块

完全自研的可编排数据处理任务引擎:平台采用自主研发的Flink算子封装及编码转换引擎,代码完全自主可控。

可视化数据任务编排能力:支持图形化拖拉拽方式进行数据处理任务的设计和组织;任务支持在线、离线、API模式运行。

任务编排内置丰富的数据处理算子: 平台提供丰富多样的数据处理算子,支持快速开发扩展新算子,以及迭代完善已有算子。

全生命周期数据管理能力:平台在数据的整个生命周期内提供全方位的支持和管理,可贴合运维数据特征进行全面、持续的管理和跟踪。

多元异构数据管理能力:平台具备处理多种不同类型和结构的数据的能力,能够在同一平台灵活地接入和处理各种异构数据源的的数据。

算力均衡能力:支持根据算法场景进行算法资源隔离;支持算法资源组内,资源调整的平滑过渡。

AI实验室算法调参能力:支持的算法调参能力。支持利用历史数据或样本数据进行训练。

运维基础算法库:提供运维常见算法泛型,算法泛型支持基于日志表进行计算和分析。

 

 

(g)可视化模块

热部署能力:支持在线导入、导出功能,可在不重启可视化服务的情况下,在线完成生产环境大屏升级变更的热部署操作。

强大的事件处理能力:支持多种时间触发场景支持事件动作,包括打开新的页面、打开新的连接、大屏下钻、刷新目标组件等。

丰富的UI组件能力:平台内置100+开箱即用的大屏组件,可以对组件的自身属性进行定义;支持基于当前组件的继承二次开发功能。

大屏定义及展示能力:支持大屏的模版复制、导入、导出功能,便于快速搭建及投产;支持单独播放、多个屏幕组合动态轮播功能。

 

 

(h)报表模块

数据整合能力:平台支持多种数据源接入,包括:数据库(Oracle、MySQL、DB2、TDSQL、达梦等)、JavaBean、API等,支持加入查询条件,以过滤所需数据。

自动化报表生成能力:平台支持配置报表定时触发器,支持以分钟、小时、日、周、月、季度等维度自动生成统计报表,并可以通过邮件发送到指定用户邮箱。

多样化的报表开发能力:支持通过简单的拖拽和配置就可以轻松生成报表;支持导出各种格式的报表文档。

 

 

产品亮点:

 

(a)多源混合数据采集引擎

通过开放的API接口,广泛接入企业IT系统的不同数据源的数据,实现多源混合数据的高效采集。

(b)实时感知与计算

通过人工智能对依靠人力决策的环节进行持续学习和自动化响应,实现高效的实时感知与计算能力。

(c)海量大数据存储架构

平台进行海量大数据存储架构设计,将大量、多变、高速的运维数据进行统一、高效的存储、管理和调度。

(d)领域全栈覆盖能力

将智能运维领域覆盖到应、系、网、存储等各个领域,真正实现IT运维全领域的智能运维。

(e)“智能化”决策中枢

通过机器学习构建智能运维管理平台的智能决策中枢,进一步解决自动化运维没办法解决的问题。

(f)可视化引擎

平台提供可视化引擎,将智能运维的关键指标与智能决策自动化场景等信息,以可视化形式实时展现。

(g)敏态智能运维

快速迭代、持续交付、自动伸缩、调用链分析、故障定界定位与恢复、离线分析与规划蓝图,实现智能运维。

 

 

产品参数:

 

产品版本:V3.0

操作系统:Linux、Windows

所属类别:金融科技

上架时间:2021年6月30日

 

 

 

适用场景:

 

(a)监控

全时段监控业务系统在应用、系统、网络、机房动力等各方面的运行,速报故障,促处理,保障系统稳定。

(b)统一采控

跨网络域管理,Server与Proxy集群化,实现任务智能分发,数据缓存到消息队列,减轻Server及DB压力。

(c)系统投产部署

基于DevOps理念,实现从测试到生产自动化部署,包括版本管理、脚本执行、过程监控等,快速交付更稳定的软件。

(d)故障定位

调用链根因定位系统利用系统或服务间的调用链数据,精准定位多层架构故障源,简化运维排查流程。

(e)预测

大数据分析预测磁盘、网络、内存等故障,提前规划服务,延长设寿命,降低故障率。

 

产品优势:

 

(a)运维PaaS开发平台

采用Web可视化技术,通过拖拉拽的方式快速开发;提供标准化运维工具及场景的组件、模板。

(b)丰富的运维场景设计

在容灾切换、应用发布、批量调度、应急处理、日常运维等丰富场景中贴近客户实际需求。

(c)统一资源管理入口

采用统一的资源管理引擎,支持采用单一代理或无代理的资源管理方式,支持异构资源管理。

(d)一体化的产品关联

采用统一技术框架,各子产品之间内置无缝接口,简单配置即可互联贯通,降低二次开发成本。

(e)敏捷灵活的产品组合

云智维的各子产品可以整体组合,也可按单个产品进行配置,满足用户不同的运维建设需求。

 

产品规格:

 

(a)功能需求:‌云智维运维中台是南天面向云数据中心的一体化智能运维管理平台,主要功能包括:运维采控中台、运维数据中台、原子作业平台、Pass开发中台、运维服务总线、流程低代码、统一编排、自动化运维、配置管理(CMDB)、统一监控平台、日志监控、应用监控、IT服务管理、告警中心、智能运维等功能。‌

(b)性能需求:‌云智维运维中台采用高可靠性的先进技术,关键组件采用冗余设计,具有强大的容错能力和恢复能力;支持7*24的连续运行;平台可用性达到99.99%。支持大数据量的高并发事件处理能力,系统响应时间单节点TPS>200,支持同时在线人数不得低于1000人。‌

(c)‌安全需求:‌云智维运维中台提供完备的认证管理、权限管理、密钥管理方案。采用数据加密、传输加密、存储加密的设计。提供完备和切实可行的数据备份、恢复和迁移方案。‌

(d)可靠性需求:云智维运维中台提供多用户、多节点、复杂环境下的高可用性方案。提供可操作的运行监控和维护制度、故障处理预案。根据自身产品情况提供系统有关可靠性的指标值,以及保证整个系统稳定运行所采取的有效手段。‌

(e)维护性要求:云智维运维中台提供系统完善的日志流水记录,定义多级日志级别,通过参数灵活进行调整,通过系统日志可实现错误的快速定位和排查。具备友好的用户操作和维护功能界面,以便于系统的日常监控与故障分析。采用规范的返回码设计,准确展示系统报错信息,对关联系统的返回信息进行适当的适配映射,做出明确的中文解释。

 

 

 

 

产品说明图:

 

img1

产品详情

试用申请

联系我们
Email: contact-us@flashcat.cloud

或者提交下面表单,我们会及时与您联系

产品名称 *

您的姓名 *

公司名称

手机号码 *

工作邮箱

首页    IT运营维护    云智维运维中台V3.0