运维管理

2022-03-24 版权声明 我要投稿

第1篇:运维管理

通信运维管理发展趋势

摘要: “十一五”前期,以“质量、安全、效率、效益、服务”为指导思想,中国各通信运营企业已初步构建了自身特色的现代通信网络运维管理体系。通信网络运维呈现高度集中、客户感知、网络经营、服务品牌、运维外包5个主流趋势,这标志着中国通信行业的运维管理水平与管理能力达到相对较高的层次。这不仅仅是管理思想理念的进步,更是现代企业管理方法与信息化技术在企业实践中的深度应用与协调发展。

关键词:通信网络运维;运维管理;发展趋势

Key words: communication network operation and maintenance;operation and maintenance management; development tendency

1 通信运维管理现状

自90年代以来,中国的产业制度变革带来通信运营业高速发展的同时,也为通信网络运维的体制变革、管理创新、能力提升营造了良好的环境。各通信运营企业基于自身的业务与网络特点,立足国情,积极、努力探索新的竞争形势下,提升网络运维服务能力和水平的新思路和新举措。由于历史沿革、网络技术、业务特点、信息系统、人员构成、管理机制、治理结构、组织文化等诸多因素的影响,中国各大通信运营企业在网络运维管理的体制、手段、效率、能力、服务水平等诸多方面差异较大,可比性不强;但是,在服务理念上,在发展趋势和发展方向上,行业的主导观点是一致的。各企业在运维体制创新、制度改进、信息化手段建设与应用、人员知识结构调整等方面,都取得长足进步,较好地支撑了业务推进、市场发展与客户服务工作。同时,各运营企业在网络维护上取得很多卓有成效的、富有时代特色及自身特色的成果和宝贵的经验。

中国移动自成立以来,利用其网络简约、技术先进、体制灵活的后发优势,轻装快进,立足国际视野,科学制定网络运维管理规划和方案,依靠其极强的战略执行力,2002年在全国率先建成两级网管系统,在此基础上,通过加强资源管理、局数据集中制作、推进流程穿越、完善网络服务体系等一些列举措,形成集团/省两级高度集中的、高度集约化的现代运维管理体系,有效支撑了用户迅猛发展、网络业务量剧增、新业务快速推出的发展要求。其运维能力和水平跻身国际领先行列,中国移动的网络运维管理经验和成果对其他通信企业具有积极的标杆示范意义。

原中国网通,迫于业务增长的压力,2007年提出“经营网络”的发展观,并制定了《中国网通2007—2009年网络运营规划》,规划中对网络运维部门如何服务市场、开发新业务、资源利旧、支撑系统建设、队伍建设、组织结构调整、制度流程改进等方面提出很多操作性很强的管理举措,这对于传统的固网运营企业具有重要的现实意义。即使在重组之后,“经营网络”的理念和举措在今后较长时间内仍然具有重要的指导意义和推广价值。笔者认为,“经营网络”的发展观,是固网运营企业网络运维的“科学发展观”。

中国电信,最先提出向综合信息服务提供商的运营转型,在大客户信息与通讯技术(ICT)服务支撑、大客户网络维护与服务响应、信息服务支撑体系和宽带接入网维护方面具有较强优势,总结并积累了很多有益的经验。对全行业具有很好的借鉴意义。

目前,全国通信网络运维从业人员有40万左右:其中,通信运营企业占28万,实业公司、中国通信服务集团公司、第三方专业服务公司、网络优化公司等约有2 000多家,从业人员有10万人以上。受专业化外包、集中化运维的影响,通信运营企业运维人员的比例有逐渐减少的态势。

“十一五”期间,各运营企业的网络运维部门,除了服务日常的企业运营工作以外,在社会防汛通信保障、防恐应急通信演练、奥运通信保障中均发挥了重要的作用,确保了若干重大会议期间通信网络的安全,提高了企业与通信全行业的整体形象。

2 通信运维趋势

中国通信运营企业网络运维发展的要求和总体趋势伴随着通信运营市场化的进程,一直处于变中求进、进中求新的螺旋式上升状态。“十一五”期间,其发展趋向和特点基本明晰,总结归纳起来,通信企业网络运维管理呈现5个主流趋势:高度集中;客户感知;网络经营;服务品牌;运维外包。这5个主流趋势,既符合现代通信运营企业管理精细化、服务客户化的根本要求,也体现或者标志着中国通信行业的运维管理水平、运维管理能力达到相对较高的层次。

2.1 高度集中

运维管理的高度集中,源于现代通信技术、网络管理技术等要素与管理体制的综合驱动。运维管理的高度集中,符合国际运营发展趋势,是企业集约化、低成本、高质量、高效率运营的基础。由于国内各运营企业的发展进度、网络环境、系统环境、人员素质、管理水平各不相同,网络运维集中化的程度、进程还存在很大差异。

从组织管理角度,集中化实际上是组织管理的模式转换过程,涉及工作程序、行为方式、管理方式、思维习惯、价值观念等。 集中化运维管理的实施主体是网络部门,还涉及计划、人事、财务等职能部门,是一个庞大的系统工程,涵盖网络建设、支撑体系建设、组织结构建设、管理制度建设与业务流程再造、员工配置与培训等诸多要素。

从技术角度,一方面,通信网络已经并将更多地采用大量的IP分组交换技术,网络将从主要承载话音业务转变为以IP数据流量为主,网络IP化进程的加快促进了网络运维的集中化程度;另一方面,集中化网管系统的开发建设为高度集中化的网络运维提供了技术保障。集中化的建设模式加快了各专业网管的建设,缩减了各专业网管系统建设的周期,增强了企业的市场竞争能力。在专业网管系统建设应用的同时,面向网络维护服务的各类支撑系统得以广泛开发应用,全面促进了维护工作的信息化水平,推进了维护工作的流程化、自动化、规范化。集中化网管系统以及相应的维护服务支撑系统的建设,为网络维护的三集中奠定了坚实的技术基础。

从管理体制角度,各通信运营企业都在自身的业务、网络基础上,积极努力推进网络维护集中化。在集团级、省公司级、地市级分别实现了不同程度的集中化维护与管理。“十一五”期间,职能化生产单元的迅速扩张反映了生产集中化程度的加深,各运营企业传统的网管中心(或者网络维护中心,以下同)的职能已经发生根本性的变化,网管中心由传统的辅助行政管理的角色完全转变为以生产职能为主,网管中心已经不再局限于话务分析、报表的范围,真正实现了网络运行全过程实时的维护、监控、管理,与客服、市场、业务等部门建立起越来越密切的关系。网管中心实现了对各专业网络进行集中监控、性能分析、数据统一制作、资源统一调度、网优方案集中制定等面向生产的指挥调度与管理职能。

集中化的网络运维管理,适应通信技术快速变化、竞争日趋激烈的产业环境,行业内网络维护人员的综合素质在迅速提升,人力资源共享的程度和广度在加深,人员利用率、生产效率大幅度提高。通信运营的业务实现、业务保障、成本控制的能力进一步加强。

2.2 客户感知

客户感知是指客户对网络质量是可深入认识、感知的,良好的网络质量感知是公司核心竞争能力的直接表现。客户对业务使用的要求不仅要能用,还要好用。随着数据业务的快速发展和网络IP化等新技术的发展,传统的网络质量评价体系已经不适应现有的服务环境和网络环境,运维管理的质量评价必须注重客户感知。全面推进基于客户感知的网络质量评价体系是企业关注的重点之一。自2007年起,信息产业部电信规划研究院、广州移动、浙江移动等多家单位在跟踪研究欧洲电信标准化协会(ETSI)/世界电信管理论坛(TMF)等国际标准组织的基础上,都在研究探讨面向客户感知的网络质量评价体系。目前,客户感知的理论体系日趋成熟,生产实践中也产生很多可以借鉴的经验和成果。

2.2.1 传统网络运维评价体系的缺陷

(1)传统网络质量评价体系不能全面反映客户体验。

其质量指标体系局限于设备和系统范畴,难以全面反映业务端到端运行质量和客户实际使用感知。全网海量数据掩盖了局部质量问题。传统网络质量指标与用户投诉之间存在着明显的不一致或反向关联,通过提高传统网络质量评价指标来提升客户满意度效果不是十分明显。如同样的基站退服时长,发生在农村/城市、忙时/闲时各不同的空间和时域,对客户感知的影响程度是大不相同的。

(2)传统网络质量评价体系不适应数据业务快速发展的需要。

随着数据业务在总业务收入中的比重越来越大,用户对数据业务的投诉占总投诉的比重也在不断增大。由于数据业务相对于传统话音业务具有种类多、变化快、涉及的网元多、用户行为复杂及显著的时间突发性、空间聚集性等特点,用传统的网络维护手段去维护数据业务网络很难达到令人满意的结果。现有的基于各网元分散的主要业绩指标(KPI)并不能反映具体新业务的质量,有必要针对具体业务来研究该业务在各网元环节关联度高的KPI集合。

(3)传统网络质量评价体系落后新技术发展。

时分复用(TDM)网络话音质量主要决定于物理链接故障。随着软交换、网络IP化等新技术的演进,交换机实现了控制和承载的分离,同时信令、话音业务都利用IP网络承载。而IP网络的固有特性容易产生瞬间丢包、时延等现象,传统网络质量监控手段和传统的统计报告不能及时反映瞬间的故障情况,且故障定位比较困难。

综上所述,传统的网络质量评价方法只能反映网络或设备的性能,不能反映所承载业务的质量,必须从客户体验出发,从提高客户的网络满意度出发,建立新型的基于客户感知的业务端到端质量评估体系,科学反映与用户使用和感知最密切的网络质量情况,进而有针对性地开展网络维护工作。

2.2.2 客户感知评价方法

客户感知模型的建立,就是建立关键质量指标/体验质量(KQI/QOE)与KPI的关系。从端到端视角审视服务建立、服务使用、服务断连、问题处理4个关键服务质量指标(KQI/QOE)的网络影响因素,并梳理这些网络影响因素相关KPI。基于客户感知的网络质量评估方法可通过对某项业务的KQI及其子KQI分别进行统计评估,建立网络KPI到业务KQI的映射模型,对所承载业务质量进行评估。

影响业务质量的KPI有很多,但用户对这些KPI的感知程度是不一样的。如:通常情况下,用户对全网性的指标感知不明显,仅需要设定一定限度的健康值即可,区域性的、小区级的指标对客户的感知度影响较大,这部分指标的恶化会直接导致该区域用户投诉的产生, 对于不同的业务,用户对相同KPI的感知也不尽相同。因此,需要针对特定的业务建立从网络KPI到业务KQI的映射模型,从而对该特定业务建立基于客户感知的网络质量评估体系。通过统计各子KQI下各全网性KPI和局部劣化KPI的值,计算出子KQI的值,进而根据约定的权重,计算出业务质量KQI,该KQI即为现状网络环境下所承载业务的业务质量评估值。

在网络KPI收集过程中,重点挖掘那些传统指标中没有关注但能反映客户感知质量的指标。能反映客户感知质量的非传统指标如出小区切换呼叫比、位置更新比、跨A接口切换比等。

对于传统网络KPI指标,从客户感知角度进行重新定义和统计评估。如,对于同等历时的同一网络故障,传统网络KPI往往得到同样的质量评估结果,但故障发生的时间和空间的不同对客户感知的影响差别巨大,如同样的基站退服,忙时与闲时、城区与农村的差别是明显存在的,对于无线网络拥塞,全网的拥塞率仅代表一个平均的网络健康状况,但往往掩盖了局部高比例拥塞造成客户感知严重劣化的事实。因此,对于部分传统指标,从时域和空域的角度进行更细粒度的监测和评估将更全面反映网络客户感知。

2.3 网络经营

网络经营理念充分体现了网络运维工作的未来发展方向。通信网络是企业赢利的基础,是支撑企业发展的硬件平台。通信运营企业的经营即是对企业网络资源的经营。网络运营管理水平直接关系到企业的生存和发展,从网络运维转向网络经营,就是把网络视为企业的重要资源进行经营,在保障网络质量、安全的基础上,提高运维效率和运维服务水平,提高网络运维效益。网络经营是企业集约化管理、精细化管理的体现,使“网络经营”和“业务经营”在企业层面融为一体,最大程度上开发和有效利用企业资源,力求企业经营效益的最大化。营销大师菲利浦•科特勒说:“当公司所有部门都能为客户利益服务时,就能体现公司的整合营销能力”。网络经营的理念和各项举措,符合中国各通信运营企业所处的发展阶段和发展要求。相对中国移动,原中国电信、中国网通等固网运营企业对网络经营的要求更为迫切。

2.3.1 网络经营的本质

20世纪90年代,运维发展的要求是保障网络安全、质量可靠;“九五”期间,注重运维效益;“十五”期间,强调运维服务;“十一五”期间,在满足基本要求的基础上,降低运维成本、延伸运维服务范围、拓展服务能力、提升运维价值、创造更多效益。这也是网络运维者与网络经营者的基本区别。

网络经营是在网络运维功能、范畴基础上的延伸或拓展。网络经营的本质,就是紧密结合“服务性”和“效益性”的根本要求,通过整合客户资源和网络资源,发挥网络服务、信息化服务和运营分析的优势,通过网络服务创造效益,同时提升对市场营销、企业经营决策的贡献力度。网络经营要求网络运维部门树立市场观、服务观和效益观,以市场为导向,深化网络分析,主动支撑市场,提升网络营销能力,提高科学决策水平;以客户为中心,提升各类网络服务能力,创造客户价值;以效益为标准,整合网络软硬件资源,提升网络综合效益,发挥网络最大价值。不断创新,提高公司整合营销能力和综合应对市场的能力与精细化管理水平。

2.3.2 网络经营的特征

网络经营主要有4个特征:一是以客户为中心,全面提升网络服务手段和服务能力,提高客户满意度和忠诚度,为客户创造价值,为公司赢得新的利润增长点,提升公司的核心竞争能力。重点在完善基础服务的基础上,设置专门的机构和人员,重点实施面向大客户的拓展服务。二是以市场为导向,合理配置资源,调整改造流程,深化网络分析,提升网络营销能力,主动支撑业务和市场经营,提高企业经营决策水平。重点通过组织与流程优化调整,借助技术手段,提供多种方式的市场服务。三是以质量为保障,通过创新机制和技术手段,优化网络结构,提高网络的安全性和可用性,建立基于服务等级协议(SLA)的网络保障体系,实现业务的快速开通和持续运行,打造精品网络。重点实现从被动维护向主动服务的转变,创新发展运营支撑系统,全面提升网络的服务质量。四是以效益为目标,通过优化网络资源,提升资源利用率水平,充分利用现网功能,积极开发、包装新产品;通过网络资源的整合,降低运维成本,发掘网络资源的最大价值,提升网络的综合效益。重点在保障高水平服务的基础上,提高网络资源的利用率,降低运维成本,实现精益运营。

2.3.3 网络经营的重点

网络经营有3个方面的重点工作:一是强化服务支撑能力。面向外部客户和内部客户,推进基础服务、市场服务和拓展服务。二是提升资源运用水平。加强网络优化的同时,提升资源利用率。挖潜现有网络资源,丰富提供业务种类。加强与厂家的沟通联系,跟踪业界新业务新技术的研究成果,做好现有设备的多功能开发,通过加强网络平台的业务功能开发与服务创新。三是推进夕阳业务、网络的转网和退网工作,合理安排老龄设备的关、停、并、转等一系列工作。对不能带来经济效益的网络资源,要在解决好业务转移、服务延续的基础上,做好退网处置,降低维护成本。改善网络资源的成本管理。在网络的建设和维护各阶段重视资源的效益评价。

2.4 服务品牌

2.4.1 网络服务品牌内涵

网络服务品牌是提升企业核心竞争能力的重要环节,是企业品牌与产品品牌的内在延伸。企业的品牌除了企业的整体品牌、前台市场部门的业务品牌外,网络部门的网络品牌也要深入到内外部用户中去,在用户中形成精品网络、精品服务的形象。网络品牌可分为两大类:一是网络质量品牌,靠网络质量而取胜;二是网络服务品牌。重点是针对大客户的延伸服务、ICT服务,建立和打造企业服务品牌,并最终形成网络服务品牌。

业务品牌的打造侧重客户关系管理、渠道建设、产品业务开发与推广、客户服务等环节的持续改进和提高;而网络部门网络服务品牌的打造,除了以往为内外部客户提供服务开通、服务保障等基础服务外,还要适应新的市场发展需求,更多地提供网络产品开发、网络分析、网络营销等市场服务,以及为客户提供代维服务、ICT支撑服务等偏重于一体化解决方案的拓展服务。

2.4.2 网络服务品牌的表征

网络管理品牌的表征依靠3个能力,即网络运行能力、网络保障能力及服务保障能力。这3个能力是通信运营企业构建运维核心竞争力的要素。网络运行能力,指面向经营,从质量、经济角度表征企业运维能力,包括:网络运行质量、资源配置水平、资源使用效率、人力资源效率、资产利用率、运维效益等;网络保障,面向网络,表征网络维护水平和维护能力,包括网络安全、网络优化、网络设备维护、维护成本控制、资源数据管理与服务等;服务保障,面向服务,满足市场和客户服务需求,提高主动服务能力、快速响应能力、综合业务支撑能力。服务保障体系以市场为导向,以客户为中心。

2.4.3 网络服务品牌的构建

网络服务品牌的构建需要6个方面的工作,一是更新观念,以市场为导向,面向服务。运维本身就是网络服务,是电信企业服务职能的一部分,运维现代化,首先要从观念上予以转变,面向用户和业务,把网络运维活动延伸到产品生命周期的各个阶段。二是体制创新,适应电信网络转型、业务与产品转型要求,采用现代运维管理体制,通过体制创新创造价值。在保障网络安全、可靠的基础上,注重效率提升,强化运维服务意识,突出服务能力和运维效益,彰显运维价值。三是组织保障。在统一客户响应、资源管理、资源调度需要设置专业的服务部门,以组织为依托,建立大客户服务支撑和差异化服务体系。四是制度跟进。现代企业的发展必须要有效构建三个机制,即经济资源的争夺与竞争机制、资源有效运用的动力机制和资源整合的配置机制,这些机制的构建尤其受制于宏观层面的制度安排,但主要取决于企业自身的努力。五是流程穿越,流程重组或流程再造正是优化资源配置的管理创新过程。立足于满足客户需求、着眼于核心竞争力的提升,采用规范化、自动化的运维生产与管理流程,由职能管理转向流程管理。六是系统支撑,构建基于通信网络服务的专业网管系统与各类服务支撑系统。

2.5 服务外包

企业利用外部资源的能力在很大程度上决定了企业的竞争力。外包是企业利用外部资源的重要方式。通信运营企业在充分发展自身核心竞争力的基础上,整合、利用外部最优秀的专业化资源,把末端设备甚至核心网络设备的运行维护委托给自己的实业公司或者社会上的网络维护企业,从而达到降低成本、提高生产效率、增加资金运用效率和增强企业对环境的迅速应变能力。“十一五”期间,中国通信网络服务外包的程度、规模逐渐扩大,网络维护服务企业已经逐渐成长壮大,成为推动通信行业发展的重要力量之一。 网络服务外包已经成为国际、国内广泛推崇的企业经营管理模式。

2.5.1 市场规模

2007年中国通信运营商主业业务收入总和超过7 200亿元,运营成本在3 500亿左右,其中运行维护的成本近1 200亿(不包括专用网、大型企业网络等非公网维护费用),如果按1/10的服务外包比例来算,中国2008年网络服务市场的规模近120亿。2008年,电信重组为维护服务企业的经营带来了一定的风险,同时也带来了发展机遇,重组后的三大通信运营企业都具备全业务运营的能力,必然会推进大规模的网络建设和升级,进而扩大网络维护市场的规模。2009年,工信部颁布了235号文——《关于推进电信基础设施共建共享的紧急通知》,更有利于网络维护服务的市场的扩张。

2.5.2 服务外包特点

首先,中国的通信网络服务外包市场正在从不规范的自由发展市场逐步走向规范化管理。企业对外包服务承接商的资质审核、服务质量、服务考核更加严格。其次,网络服务企业的能力从良莠不齐走向群雄逐鹿状态;电信运营商发展为综合信息服务提供商,大量的新产品系统维护、众多的行业信息化系统维护外包等业务需求为网络服务企业提供了更为广阔的市场空间;同时也对网络维护服务企业提出了更高的技术、知识、经验、管理等能力要求。业务单一,客户单一,缺乏核心竞争优势的企业面临业务萎缩,逐步退出市场竞争。其三,由于通信运营企业对维护业务外包向综合化发展,竞争将集中在大的综合性的维护服务企业之间。最后,在今后很长一段时间内,通信实业公司仍然是维护服务企业的主体,实业企业占据通信服务市场的70%~80%。

3 结束语

唯物辩证法的宇宙观主张从事物的内部、从一事物对其他事物的关系去研究事物的发展,即把事物的发展看作是事物内部的必然的自己的运动,而每一事物的运动都和它的周围其他事物互相联系着和互相影响着。顺应通信行业的发展形势,面向市场、业务、客户等多层外围关系,注重用户感知,以“质量、安全、效率、效益、服务”为指导思想,中国通信运营企业已经初步构建了具备自身特色的现代通信网络运维管理体系。由内而外,更注重对前端服务的有效支撑,逐步将网络运维的生产管理活动融入到通信产品生命周期的各个环节。科技创新重要,管理创新同样重要,本文中总结的通信运维管理的发展趋势,不仅仅是管理思想理念的进步,更是现代企业管理方法与信息化技术在企业实践中的深度应用与协调发展。

2009年,是中国通信行业全业务竞争的起始之年,是综合信息服务时代的推进之年,也是重组后通信运营企业内部的融合之年,通信网络运维将从现有成熟的、稳定的发展模式向下一阶段的目标模式演进,重点解决组织整合、模式调整、流程优化等管理问题和网络IP化、全业务维护、综合信息维护等技术问题。通信网络运维的高度集中、客户感知、网络经营、服务品牌、服务外包等个方面的趋势将更为显著,并在新的全业务竞争时代被赋予新的任务和内容。通信行业网络运维管理的能力和水平将迈向更高的层次,这些还有待于进一步深入探讨和研究。

收稿日期:2009-08-20

鲁春丛,工业和信息化部电信研究院规划设计所副所长、高级工程师,长期从事通信规划与运营管理研究工作,已发表论文40余篇。

作者:鲁春丛

第2篇:运维管理体系架构发展研究

摘要:新的网络特点、新的网络架构的出现对运维管理提出新需求,NFV和人工智能等新技术驱动运维管理向智能化方向发展。运维管理体系架构经历了集中式、分布式、基于策略的网络管理架构和智能自主运维管理架构。集中式网络管理结构简单,管理职能集中,适用于小型网络管理;分布式网络管理适用于多业务、大信息量、需要灵活扩充容量的异构网络。基于策略的网管在很大程度上提高了管理的灵活性和自动化程度,智能自主运维管理适用于高动态的弹性通信网络,实现主动、协同、智能管理。

关键词:集中式结构;分布式结构;基于策略的网络管理;智能自主运维管理

0引言

随着通信网络的发展,新的通信网络呈现出如下特点:环境可感知、容量可伸缩、属性可变化、能力可调整、万物可互联。这些特点对运维管理提出了新的管理需求,要求运维管理系统能够感知网络变化,动态调控物理和虚拟资源、进行网络功能虚拟化编排,以及进行多维信息感知和融合呈现。

弹性网络架构打破了以往垂直分割、封闭网元的静态架构,对传统的管理架构管理模式提出了新的挑战。SDN/NFV、云计算、大数据、人工智能等新技术的发展也对运维管理提出了新的需求和挑战。总之,新的网络特点、新的网络架构的出现,新技术驱动,都对传统运维管理提出了挑战。

1管理模式

随着网络管理对象规模增大、复杂性增加,同时大数据和人工智能等新技术的驱动,网络管理模式也随之发生了变化,集中式、分级式以及分布式等管理模式都是伴随管理对象和技术的变化而升级变化的。可以概括为集中式和非集中式两大类,其中分级式和分布式2种模式归为非集中式管理模式。随着网络和新技术的发展,又出现了基于策略的智能网管体系和智能自主运维管理模式。

1.1集中式网络管理模式

集中式网络管理模式是最早出现的,也是最常用最普通的一种管理模式。在集中式管理模式下,所有的网管代理统一由一个管理站管理,协同工作实现集中管理。在集中式网络管理模式下,在全网设置一个统一网络管理节点,称之为管理站。所有的管理软件和管理功能均部署在管理站上,管理站负责对全网进行统一集中管理:统一规划和调控全网资源,实时监视全网节点运行状态并在拓扑视图上实时呈现,监视全网端到端的路由和流量信息;对全网进行实时告警信息采集和呈现,故障定位、故障诊断和清除;对全网性能进行统计分析,设定性能阈值进行越限告警。

集中式网络管理模式的优点是网管结构简单、管理职能集中,有利于从整体和全局对网络进行有效集中管理。然而任何事物都有两面性,集中式管理的缺点在于:①所有的管理信息均需上报至管理站,极易导致网络管理信息拥塞,管理站汇总存储着全网的管理信息,一旦管理站发生故障则第一所有管理信息极有可能丢失。②全网管理工作无法进行,因此集中式管理模式具有明显的可靠性、抗毁性差的问题。随着网络规模扩大和复杂异构度的日益增加,集中式管理模式很容易成为网络运行瓶颈,致使网络负荷不均衡。同时全网所有的管理数据在同一时刻涌向管理站,不仅占据大量带宽,同时也极易导致管理站超负荷运行至崩溃,各种请求响应操作超时,管理性能大大降低。

1.2分级分布式网络管理模式

随着网络规模增大和复杂性的提高,集中式管理模式日益暴露缺点,难以适应大规模高复杂网络的全网管理功能。分级式网络管理体系结构和分布式网络管理体系结构应运而生。分级式网络管理体系结构将网络管理中心功能进行分级,可以根据管理需要分为一级、二级和三级网络管理中心,一级网络管理中心负责全网级的管理工作,根据管理规模,可以设置多个二级网络管理中心;二级网络管理中心实现本区域的管理工作;三级网络管理中心实现本节点的管理。一级网络管理中心对多个二级网络管理中心进行管理,二级对三级网络管理中心进行管理,在一级网络管理中心故障时,二级可以升级为一级,进行全网管理,且可以根据管理规模和需要,横向扩展二级或三级管理中心,或纵向延伸为四级管理代理。相对于集中式管理模式而言,分级管理模式具有可靠性高和管理灵活的优点。

分布式网络管理模式是一种对等式管理模式。多个管理者可以按需部署在一个网络系统中同时运行,每个管理者管理网络中的一个特定管理域,协同管控整个网络。任何一个管理者失效,其令居管理者均可以接管;而且在数据存储和共享方面,每个管理者都可以存储使用全网管理数据,共享其他管理域的管理信息。管理者之间可以对等通信,也可以通过上级管理者统一协同工作。

分布式网络管理模式将管理者分布在网络中,使得网络负载均衡,相对于集中式网络管理模式而言,大大提升了管理的可靠性和健壮}生,非常适应目前的大规模高复杂网络管理。

随着网络发展和新技术的出现,新的管理模式应运而生,主动网络管理、智能移动代理、基于Web的网络管理、智能网络管理、基于策略的网络管理PBNM等新型管理模式如雨后春笋般涌现。分级、分布、智能管理体系已经成为目前网络管理模式的主流,分布式和智能网络管理适应目前大规模高动态高复杂的网络形态和特点,有效提升了管理的自动性和智能性,已经成为目前流行的重要管理模式和研究方向。

1.3基于策略的网络管理模式

基于策略的网络管理(PBNM)的原理是基于策略将管理行为的控制和具体执行分离,初步实现了网络管理的自动化。基于策略的网络管理的重要组成部分就是移动代理。移动代理(Mobile Agent,MA)技术结合了分布式计算技术和代理技术的优点,MA具有自主}生、移动}生、智能性和平臺独立}生等特征,将MA技术应用到网络管理中可以提升管理的自主性。PBNM和MA这2种技术具有很好的互补性:智能代理技术能够弥补PBNM中存在的技术复杂、广泛分布、缺乏智能性、环境适应性差等缺点;将智能策略植入自动代理中可以按需设定MA携带代码的容量,根据需要灵活设定MA的迁移路径,提升MA与所运行环境的自适应通信能力,使用基于策略的访问控制还可进行MA和运行执行环境的安全认证。综上所述,PBNM和MA的结合对于提升网络管理的自主性和智能性具有显著的优势。

基于策略的网络管理能自主采集网络和环境信息,不依赖于具体环境和网络拓扑结构,能够基于策略理解和执行各种管理指令,自适应调控资源,实现业务管理的自适应协商和配置,具有管理流程简化、资源配置优化、强兼容性、易扩展性等特点,但是PBNM严重依赖于管理策略,不能根据网络拓扑动态变化进行实时管理,被管对象无法自主管理,这些缺点不适合于弹性通信网络的管理。将策略管理和移动代理与分布式管理相结合,能更好地实现智能自动管理。

综上所述,集中式网络管理模式在网络拓扑、管理模式上都比较简单,适用于小型網络、业务单一网络的管理。分级分布式网络管理模式在网络拓扑、管理模式和实现技术上相对复杂,更适合大规模高复杂性、多样化业务的网络管理。基于策略的网管在很大程度上提高了管理的灵活性和自动化程度,但是对被管对象的自主功能无法得到充分体现。不同的管理模式各有其优缺点,不存在一种“最好”的管理模式。每种管理模式都有适合的网络和工作场景,可以根据被管网络的特点和不同的应用环境选择一种适合的网络管理模式。

综合分析对比集中式网络管理模式和分级分布式管理模式的优缺点,同时结合弹性通信网络的拓扑动态变化和用户需求动态变化的特点,弹性网络架构的出现打破了以往僵化的管理架构,以及SDN、NFV、人工智能等新技术驱动,需要具备管理规模自适应的智能自主的运维管理体系。

1.4智能自主运维管理架构

采用运维管理中心-域管理中心-管理代理的智能自主运维管理架构,同时结合策略管理技术,基于感知-分析-决策-执行实现智能自主自动管理,适应弹性网络和应用的双重动态变化,具备管理规模自适应能力。运维管理中心是弹性通信网络管理的最高层,具有最高管理权限,进行弹性网络全网级的运行状态监视、端到端流量监控、跨网跨域资源调控、跨网跨域故障监视和处理。能够基于任务进行资源规划和调度,是运维管理的核心。负责进行动态分域,管理和委任各个域管理中心,向域管理中心发送命令以达到监控和优化网络,负责网络规划,向域管理中心发送管理命令进行通信网络配置和任务分配,同时接收域管理中心上报的网络状态数据进行全局监控和优化。

运维管理中心采用固定位置或由域管理中心选举产生,固定模式实现机制简单,但是其抗毁性较差,选举算法采用多因子加权算法,综合考虑弹性网络节点的位置、移动性、性能、管理能力等多种属性,当原有运维管理中心故障时,域管理中心可以升级为运维管理中心,接替运维管理中心进行弹性网络全网管控。

管理域是按照行政划分或地理位置划分的按照策略和规则确定的集合,域管理中心负责实施单个管理域的管理工作。域管理中心是运维管理中心的下级,域管理中心负责将本域的管理信息上报运行管理中心,同时接受上级运维管理中心的查询和配置操作,上报本域重要信息和实时状态,域管理中心与运维管理中心只进行必要的或者涉及全局或跨域的管理信息交互,减少了所有信息交互所带来的带宽占用和超负荷运行,管理域内的事情原则上由域管理中心自主管理和处理,大幅提高管理性能和效率。

各个域管理中心可以通过协作完成单一域管理中心不能独立完成的管理任务。域管理中心负责本管理域内地面网络和空中网络的管理,整个弹性通信网络的管理需要由不同的域管理中心共同完成,即域管理中心通过协作的方式完成单—域管理中心无法实现的任务。

网管代理是策略和命令的执行者,受所在域中域管理中心的管理。网管代理属于唯一的域,受其所在域管理中心的管理。网管代理是各种策略的具体执行者。

每个网管代理管理所在的节点,多个代理形成一个域并由域管理中心管理,域管理中心由运维管理中心管理。各个域管理中心接收运维管理中心分发的管理任务,整理和处理收集本管理域的数据,管理本域内的多个代理节点,同时把影响整个通信网络管理的数据上报给运维管理中心,本管理域的拓扑、故障、性能和配置等信息由域管理中心自主完成管理,具有高度自主性和自治性,大幅提高了网络管理效率。

管理域划分既可以依靠网络规划时的域分配情况,也可以通过弹性通信网络拓扑结构动态变化来触发管理域的动态更新和划分。通过管理域的划分,具备管理规模自适应能力,根据网络的动态变化随时增加或减少管理域;通过运维管理中心之间的协作运行,实现资源自适应配置、对系统运行情况的监视、诊断和智能处理、安全问题的及时监测和自我保护以及系统状态发生偏移时进行有效调整和优化,最终达到弹性通信网络的自主化、智能化运维的目标。

域管理中心具有自主管理能力,当运维管理中心发出简单的管理指令后,域管理中心能够独立完成某些管理功能。例如,域管理中心可以将运维管理中心下发的管理任务进行管理域内分解,根据各个MA的当前网络状态进行合理分配,并根据任务需求选择合适的派发方式,如采用基于移动代理技术的任务委派方式。另外,域管理中心还负责管理域配置、密钥的分发和更新、故障诊断或排除等,既可提高网络管理的自主}生和实时性,又可降低管理开销。

基于策略的管理代理负责接收域管理中心分配的任务和配置信息,并及时将自己的状态信息上报给域管理中心。另外,基于策略的代理具有一定的自主性,同处于一个管理域内的策略管理代理之间可以相互协商,进行任务的委托和迁移。

与传统的网络管理相比较,智能自主管理具有如下优势:

①自主管理实现了主动管理,网络的变化触发感知,进行动态分域和自动处理,实现了自主管理,提高了管理效率。

②自主管理增加本域故障诊断和故障处理,减少了故障处理时延,增加了管理自主性。

③自主管理可以满足高动态弹性通信网络高抗毁性的要求,一个域管理中心乃至运维管理中心的失效可以由其他域管理中心代替管理,并不影响整个运维管理系统的运行。

④自主管理可以保证实时运维管理,且能根据网络节点的增加和减少相应地增加或减少管理域,具备管理规模自适应能力。

⑤基于策略和移动代理的智能管理与域管理中心之间的自主协作相结合,实现智能自主管理。

⑥管理域具有扩展性,可以根据网络规模的大小和管理层级的伸缩按需灵活扩展。2网络管理架构总结

网络管理系统成体系发展,体系逐步完善。由单一设备的管理、对网络的管理、对业务和应用的综合运维管理;管理模式由集中式到分布式到智能自主运维管理模式;形成了由网元管理系统、专业网络管理系统、综合网络管理系统、综合运维管理系统的管理体系。

实现了集中控制下的分布式专业网络管理和综合网络管理,网络管理体制适应通信网络组织管理机构的编成,各级各类管理机构都具备了自动化集中管理所属专业网络及其综合网络的基本手段。

专业网络管理系统具备掌控全程全网的拓扑、性能、故障、配置和资源等运行情况的能力。综合网络管理系统以专业网络管理系统为基础,实现了综合网络拓扑、性能、故障、配置和资源的综合管理。宏观监视和掌握各专业网在性能、故障、配置等方面的总体运行情况,网系间的关联故障进行关联分析和准确定位,综合统计分析各网系运行情况的主要特征指标,按规范化工作流程进行网系问性能、故障、配置等方面的管理作业,处理各类通信业务,而向保障任务进行综合的业务管理。

3结束语

运维管理系统以及体系架构的发展经历了从集中式、到分布式到自动运维到智能运维的阶段,运维管理系统的发展趋势如下:

(1)进一步提升网络管理的弹性和自主性

基于SDN/NFV技术的弹性网络架构,成为下一代网络的重要发展方向。弹性网络架构突破了传统的垂直分割、刚性网络体系和复杂繁多的封闭网元架构。改变了现有网络的部署、操作和管理方法,因此弹性通信网络的管理、资源调度和监视也会对现有的网络管理系统带来极大的挑战。需要构建纵向贯通、横向协作的弹性化自主化网络运维管理机制,实现通信网络无配置、零规划开通运行。

(2)SDN/NFV、云计算、云存储、大数据技术在运维管理中的应用

将SDN/NFV、云计算、云存储、大数据技术思想应用于运维管理,使得运维管理在管理架构、信息感知和存储、多维态势认知、大规模业务流量和用户行为分析等方面与先进的技术结合,提高管理的智能性和先进性。

作者:云超 赵智伟 周辉 安娜

第3篇:通信运维管理发展趋势研究

在我国全面推进社会主义现代化强国建设的大潮下,中国各通信厂商以提高通信质量、保证通信安全、维系通信效率、增加企业效益、强化客户服务为主要目标,逐渐形成了具有鲜明现代化特色的通信运维管理发展体系。目前的通信运维管理发展中,高度集中、网络经营、服务品牌、运维外包和客户感知是主要发展趋势。

改革开放以来,我国通信的管理运维趋势随着产业变革而不断调整自己的方向,试图在经济潮流中保留自己的有生实力。中国产业变革给通信运营产业带来巨大发展前景的同时,还为运维管理提供了良好的发展环境,供中国的通信厂商发展自身。

一、通信运维管理现状

现今,我国的通信运维管理现状随着不同供应厂商发展服务理念与组织文化的影响下,各自形成不同的管理特点。中国移动以网络环境简约、体制灵活、规划合理的特点立足于我国通信厂商,有效支撑其高速发展的运维管理要求。中国网通是具有传统通信运维管理公司特色的通信厂商,是将规划网络部分服务于市场、制定新业务、进行组织调整为首要发展问题的运营企业。而中国电信是最早提出综合信息服务管理的运营厂商,在大客户信息服务,网络响应和信息服务支撑等方面有着较大的长处。

二、通信运维管理发展趋势

目前,我国的通信运维管理发展趋势随着通信运营市场化进程主要表现为运维管理的高度集中、良好的网络质量感知、现代化网络经营理念、网络服务品牌化构建、企业项目外包化处理五个大方面并进的情况。

(一)运维管理的高度集中

运维管理的高度集中是符合当前通信运营管理大趋势,在降低企业运行成本上有着大作为的发展方向。是通信企业集合了简约操作流程、降低运维成本、增强管理质量和提高通信效率的基础手段,但我国通信厂商较多,各自的发展理念、建设人员构成、组织文化各不相同使得我国的网络运维管理高度集中化发展存在着失衡的情况。

在集中化运维管理中,管理的实施部门是集合了人事部门、财务部门工作支撑的网络部门,是一个涵盖通信企业内部整体的庞大建设工程。

(二)良好的网络质量感知

良好的网络质量感知是通信企业发展的根本。客户感知是对通信网络质量一个直观的,深入的感知。但传统的网络服务质量评价系统已经不能满足现代化的通信运维发展需求,无法直观的将客户的需求传递给更大网络通信服务厂商,因此,全面推进现代化网络服务质量评价体系是当前企业的主流发展方向。在传统的网络化服务体系中,传统的质量评价指标只是局限于评价网络服务设备和通信系统的评价,没有对整体性的通信质量有着一个全局性的认知。在大数据流量的冲击下,网络通信运维管理的许多局部问题得不到及时的处理,传统网络服务质量指标与用户基本需求和用户投诉标准之间存在着不可调和的矛盾。

为提高通信运维管理服务质量,加强通信运维管理的客户感知,国内网络通信运维管理可以使用新型的技术来改善客户感知。例如物联网系统中可以应用LPWAN网络构架技术来提高传递效率,将网络通信运维管理覆盖辐射到更广的区域,加强对网络质量评价体系的建设。为更多的客户提供成本低廉,覆盖范围广阔,控制体验良好的物联网需求。LPWAN网络构架如图1所示

(三)现代化网络经营理念

现代化的网络经营理念可以充分展示未来通信运维管理发展方向,在我国的通信网络管理体系中,通信网络是企业增加企业效益,提高企业社会影响力的基础,企业颞部网络经营管理水平直接影响到企业的发展前景。为此,我国越来越多的通信厂商开始将通信运维转向通信经营,通过将企业内部的各种资源进行整合,加快企业内部运维效率和运维水平,从根本上提高企业网络经营收益。我国通信企业的网络经营主要是以强化对客户服务手段和能力为核心,不断提高客服满意度和忠诚度,实现一个连续的客户绑定业务流程,为企业提高经济效益打下良好的基础。网络经营的另一个特征是优化企业内部的资源调控,通过不断优化改良企业发展方案,借助各项财务分析和网络运行技术手段,以市场发展趋势为主流导向,通过改进企业决策和规划流程,不断调整企业的网络经营发展方向。

为保证通信运维管理质量,我国通信企业将网络运营管理置于服务支撑、资源配置和工作转型三个方面。从面向新客户,开展业务强化和扩展市场服务范围为基础,不断优化企业内部资源配置,利用现有的网络资源来丰富客户的信息体验入手,不断发展业务转型,适当的将一些不符合当今发展标准的设备进行更替,以此降低企业维护成本,更好的将力量集中到运维管理上去。

(四)网络服务品牌化构建

网络服务品牌化的构建是提升企业知名度,加强企业硬实力的关键手段。在企业的发展计划中,要将企业的精细化管理,良好的服务质量展示给客户,在客户群体中形成一个精品网络品牌的概念。当今的网络服务品牌化的构建流程需要以下方面的工作。其一是更新企业发展理念,扩展服务范围。其二是创新网络服务体制,优化网络服务质量。其三是保障客服调度组织,建立服务支撑体制。其四是跟进发展机制,完善企业宏观安排。其五是穿越服务流程,优化管理创新。其六是构建网管支撑系统,完善服务支撑体系。以此来强化企业的网络服务品牌化构建,提升企业核心竞争力。

(五)企业项目外包化处理

在通信运维管理发展过程中,企业的资源配置是主要限制其发展速度的原因。而在通信企业中,企业利用外部资源能力与企业的竞争力是直接相关的。为加强企业资源利用率,将一些合适的项目进行外包处理是最为有效的手段。将运维管理中的一些设备管理维护交由网络维护企业来进行管理,从而降低企业的管理成本,提高企业发展效率。目前,我国的通信项目外包处理正向着标准化、规范化、统一化发展。运維管理对于外包服务承接商的审核标准,服务质量管理也更为严格,并逐步开始向市场化、竞争化的趋势发展。

三、结束语

以提高通信质量、保证通信安全、提高企业效益为指导思想,中国的通信网络运维管理已经开始呈现出独特的发展趋势,表现为更加注重前端服务支撑,并逐渐将运维管理融入到通信产品开发的各个流程当中,为提高企业运维管理质量,解决运维管理中遇到的诸如组织整合、调整发展模式、全业务维护问题提供了新的方案。

作者:孙丽娟

第4篇:变电运维精益化管理探究

摘要:从二十世纪80年代开始,精益化管理就已经出现,而且开始被应用到各个行业管理中,有效推动了社会的经济发展。如今电力行业迅猛发展,精益化管理就显得越来越重要,其已经成为了各大电力企业积极应用的管理新模式。在变电运维工作中应用精益化管理模式,能够提升变电运维管理的规范性和科学性,对电力系统的稳定运行起到较大的积极作用。

关键词:变电运维;精益化;管理

1、变电运维管理中存在的危险点

1.1变压器的危险点

在对变电站空载变压器进行切合操作时,其通常会产生过电压而影响到变压器的绝缘性能。并且,在变电运维管理当中,其空载电压的不断增加也会对变压器的绝缘性能带来永久性损坏,从而威胁到变电运维管理以及技术人员的人身安全。

1.2母线操作中的危险点

母线是变电运行设备的汇合场所,其特点是连接元件多、操作工作量大。在变电运维操作中,母线的送电、停电以及母线上的设备在两条母线之间的倒换过程中会产生潜在的危险点。主要有带负荷拉刀闸;对继电保护或自动装置切换不正确而引起的误动;向空载母线充电时,电感式电压互感器与开关断口电容之间所形成的串联谐振等。如果没有严格按照相关操作规范执行,就会容易造成危险事故。对于这样的危险点,要及时采取技术防御措施,以避免造成严重后果。

1.3倒闸操作票的危险点

通常情况下,变电站变电设备种类相对较多,主要有冷备用、热备用、运行以及检修等四种设备状态。在进行变电运维管理操作中,技术人员需要做好操作票的填写与编制,严格的按照相关标准来进行,确保合闸操作的规范性。若处于不同状态下,即使是相同的设备在进行状态切换时都需要结合操作票来进行。

2、精益化管理的基本实施途径

2.1树立明确的管理目标

首先,应结合实际情况树立明确的管理工作目标。企业需要根据变电维修管理的状况,设置一定量的管理目标,还要将所设置的维修管理目标传递到企业各个分公司之中,再由他们结合自身的辖区范围制定相应的工作目标,以促使每个变电站的维修管理得到切实的保障。其次,企业需要针对变电运维管理的各个项目,开展相关的工作,使得变电站的投产可以迅速实现精益化。最后,对于现存的老旧变电站,电力企业应当科学地做好维修环节,针对老旧变电站存在的各项问题,进行有效整改提升,使得变电站的运行效率得到持续地完善。

2.2创建完善的专家检测系统

科学技术的快速发展和创新,使得互联网技术得到了广泛运用。这里所说的专家检测系统就是在利用互联网技术的基础上对各变电站的情况实时监控与检测,并由国内专家进行评估分析,在所得结果的基础上进行变电维修管理工作。同时,电力企业应当建立包含各个变电站运维管理阶段的专家所组成的评价体系,由他们定期地对变电站的运行状况及检修工作进行检测,对于变电运维管理工作的具体标准,要紧紧贴靠专家的专业标准,使得精益化的管理水平得到精确

地提高。

2.3制定完善的工作责任制

管理工作的顺利开展仅依靠一个人是不可能实现的,需要多个部门人员共同努力,这之中就会涉及到责任。变电运维管理工作一直以来无法取得理想的管理效益,多是因为责任制不够完善,在各运维环节没有切实的落实责任制度,存在出现问题无人承担的责任。而且在变电站出现问题时,维修人员并没有进行及时维护,而是推给了公司的其他工作人员,并且都不情愿去承担相应的责任,使得运维管理的效益严重降低。在这种状况下,电力企业,必须下放具体的管理责任到公司的每个工作人员手中,完善现有的工作责任制,要求每个工作人员需要拥有明确的责任意识,主动承担相应的责任,积极完成自己的工作,进而为变电站的整体运维管理形成良好的基础。

2.4形成科学合理的绩效考核机制

很多人认为,在实际工作过程中运维管理其实就是单纯的对其进行维修和检查,这与工作人员的工作积极性并没有太大的关系,所以对于创建绩效考核机制并不在意。可是,企业在发展中所形成的绩效考核制度并不仅仅是工资的赏罚标准,更多的是能够确定工作人员的成绩,激励他们产生进一步工作的积极性。为此,电力企业需要构建科学的绩效考核制度,鼓励工作人员进行更加细致的精益化检查,一旦发现细则上的问题,及时向上级汇报,进而促使整体的运维管理更加切实有效。

3、供电企业在变电设备运维及检修采取精益化管理的具体措施

3.1提高变电站设备运行维护的质量

供电企业变电运行管理单位要规范变电设备巡视维护的标准卡,加强变电设备维护工作的计划管理和监督检查,促进维护工作向规范化和标准化方向发展。首要进行的就是认真完成变电设备的巡视和轮换以及相应的记录,巡视轮值要按照规定的周期和项目进行,及时发现设备缺陷。另外还要制定必要的措施严防变电设备巡视不到位的现象发生,避免因缺陷和隐患未及时发现影响安全生产,确保不发生因维护不到位影响倒闸操作效率事件。

3.2提高变电站设备倒闸操作的效率

提高變电设备倒闸操作的效率是供电企业对变电设备进行精益化运维管理的基本要求,变电运维工作人员要想提高倒闸操作的效率,首先就需要做好五防装置和安全工器具等设备实施的日常维护工作。大型复杂的变电停送电操作,变电运维工作人员要提前到现场进行操作准备,根据调度预令填写倒闸操作票;会同工作负责人进行工作票审核和围栏、标示牌布置;接地线提前放至装设地点。

3.3从源头加强变电设备的检修管理

供电企业变电运行管理单位要依据变电检修工程现场作业的特点来编制检修过程的管控方案,首先是变电检修的安全管控,依据检修工作的性质和作业环境,确保变电设备检修的工序和相应的质量,使检修工期达到最优化。其次是进行变电设备检修的质量管控,确保检修材料的质量和相应的检修施工质量,对变电运行设备有影响的危险作业控制措施到位。

4、结束语

综上所述,随着时代的发展,我国的经济建设已经处于全新的发展阶段,化管理水平。要想更好地满足各项工程建设的需求,电力企业应该不断完善其变电运维管理工作,使其向着精益化的方向发展,做好基础管理工作,进行智能化管理,积极引入新的科技技术,不断提升运维人员的工作积极性,从而有效提升变电运维精益

参考文献:

[1]陈雄,林珊珊,沈晗阳.变电运维精益化管理[J].中小企业管理与科技(上旬刊),2017,(02):32-33.

[2]黎刚,陈志益,王军伟.变电运维精益化管理措施[J].低碳世界,2017,(23):117-118.

(作者单位:国网青海省电力公司黄化供电公司)

作者:张一宁

第5篇:ERP集成项目运维管理

摘 要:随着企业信息化的发展,以ERP系统为核心的企业信息系统陆续上线,在ERP系统不断深化应用过程中,系统集成成为企业信息化发展的趋势。文章结合中海油采办业务管理信息系统项目和合同项目,从ERP集成项目上线后运维这一角度出发,从运维合同的签订、运维团队的组建、运维体系的搭建、运维知识库的建立、客户交流以及多系统分析等几个方面对ERP集成项目运维进行阐述。

关键词:ERP;系统集成;运维体系;运维知识库

1 运维合同的签订

通常项目由实施转到运维,相关的合同也由实施合同转为运维合同。运维合同首先要明确承接项目运维的运维主体是一家单位还是几家单位。如果是几家单位,就要考虑在运维过程中遇到复杂问题的处理时,是否会出现互相推诿、指责的情况。运维合同的签订,最好是由一家单位为运维主体,参与项目运维的其他单位与该单位再签订合同。合同甲方对唯一的运维主体提总体要求,并在合同中进行明确,运维中出现的一切问题都由合同甲方与运维主体单位进行沟通,协调解决。

2 運维团队的组建

ERP集成项目实施,实施阶段往往有内部团队和外部团队。内部团队通常由企业内部的IT人员组成,他们更了解企业内部流程,外部团队是指外部的专业团队,他们的专业性更强。项目由实施转运维后,尽量保留项目实施过程中内部团队和外部团队的骨干成员,这样能最大限度地了解实施过程中出现的问题,同时也能更好地与用户沟通。运维团队需要一个能力很强的项目经理,项目经理要熟悉集成项目各个系统,同时对项目中用到的各种技术有基本的了解,能协调各系统的负责人。运维团队的组建,除了要将签订合同的单位纳入到团队中外,还要考虑相关方,也就是广义的运维团队。比如在申请权限时,需要与权限组沟通添加权限,进行PI配置时,需要PI组协助配置并审核相关文档,要充分利用这些资源,让他们成为运维团队的延长线。组建完善的运维团队,是做好运维的可靠保证。

3 运维体系的搭建

ERP集成项目运维体系的搭建,就是要明确运维中需要的各种资源,规范工作中遇到问题的处理方式,为运维团队开展工作提供标准。搭建一个好的运维体系,首先要衔接原有的ERP运维体系,充分利用原有的各单位关键用户、内部顾问和外部顾问,充分发挥3级支持的作用。同时还要根据所在项目的运维特点,适当进行调整。在搭建运维体系时,主要从以下几个方面入手。

3.1 组织架构和人员组成

搭建组织架构,确定人员组成,明确岗位要求,对相关岗位职责进行划分,对运维人员的资质提出相应的要求。

3.2 运维人员管理规范

包括日常考勤管理,遵循甲方的规章制度,制定相关的标准和规范。

3.3 服务响应时间

根据系统运行过程发生的问题的紧急程度不同,可制定灵活的服务响应时间,比如远程响应时间、到达现场时间等。

3.4 严重问题的应急预案

对出现的严重的问题,比如影响年结或者要处理的单据比较紧急,可事先准备应急预案,协调各方资源,在不影响系统稳定性的基础上,可以考虑先报批,事后再进行补单。

3.5 定期汇报机制

运维过程中需要定期对文档进行整理,形成汇报机制,让领导了解项目概况。

3.6 文档&流程

严格遵循相关的文档标准和流程,制定文档规范,对各类文档进行审核,尤其是对业务变更的文档,做到文档齐全,流程合规。

3.7 事件管理

事件管理是一个运维体系最基本的功能,能够处理用户发送每个事件的服务请求,事件管理保证事件能够被接收、处理、存档、确认。

3.8 问题管理

问题管理的目标是消除引起事件的深层次根源以防止事件再次发生。通过对问题的分析,建立问题解决的渠道,跟踪问题处理的状态。

4 运维知识库的建立

ERP集成项目上线后,系统转为全面运维阶段。运维的目的是为了保证系统平稳运行,满足用户日常工作的开展,提升用户的系统体验。系统日常运维仅仅依靠运维团队成员去解答用户提出的问题,不仅劳心劳力,而且效果也未必好。良好的系统运维,更多的是靠有效的问题解决方案的积累、合理的流程和相关管理[2]。解决方案的积累,就是搭建运维知识库的过程。运维知识库,主要是系统介绍及使用说明和典型案例解决方案的集合。典型案例是用户日常使用系统时,遇到的相同或者相似的问题,具有普遍性。用户在提交问题给运维团队后,由运维团队成员对用户问题进行分类整理,对共性的问题,出具解决方案,并发布到知识库。用户可以查询知识库,对比发现问题描述,找到解决办法。知识库的使用,大大地提升了运维工作效率,并降低了服务成本,避免了大量的重复劳动,有效地促进了知识的转化与提取,提升了运维的整体服务水平。同时解放了运维顾问,让运维顾问能集中精力,进行需求分析,并处理更多系统问题。固化了的方案,也很好地解决了用户岗位变更带来的影响,即使工作交接不是那么完善,新的用户也可以通过知识库来进行学习,解决使用系统时带来的问题。知识库的建立,让我们对业务和系统现状,有更清晰的认识,同时便于对趋势的分析和对潜在问题的发现,对制定未来重点的工作和规划及其预算有着重要的帮助。

5 客户沟通

项目运维过程中,无论是开发顾问、业务顾问、还是前台运维顾问,都需要与用户进行直接交流。通过与用户的交流,可以充分了解用户整体的业务水平和系统应用水平,也可以加深自己对实际业务和相关流程的了解,对编写相关文档和操作手册有一定的指导作用[3]。为了提高效率,在问题解决的过程中,可以通过电话、QQ、邮件等即时沟通工具咨询相关的运维顾问,顾问对问题分析过后即时传达用户,使得用户对系统应用操作上更为快捷方便,减少了问题的中间环节,有效保障了对用户的运维服务。在涉及一些利害关系时,还要通过公司邮件等一些较为正式的方式与用户进行沟通、留下相关记录。在与不同类型的用户进行交流时,可以采用不同的策略:如果是业务或者操作不熟练的用户,建议用户多学习相关文档和操作手册,在用户遇到难点时对用户进行详细的讲解;如果是遇到一些比较好学、对系统和业务都比较熟悉的用户,可以讲解问题发生原因和处理过程,减少后续发生问题的概率;遇到一些对自身业务比较精通的用户,就需要尽量了解业务发生的背景、发展趋势等,在拿到第一手需求报告的同时,争取做到在系统设计和流程制定时能够更加合理。

6 多系统分析

ERP集成系统的运维是多个系统的运维。在这些系统中,有经过验证的成熟产品,也有定制开发的新产品,遇到问题要针对不同的系统制定不同的策略,有针对性地进行分析,才能达到事半功倍的效果。在集成项目运维过程中,影响用户使用的因素有很多,比如ERP系统升级、更换服务器、程序算法设计、其他项目配置变化、网络稳定性及其他异常原因等,出现问题时我们首先要明确是哪个系统出现的问题。比如合同系统部分用户不能登录,但合同系统并没有进行任何的版本变更,根据报错分析,我们发现,原来合同系统是在公文系统的基础上搭建的,公文系统的A/D域进行了更新,而Notes的域并没有同步更新,这样就导致了用户不能登录。多系统分析,需要项目团队成员从自身负责的系统出发,既要利用自己的经验,又不能盲目自信,针对出现的问题仔细分析,大胆求证,做到不迷信也不偏信。

7 结语

ERP集成项目运维是一项复杂的工作,只有做好运维合同签订、运维团队的组建、运维体系的建立、运维知识库的建立、客户沟通、多系统分析等多方面工作,才能更有效保障ERP集成项目运维顺利开展。同时要求项目运维团队,必须静下心来,按照制定的各项制度和流程做事,及时总结汇报,这样才能取得良好的效果,保证系统平稳运行,有效支持业务部门工作的开展。

[参考文献]

[1]王彬彬.IT服务管理在数字化校园中的研究与应用[D].北京:北京邮电大学,2009.

[2]张震.ERP系统上线后总体运维管理探讨[J].电脑知识与技术,2011(33):8329-8331.

[3]胡斌.ERP系统运维管理工作的思考[J].科技与企业,2016(5):61,64.

作者:李洪志

第6篇:高效的网络运维管理设计

摘要:随着企业信息化建设的不断深入,传统的网络运维管理已无法满足现代化企业的网络运维需求。该文从企业网络运维需求出发,结合流程化管理技术,提出了一个高效的网络运维管理系统框架,利用信息化的手段管理企业网络的安全、稳定运行,实现了网络运维管理的集成化、规范化与自动化运作。

关键词:网络;运维管理;流程化;系统设计

1 概述

网络是企业内部以及企业之间进行数据传递、信息交换的基础设施,是企业管理与服务部署的有效手段,在提高企业办公效率与提升企业的市场竞争力方面发挥着重要作用。同时,随着信息化技术与大数据技术的不断发展,企业的信息化与自动化设备不断增多,网络的安全稳定运行与实时监控变得日益复杂,这对企业的网络运维管理提出了更高的要求。因此,在企业信息化建设中,应当以网络运维管理需求为导向,参考现有的运维管理技术[1-3],设计一套高效的网络运维管理系统框架,不仅能够提高企业的网络运维效率,而且可以推动现代企业管理信息化的顺利实施。

2网络运维管理需求分析

网络运维管理是对网络日常运行进行实时监控与维护,保证企业网络的稳定运转与畅通,保障各项业务及其相关信息系统的正常运行,是企业办公的必备要素与基础建设。由于网络运维管理具有全天候运行、不可逆作业、高风险集中等特性[4],这使得网络运维管理必需向智能化的运行模式迈进,建立流程化和信息化的运维管理系统,实现运维业务的集成化、规范化与自动化运作,既体现了现代化企业管理的强烈需求,又推动了网络运维的高效管理。

如图1所示,网络运维管理工作主要包括以下核心功能:

1) 性能管理,性能管理是指对企业内部网络及其相关设备进行状态监控、性能检测以及故障发现的管理功能,是网络运维管理的核心功能。例如,网络运行性能、质量控制性能、带宽占用性能等网络指标;

2) 故障管理,故障管理是对网络运行中的异常与引起网络系统非正常运行的相关因素进行纠错处理,使网络能够迅速恢复至正常状态的管理功能;

3) 资源管理,资源管理是指对网络资源进行分配与利用的管理功能,此处的网络资源包括网络地址空间、网络宽带、网络设备等软硬件资源。例如,根据业务对资源的需求,对企业的核心交换机、核心路由器、网络防火墙、专线网络带宽与互联网网络带宽等资源进行参数设置,实现资源的按需分配;

4) 变更管理,变更管理是指对网络配置进行改变与更新的管理功能,包括网络硬件设备的变更、网络软件系统的变更、网络管理系统的变更等;

5) 配置管理,配置管理是指对网络运行参数及相关设置的管理功能,包括网络用户角色设置、网络运维参数设置等;

6) 日志管理,日志管理是指对网络运行状态及用户操作信息的存储、检索等管理功能,确保网络运维管理实现各项操作的可追踪与可溯源。

3 面向流程的网络运维管理系统设计

在以上运维管理需求的驱动下,该文重点对网络运维的流程化技术展开分析与讨论,在此基础上提出面向流程的网络运维管理系统框架,从而推动企业的网络运维管理水平与实际应用。

3.1 流程化管理技术

流程化管理是指以流程为主线的管理方法,它将所有的业务与管理活动都视为一个流程,以流程为目标,以流程为导向组织与实施各项工作,从而实现企业管理的简单化与高效化。典型的流程化管理架构是由英国政务部门CCTA(Central Computing and Telecommunications Agency)于20世纪80年代提出的IT基础架构库ITIL[5],它为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范,从而确保IT服务管理能为企业的业务运作提供更好的支持。ITIL的提出是为了解决早期IT服务质量不佳的问题,它将业务服务定义为可重复执行的流程形式,实现了企业内部人员、流程和技术的完美结合。

与ITIL目标一致,网络运维管理的目标也是用来解决网络服务的质量问题,按照运维需求可以对运维管理功能进行细致划分,形成一系列相对独立的运维业务,便于流程化的设计与改进。因此,我们拟采用流程化管理技术,对网络运维管理进行分析与设计,构建面向流程的网络运维管理系统,实现网络运维管理的信息化与智能化。

3.2 网络运维管理系统设计原则

我们在设计网络运维管理系统时,需要考虑的因素比较多,例如:用户需求、系统功能、技术条件、实用性、科学性、安全性等。这些因素相互关联且相互影响,我们对这些因素展开重要性分析,制定以下基本原则用于指导运维管理系统的设计与实现,主要包括:

1) 集成性原则,网络运维是对构成企业网络的所有硬件与软件设备进行集中管理,因此需要对企业数据库、信息系统、业务系统以及其他相关网络设施进行统一监控,并提供数据分析、异常检测等功能以实现网络的智能管理;

2) 安全性原则,网络运维目标是为了维护企业网络的稳定安全运行,因此,系统安全性应作为系统建设的重要因素,确保运维管理系统自身的运行安全。例如,建立严格的用户权限、对网络通信服务进行加密处理等措施;

3) 流程化原则,将网络运维各项功能进行流程化建模,规范管理制度与管理方法,建立运维管理流程,实现运维业务的流程化管理,减少人员操作失误造成的干扰与影响;

4) 可视化原则,在网络运维管理流程过程中,加强人机交互与可视化技术,便于网络运维管理人员对管理流程进行实时监控,简化管理操作,提高管理效率;

5) 扩展性原则,随着企业业务的不断拓展与信息化进程的不断深入,网络运维管理的功能结构与规模也在日益增大,系统的可扩展性将成为制约运维管理系统建设的主要瓶颈,因此,在系统设计时就应充分考虑到系统的可扩展性,建立模块化的系统架构,提供灵活的API接口,便于系统的升级与维护。

3.3 网络运维管理系统框架

基于流程化管理思想,结合网络运维管理系统的设计原则,我们提出了一种新型的网络运维管理系统框架,如图2所示。该系统可以分为设备层、数据层、功能层与应用层四个不同的层次,且各层之间相互提供数据服务,形成了一个“自底向上数据分析、自顶向下操作处理”的监管体系。系统各层的具体描述如下:

1) 设备层。设备层是网络运维管理系统的最底层,主要包括组成企业网络的设备、网络以及应用信息系统等,是网络运维管理的主要目标对象。为了方便管理系统的扩展,该层在设计与实际应用时,应充分考虑整个系统的负载,保留较多的预留接口。

2) 数据层。数据层是网络运维管理系统的数据中心,利用数据中间件读取设备层的监控数据,将其存储于独立的数据库。随后,根据功能层的数据需求对数据中心进行数据分析,形成功能层所需的数据结构,并为其提供相应的数据服务。

3) 功能层。功能层是网络运维管理系统的核心,基于流程数据,利用流程建模与定制工具对运维管理各项业务进行流程化设计,形成性能管理流程、故障管理流程、资源管理流程、变更管理流程、配置管理流程等一系列独立的、可重复进行的管理流程。同时,该层还包括日志管理模块,对各项业务流程的操作进行记录与数据备份,便于记录查询与异常操作取证。

4) 应用层。应用层是网络运维管理系统的输出,主要面向系统用户,为其提供良好的人机交互接口,方便其进行各项管理操作。该层主要包括网络性能监控、网络故障检测、网络故障恢复、网络资源管理、网络变更管理、网络配置管理、用户管理以及日志查询等多种应用。其中,网络性能监控与网络故障检测是网络运维管理系统的核心应用,统计分析系统采集的数据,利用图、表等多元可视化技术,对网络运行指标实时展示,并对异常事件与网络故障进行可视预警;网络故障恢复则是利用已有的故障处理案例,辅助用户对当前预警故障实施网络恢复操作;网络变更管理、网络配置管理与用户管理是网络运维管理系统的辅助应用,主要对一些网络资源、系统参数以及用户参数进行变化与更改;日志查询是对备份的系统日志进行查询与检索,方便用户调查取证。

此外,各层在为上层提供数据服务的同时,也会根据上层的操作响应进行本层的功能实现,并向下层提出相应的操作要求,形成了“自顶向下操作处理”的操作分发模式。例如,当用户检测到网络故障以后,首先在应用层触发网络故障恢复的操作,功能层则将该操作响应分发至故障管理流程,按照故障管理规范进行故障恢复;随后,功能层将相应的操作数据传送至数据层,修改系统数据中心的相关数据,并利用数据中间件进行设备操作指令的发送;最后,设备层依据指令对指定的物理设备进行恢复操作,从而实现了网络故障恢复。

4 结束语

将流程化管理思想引入网络运维管理平台建设中,可以提高企业的网络运维服务质量,为企业的信息化建设提供坚实可靠的技术保障。该文首先对企业网络运维管理需求进行分析与描述,在此基础上提出网络运维管理系统设计的基本原则,设计实现了面向流程的网络运维管理系统框架。该框架具有多层次、多功能、可扩展等特点,利用层次之间的关联关系与消息传递,建立了“用户-技术-设备”一体化的网络运维服务,规范了网络运维业务的管理模式,减少了用户对底层设备与技术的依赖性,从而提高了运维效率。同时,该文提出的网络运维管理系统框架具有一定的局限性,各企业应根据自身网络建设的特点,对该框架进行细化与改进,按照实际情况逐步推进网络运维管理系统建设,保障企业网络安全、稳定运行。

参考文献:

[1] 张泉方.联通运维网的设计与实现[J].计算机工程,2002,28(9):132-133.

[2] 周宇浩.IT运维管理的最佳实践[J].洛阳理工学院学报:自然科学版,2009,19(2):65-68.

[3] 沈志强.智能网络运维监控系统[J].网络安全技术与应用,2013(11):27-28.

[4] 李小庆,李伦,宁磊.关于网络运维管理工作的思考[J].农业发展与金融,2008(2):73-75.

[5] 王革明,肖琳.基于ITIL的校园网运维服务体系设计与实践[J].西北大学学报(自然科学版),2010,40(6):983-986.

作者:符嵘

第7篇:运维管理标准

概述

运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复; 第

三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理 第

四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

第一章 总则

1. 为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。

2. 实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。

3. 完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。

4. 本规定适用所有进入运维环节的项目。

5. 运维人员应根据授权,处理本规定中所涉及的业务事项。

第二章 主机、服务器及数据库系统的运维管理

1. 根据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划。

2. 应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和安全负责,并按照有关规定负责系统和数据的备份与恢复。 3. 系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,及时消除隐患。如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行密切跟踪。

4. 及时解决处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度地保护好系统资源和数据资源。

5. 对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异常或故障,应及时通知相关人员,并协同解决处理。

6. 每季度应对系统主机/服务器/数据库进行一次停运维护,其操作必须严格按照操作规程进行。其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行。同时做好相应的准备工作,最大限度地减少对业务操作带来的影响。

7. 具有系统操作或管理权限的人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。

第三章 软件系统的运维管理

1. 避免在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断。 2. 软件系统的安装、升级等操作应保留完整的实施记录。

3. 对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施。

4. 对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。

5. 变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。

6. 软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详细将计划、方案、措施等报上级主管部门备案;对于影响业务的升级工作,必须提前两周向上级通信主管部门以书面形式提出申请详细报告计划、方案、措施等,经批准后方可实施。

7. 维护人员应定期跟踪所使用系统的软件升级情况和升级后的新功能,必要时提出升级建议。

第四章 数据库的运维管理

1. 对于数据库的变更必须有记录,可以回滚。 2. 无用表和字段要及时清理。

3. 从数据库删除数据一定要先备份再删除。

4. 定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。 5. 指定专人定期进行备份数据的恢复性试验。

1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;

2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。

3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

第五章 巡检管理

定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。

1. 对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例

行巡检、节假日和重要事件前的巡检

2. 维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。

3. 巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程

4. 所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。

第六章 网络管理规范

 关键业务流程

对以下业务系统流程监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障的发生率。

1、单位内部的关键业务流程。

2、网络吞吐量大的业务流程。

3、对系统造成大的压力,频繁使用数据库的业务流程

4、同其它系统集成的业务流程,这些集成会提高应用失败的风险。  用户体验同系统性能指标相关联

将网络中的所有网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈。

 建立网络运行基准指标并观察趋势

长期监测并通过对网络运行的观察,分析网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析故障,达到预警的目的,防止更严重问题的发生。  设计报警策略,避免警报泛滥

配置报警的依据是根据信息服务管理网的网络运维管理目标,报警设置的原则:

1、对影响网络和业务的重要指标设置报警;

2、消除误报和重复报警;

3、报警应该以多种方式及时发送给相应的负责人。  创建自动化、规范化事件处理程序

信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化的处理问题程序,快速处理各种潜在故障并且分配到相应的负责人,提高工作效率。另外可将工程师长期积累的知识和工作经验系统化和固化,达到快速定位故障的目的。

 网络服务质量SLA的量化管理 提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标。信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、CPU和MEMORY的负载,对于不同的网络指标还要根据网络的上下级连接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据。

 制定网络的升级和改进策略

网络的升级和改进应该以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据。通过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,判断是否需要对系统的局部或者整体进行升级,发现网络系统性能的瓶颈,提出网络系统改进的方法。  日常规范

1. 每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查;

2. 按照规定的时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)按照规定的时段查看路由、防火墙等关键系统运行情况,包括网络流量、带宽占用率等,重点检测关键设施,并记录;

3. 处理产品组网络问题应做完整、详细记录,快速响应,及时确定原因,积极组织处理,同时记录解决问题的操作过程,问题解决后应及时回复;

4. 对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。

5. 故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施部署,更新维护录入知识库。

6. 处理各种网络故障,并作记录,保障网络正常运行。 7. 遇到不能处理的问题时,通知相关人员或及时汇报,并记录;

8. 工作人员要有强烈的安全意识,巡查时应注意发现各种可能的安全隐患并及时排除。

第七章 请示报告制度

为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,通过规范的请示报告流程,提高运行维护的管理效率。

例行性请示报告

1. 按照规程和制度规定的周报、月报、季报和年报。 2. 系统升级、交接和重大数据变更请示报告。 3. 各类专项请示报告和合理化建议。 紧急性请示报告

1. 各种事故、严重设备故障、严重电路故障、系统运行异常等情况。 2. 各项工作中发现的严重泄密、安全性事故报告 3. 客户要求的其他紧急性报告。

第8篇:运维管理定义

运维管理( IT Operations Management)帮助企业建立快速响应并适应企业业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。

核心思想随着国内企业业务信息化的深入, IT运维部门所负责的IT设备及软件的运行维护工作变得越来越复杂, 技术难度也越来越高。传统的IT工具和流程集中在技术上,而不是业务目标上。业务服务管理(Business Service Management)使IT能轻松满足业务的需求,转变企业的环境,使业务部门和IT部门领导者能够拥有统一的语言,通过统一的界面面对挑战,理解新变化所带来的影响。

BSM主要强调从业务的视角来看待企业的IT运维,从而最大化发挥IT对企业业务的推动作用,这就IT运维的核心思想。

着眼点IT系统的业务服务管理主要着眼点

一、 确立以业务价值为核心,业务驱动管理的管理思想面向业务要首先在IT管理的战略层面上建立“业务驱动”的IT治理和管理思想,使得业务部门的目标和IT运维的目标一致,都是为了企业整体战略目标的实现,把对业务的支撑能力和管理实效,作为评价IT系统效用和IT部门工作的首要指标。只有这样,才能在全企业范围内建立“技术服务于业务发展”的意识和文化,是真正实现IT与业务融合,共同为企业的战略目标服务。

二、 建立关键业务服务模型今天的业务部门对应用程序的依赖性比过去更强了。应用程序软件可以实现关键业务流程的自动化 —自动化既包括付款、资金转账、下订单和订单履行。由于应用程序故障或性能问题可能导致严重的业务影响,因此业务部门迫切需要 IT 部门在发生问题时提供更高的应用程序服务级别和更快的问题解决方案。所以,必须结合企业战略和目前业务运营情况,辨识企业业务服务,特别是关键业务应用。为这些核心业务系统服务,建立和企业未来发展愿景、目前IT架构、管理模式等相适应的业务服务模型,能够清晰地描述业务与IT之间的关联关系和IT服务的关键目标。

三、 管理信息共享目前,出于对IT资源专业化、精细化管理的要求,企业部署了诸多的监控管理工具,如网络监控、系统监控、数据库监控工具等。一般来说,这些监控工具往往来自于不同的厂商,彼此之间缺乏信息共享的手段。而一个具体的业务是由网络、主机、应用本身所组成,管理信息无法共享,这就造成了当一个故障出现时,无法通过系统直接自动分析并定位故障点,加大了IT故障的分析难度,降低了解决问题的效率。业务服务管理可以有效整合企业已经构建的众多IT监控系统,将分散的IT管理信息集中到一个单点的管理平台中,从而可以快速进行故障定位。

四、 根源问题定位随着企业业务的快速发展,IT环境越来越复杂,IT组件越来越多,同时各组件之间的关联关系也更加纷乱和复杂。业务服务管理能够提供有效的根源问题定位能力,它着眼于企业的核心业务系统,通过集中与业务相关的IT信息,根据业务逻辑和IT组件之间的关联关系进行建模,企业可以在业务模型中的任何一点进行快速的根源问题分析和定位,大大提高了解决问题的速度和准确度。

五、 故障影响范围评估当我们发现IT故障时,我们不仅应该关注故障本身,更应该考虑该故障对业务系统的影响。通过建立业务服务影响拓扑,可以快速的了解企业的关键性业务及业务故障时的影响范围,通过了解企业具体的业务环境,优先处理关键故障点。

上一篇:种植义齿下一篇:资本资产定价模型