摘 要:
关键词:
随着数字化建设在我厂大规模的展开,网络也划分为生产网和生活网,各种网络交换设备、终端PC以及服务于各模块的系统的数量大量的增加,导致设备管理难掌控性和网络运行的不安全性;而我厂网络又缺少必要的集中监控管理平台,网络中产生的各种问题和故障无法得到及时有效的响应和处理,网络设备和应用系统运行状态没有有效的监控手段,导致我中心管理员网络运维管理难度加大。为了解决目前的困难,并且使我厂网络安全的建设和运维管理也提升到一个新的高度,达到信息化、智能化,使管理员的工作更加细致化,效率化,确保网络长期安全和稳定的运行,建立了网络综合监控运维管理系统。
1.网络现状
采油四厂目前有光缆696.575千米,租用307千米,租用三条干路。网络机房8间;网络交换设备173台;服务器29台;网络覆盖58个点(面),网络覆盖率达98%。
2.网络综合监控运维管理系统建立的思路
建立网络信息网络设备监控管理系统,以实现传统的被动应答故障处理方式向前瞻式监测管理方式的转变,既要使网络中出现的危险和漏洞降到最低,防范于未然;又要减轻我厂面临着巨大的运维压力,降低信息管理的难度。因此,整个系统以事件为核心,将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统,对整个系统内的所有事件进行收集、关联分析和处理。
通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控,并以图形化的方式直观地展现出来。对于系统运行的异常表现及时报警,提供故障自动修复功能;同时预设性能监控阀值,以帮助在系统出现问题之前提前向管理人员发出预警。
3.网络综合监控运维管理系统在我厂网络管理中的应用及效果
网络综合监控运维管理系统要对我厂信息网络平台内的网络设备、服务器、数据库、业务应用、机房环境进行综合管理。系统的构成层次从下至上为:物理网络层、系统层、应用层,对所有这些资源进行监控和预警,提高了管理员的工作效率;并且生成可视化的报表,提供给管理人员查看,方便了管理员对资源进行合理的规划。
3.1模块化的系统管理平台,增强了信息网络管理的集成度
系统所建立起来的管理平台对我厂的网络设备、服务器、数据库、安全产品、中间件、公共应用、机房环境、终端PC等进行全面的监控。系统支持组合监控功能,可以对涉及我厂的各应用系统,从可用性、系统资源占用和性能指标三个层面进行全面深入的监控管理,从而增强了信息网络管理的集成度。
3.2自动化的网络拓扑发现,实现了网络信息获取的智能化
我中心之前绘制的网络拓扑图是管理员通过交换机命令逐级查找交换机设备,然后通过viscio软件绘制而成的静态拓扑图,展现的形式和内容极其单一,只能为日常网络维护提供交换机ip地址和端口号等简单的信息,不能实时显示网络设备信息及网络运行状态,从而增加了管理员网络运维工作的难度。
该系统能自动发现网络设备,生成全面、客观、真实的网络拓扑,实时对网络拓扑进行更新、跟踪、管理,并通过可视化、仪表化、智能化的导航管理模式,让我中心管理员快捷、方便的了解网络中各种网络设备的运行状态,并且提供的多样化、层次化展现拓扑图,帮助管理员轻松的做好运维工作,包括:
1)发现结果显示:在拓扑图上集成展现设备类型、设备状态,链路类型、链路状态、链路带宽流量、告警故障的展现;使用不同颜色、粗细、图标表示区别显示被管理对象的状态信息;
2)提供快速查找和定位设备功能,可以通过设备名称、IP地址、MAC地址等信息,在拓扑图上准确定位设备,并显示出此设备的网络连接信息;
3)自动记录设备的所有活动情况,如接入网络、设备迁移及上下线信息;
4)便捷的浮动信息显示,浮动显示各类设备和链路的关键信息。
3.3可视化的网络故障监控,提高了解决网络故障的效率
之前我中心管理员只能通过接到的故障上报电话来获得故障信息,信息的单一性和不详实性,导致处理故障耗时长、效率低,造成运维工作的局限性、被动性。
该系统根据预先设定的运行监测参数持续地监测网络系统的各项运行参数,跟踪网络拓扑的变化,一旦网络发生故障或者拓扑发生变化就可以迅速的通过前台拓扑图反映出来,在网络拓扑图上通过节点颜色或者一些小图标表现给管理员。同时将详细的信息传送给管理员,为管理员发现和处理事件提供一定的信息支持,使我中心管理员被动管理的局面根本性的转变为主动监控。我中心管理员可根据该提示及告警第一时间查找故障原因,并迅速的制定解决方案,大大提高了解决网络故障的效率。
3.4实时性的网络性能监测,提高了网络平稳运行的可控性
系统提供网络性能实时监测,支持阀值告警功能。系统监测到网络设备、服务器的端口流量、丢包率、错包率、Ping延时和丢包、CPU利用率、内存利用率、磁盘利用率等运行参数超过预设阀值时,能在拓扑图上根据用户定义阀值以醒目颜色显示,提供对历史性能数据进行统计分析功能,使我中心管理员可对异常信息进行实时跟踪,从而找出原因,并予以处理。
1)链路性能分析——系统能够实时监测网络内指定网段的链路通断并进行详细的展现,能帮助管理员对链路健康度进行评估,分析出断路对网络造成的影响大小。
2)设备性能告警——监测到网络设备的端口流量、Ping延时和丢包、CPU利用率、内存利用率、防火墙等网络安全设备的连接数、网络负载均衡设备正在处理的连接数、总连接数、正在处理的流量、总流量、地址池服务器状态等运行参数超过预设阀值时,发出故障预警信息。
3.5 内嵌式的网络流量监控,杜绝了出现网络瘫痪的可能性
内置的流量诊断分析工具提供了完善的流量分析和高级诊断解决方案,通过直观的展现界面为管理员提供各方面的流量协议分析报告。
通过流量诊断分析,我中心管理员可以快速诊断并发现网络变慢的原因,辅助定位各类蠕虫、ARP病毒,分析各类应用占用的网络资源,多角度协助管理员分析用户网络流量行为,并在发生流量异常的时候进行预警,预防由于滥用网络带宽造成网络瘫痪。
3.6 细粒度的主机资源自动监控,实现了网络设备管理的细致化
目前,我厂共有服务器29台,终端PC1100余台,庞大的网络设备给我中心的网络运维带来很大的工作量。
该系统提供了全面、细颗粒度的主机监测指标,例如CPU使用率、内存使用率、网卡状态、系统进程等,并对Windows、UNIX、Linux等各种操作系统的主机的关键资源的自动监控,帮助管理员及时发现故障和故障隐患。
3.7 多样性的报表统计,提高了网络运行趋势的预见性
系统能根据设备的类型、时间信息动态定制报表;支持对一体化平台监控的所有IT资源的当前和历史运行情况进行查询、生成各种分析报表和图表,如:网络运行统计、服务器运行统计、中间件/数据库运行统计、业务应用运行统计。
管理员通过系统提供的各种报表和视图,大大了解IT资源的运行状况和运行趋势。
4. 结论
“三分建设、七分管理”,监控与管理的有效性直接关系到各个应用系统的有效运行。综上所述,网络综合运维监控管理系统通过对我厂网络基础资源的监控和对运维管理体系的完善,不仅保障了网络、IT资源、业务系统的安全、可靠运行,而且逐渐形成的制度化、流程化、标准化和符合实际的日常运行维护体系,可大大提高我中心管理员的日常运维工作效率和服务水平,使我厂网络安全的建设和运维管理提升到了一个新的高度,进而确保我厂网络长期安全和平稳运行。
中国论文网(www.lunwen.net.cn)免费学术期刊论文发表,目录,论文查重入口,本科毕业论文怎么写,职称论文范文,论文摘要,论文文献资料,毕业论文格式,论文检测降重服务。 返回通信学论文列表