网络烽火连天不休,网管救急一马当先。冲锋于各大网络“战事”最前线的网管员,他们对于这一职业的思考如何呢?让我们来关注这一群体的生活麻辣烫。
网络广播风暴
“核心交换机快撑不住了,网络瘫痪了!”听罢主任一声急吼,小陈运速可媲美奔六的脑袋嗡的一声大了,心下暗叫不好,自己最担心的网络广播事故最终还是不幸降临。
来不及细想,小陈立马打开网络流量监测界面,扫描网络异常情况,发现了如下信息:一可疑交换机端口,正频繁遭受大量广播包轰炸。通过MAC地址确定,可以锁定其故障源——处于模拟仿真实验室中的某台主机设备。
小陈一阵风似冲至实验室,第一时间切断了与实验室各主机相连的交换机电源。长舒口气,一场网络故障在小陈匆忙的东奔西走中得到了最快处理,损失率降至了最低。
有过一场敢死队员的网络救火经历,小陈开始暗暗琢磨这场事故的幕后黑手为谁。网络为何如此不堪一击?是否因为网络部署合理性存在问题?好刨根问底的小陈在咨询过一轮身边朋友后,挖出了该网络故障的原罪——网络规划问题。
小陈所在学校的网络环境是这样的:98年学校就超前实现了千兆骨干网,核心设备采用Intel的二层交换机,后来由于楼宇间的分支式管理需求,使用了网捷的智能边缘三层交换机,实现了网络的去中心化。
但由于当时园区网还只是一个基于第二层的交换式快速以太网络,全网属于同一个广播域,在这样的局域网上通信,ARP请求帧是以广播方式发送的,一旦某节点出现问题,就会迅速波及整个广播域,造成连接的交换机不堪工作重负,酿成网络事故。这样的“特殊”网络架构意味着网络存在着极大隐患,给网管带来很多不便。
IP地址动态分配问题
“网络又被攻击了,到底哪个家伙?”收到网络警报,小陈一脸怒气。
通过追踪攻击对象,小陈查出了其对应的IP地址,但一时却无法准确判断该IP地址所在的物理位置。
原因还在于整个校园网采用IP地址动态分配方式,配置了DHCP服务器。这种方式对网管而言避免了手动分配IP地址,看似“偷懒宝鉴”,但给网络管理留下了不少“后遗症”。
就拿眼前这一棘手问题来看,网络攻击目标难以准确定位,安全与效率双效失衡。
升级改造工程
碰到了两个典型网络故障问题,也让小陈感受到了网管之难。而这种困难正是网络部署的不合理导致的。如何根据具体应用改善网络部署成为了小陈考虑的重点。在网络中心两位主任的指导下,学校的整体网络进行了一番升级改造。目前,校园网结构是:骨干网更新为三层核心交换机,提升了网络通道职能强度。并且对重要楼宇的交换机进行了更新。并且在核心交换机上设置多个VLAN,通过交换机端口进行划分,具体到各个楼宇,进行VLAN的细化分配。通过优先级制定来保证音、视频网络应用的流畅。
网管的矛盾
经历过一番网络设备“换血”,如今的校园网更显朝气。但是小陈的工作量却未见减轻。依旧不断接到网络故障“投诉”,依旧不断地奔走于各节点网络设备之间。基于设备的网络管理让小陈心生倦意。而且网络管理中的矛盾仍在不断暴露。据小陈介绍,目前的网管困境有三:
其一、目前无论是企业网,还是校园网少有部署统一的网管平台,实现集中报警功能。因为,小陈所在的网络环境决定着其管理工作还是基于网络设备的管理,当网络设备出现故障时,常规的做法是按照章程,找出问题并解决。对管理的主动性不够。当然网管中心也已一直考虑运用网管平台,但是由于设备功能的继承性无法保证,以及定制性服务缺乏等因素,该想法暂先搁浅。
其二、动态IP地址分配的方式导致了网管员对用户的管理能力比较弱。另一方面,对于终端用户的最终需求,网管人员也无法准确把握,双方面临“信息不对称”现状。网管职能与网络用户的个人隐私保障存在着悖论。
其三、无线网络安全性、便捷性存在着失衡状况。由于安全隐患,无线网络也只是在小范围部署,并且与校园内部网络隔开,确保网络安全。
心声:不当“后勤”网管
曾经踌躇满志,如今沦为“后勤”网管。如果做份网管员职业生涯规划,小陈对自己的这份答卷显然不太满意。相信很多网管员对于这种体会也能感同身受。那么如何在有限的网管生涯中寻求更大的拓展空间?
关于这个问题,在网管员群体里面还是有一定代表性的,而且不仅局限于这个群体,可能在很多年轻人中都存在这样一个共性的问题。在这样的情况下,小陈认为每一个人首先要努力提升自身能力,切忌好高骛远,而且当面临职业生涯的更多选择时,一定要有自己的规划,并且一定要去学习培训、提高。这样才有可能在新的平台上抓住机遇,因为在如今的学习型社会中,只有把自己充实起来,提升起来,才能拥有更多机会,如果站在角落里,钻进死胡同,就可能永远找不到一个有效方法。
理性应对闪电战
电话那头,胡顺良的声音显得有些腼腆。他说,作为网络管理人员,我们更像是急症室的医生亦或消防队员,在最快的时间里解决问题,否则耽误同事工作,我们每时每刻都要冷静的面对这些疑难问题,只有冷静的去分析思考才能很好的处理,这些问题错误都是很少重现的,你的经验有时候不起作用,更多的是我们去深层次分析问题根源,才能解决你以前包括网上其他人都没有解决过的问题。
胡顺良是北京阳光加信软件技术有限公司的网管,这是一家韩国手机游戏开发公司的中国分公司。公司员工都是IT从业人员,有一些还是计算机高手,因此,他们留给网管员的问题就更为复杂与棘手。他向记者介绍了自己就近遇到的两个紧急问题:
戴尔计算机出现的奇异故障
一天早上,我的同事candy把她的戴尔optiplex 170L机抱过来,机器无论如何都不能进入系统。主要的现象是:开机后显示“press F1 To Retry Boot F2 fot Setup Utility,”如果按照提示按F1,还是出现刚才提示的结果,如果按F2 ,进入BIOS设置,保存后又重新启动,设置光盘启动也不能重新安装,然后出现黑屏;设置为让硬盘启动也不可以,但是在BIOS里是可以检测到硬盘的。
在网上搜索了半天,没有发现很好的解决办法,于是给戴尔技术支持打电话,我详细的介绍了出现的问题现象,他说没有出现过这种情况,他按照一般的处理方法让我操作,结果我都试验过了,不能进入系统或安装系统。
于是我静下心来,思考出现这个现象的几个可能,基本上可以确定是硬盘不能启动,那么或者是硬盘有坏道或扇区,或者是硬盘启动文件坏了,按照软件和硬件两个方面来处理,把所有的硬件检测一遍,都是正常没有问题。
于是可以判定问题出现在软件上,很可能是启动文件坏了。
为了确定内存也没有问题,又采用互换的方法把内存检测了一次。内存没有问题,然后把硬盘也用互换的方法做一次系统启动测试,结果发现硬盘在其他戴尔同型号机器上检测到,启动文件都存在,如果把几个启动文件都传过去也没有效果,于是把问题硬盘的C分区给格式化。把问题硬盘拆下来,放回原来的计算机,重新启动计算机,新的问题又来了,发现找不到启动文件了,为了更新BIOS信息,按ALT+E+F+B,系统重新刷新BIOS,设置BIOS让光盘启动,放入戴尔的恢复光盘,蓝色的屏幕终于出现了,不再是黑屏,然后一路顺利的可以安装了。
这次问题的根本就是硬盘无法启动,最后把问题简单化,用计算机问题常用处理办法互换方法来检测确定问题所在,解决了别人看起来难以解决的问题。
软件出错信息的巧妙处理
在软件公司不仅要处理日常的计算机设备和网络的故障,还要处理很多软件开发环境以及开发平台等软件出错问题。
上周我的一个开发部同事告诉我,他的笔记本上出现了这样的错误提示:“unknown software exception 0x0000094,要终止程序,请单击‘确定’,要调试程序,请单击‘取消’。”
我听了他的讲述后,首先想到的是是否可以重现该问题,于是来到他的笔记本前,然后他在浏览器里点击某个文件后就出现了刚才的错误。然后我开始询问最近他安装了哪些软件,这些软件是否正常删除,什么时候开始出现这个错误的。他是一个开发人员,比其他部门的人员在技术上比较好,对问题的表述也比较清楚,他告诉我在这之前他安装了几个播放软件,其他的都删除了。计算机上安装了很多开发工具和开发平台,如果直接重新安装系统损失很大,很多软件都要重新安装,还有很多软件现在没有安装软件了,这样只好修复,不能重新安装系统。
按照错误提示的代号,我到网上找了半天也没有找到好的处理办法,但是肯定的一点是内存溢出,我因为对计算机原理很熟悉,对硬件很了解,所以有了基本的判断,但是怎么办呢,网上英文资料也没有,论坛上都是失败的例子或是重新安装问题依旧,是那个软件出现了内存溢出呢?现在又不能重新安装系统?
针对现在的情况,先去找线索,这个开发人员说安装过播放软件,还有什么可以提示的呢? 去找系统得日志、事件查看器,在事件查看器里,发现有某个dll文件出问题了,并且发现是media软件,进一步确定是播放软件删除不彻底造成的,某个dll文件还存在。那么首先要确定现在还有哪些软件还在运行,或者想办法把dll关联的软件文件找到就可以解决了。
同时运行的软件很多,关联的dll文件也很多在运行,怎么找呢?于是从网上找了一个专门查第三方dll的软件 shellexview,下载安装好,首先把第三方的dll文件全部禁止掉,到出现问题的地方,一个一个的试验,就这样最后确定就是那个播放软件的问题。把该软件相关的都清理掉,彻底的解决了,再也不提示上面的错误了,既没有还原系统,也没有重新安装系统,圆满地解决了问题。
网管员的一天
作为一家大学网络中心管理员的王玉湘,刚上班便从自己的电脑中熟练地调出防火墙界面,查看防火墙日志。进行内容审计,没有出现敏感内容。
打开web服务器日志,进行入侵检测。王玉湘发现除了一些人无意之中留下的痕迹之外,有一个外部的地址连续的扫描。二话不说,直接在防火墙上禁止该地址对服务器的访问。
开始流量检测,使用MRTG软件,查看进出服务器的流量,记录流量。“嗯,起伏正常,没有问题。”王玉湘心中默念道。
接到教学楼A老师的报修电话,说是教室PC出现了软件上的故障。“faint,这年头,什么事情都找到我。”王玉湘埋怨道。学校网管中心有网络、计算中心两个部门,后者管终端。但是不管任何问题发生,当事人都直观地认定这是王的事情。“那您先登记一下,一个小时后计算中心会统一处理。”王玉湘快速地回答了A老师。
上钟爱的网管员世界、中国计算机报设网址以及各大论坛上更新,吸收各种行业新资讯。网管员很多时候就这样守株待兔,时