当前位置: 主页 > 网络知识 > 网络管理 > 计算机技术创新 数据可视化方法应用到网络管理

计算机技术创新 数据可视化方法应用到网络管理

时间:2009-9-19来源:中国教育和科研计算机网 点击:

  数据可视化技术使得人们不再局限于通过文本或关系数据表来观察和分析数据信息,转而以更直观的方式研究数据并发现其中隐藏的关系,将单调乏味的数据及其内涵关系美观形象地展现在人们面前。根据实现原理的不同,数据可视化方法可以划分为基于几何的技术、面向像素的技术、基于图表的技术、基于层次的技术、基于图像的技术和分布式技术等。

  目前,数据可视化技术已经在电子商务、数据仓库、社交网络、计算机网络等信息领域得到了普及应用。由于信息可视化技术及其应用范围非常广泛,在本文中,我们仅侧重于网络数据的可视化技术研究(这儿的网络数据是指通过网络测量、网络管理和安全等研究工作所取得的原始数据),主要介绍几种典型的网络数据可视化方法和相关的应用实例。

  可视化技术的需求

  随着网络技术的发展和网络规模(特别是Internet)的不断扩大,网络已经成为人们日常生活的必不可少的一部分。同时,人们对网络服务质量(QoS)的要求也越来越高。因此,网络性能监测、网络管理、网络安全等已经成为网络技术研究和应用的重要组成部分,而网络数据可视化技术在其中所起到的作用也越来越关键。

  首先,为了实现性能监测的目的,管理人员必须即时对网络中设备的工作负荷,即数据流量、链路利用率、丢包率、延时等各项性能参数进行定量评价。因此,网络性能的可视化是网络运行中重要的组成部分;其次,在针对园区网、骨干网以及因特网的管理和研究过程中,网络拓扑、IP地址和AS域分布范围的可视化也一直是研究人员的重中之重;最后,针对网络安全的恶意攻击行为,如扫描、蠕虫、病毒等造成的安全事件、异常流量及影响范围和演化趋势的可视化也具有非常重要的实际意义。

  与其他领域的可视化需求相比,网络数据的可视化具有三个特点:一是网络数据与时间紧密相关,因此时间序列数据的可视化是其重要研究内容;二是由于网络数据的海量性和复杂性,需要快速实时地进行数据处理和分析来获得可视化结果;三是网络数据的可视化以真实性为首要目的,在保证正确显示数据的基础上实现可视化结果的美观性。目前,CAIDA、IEPM、SecViz等测量和研究组织和团体已经提出并实现了许多适用于网络数据可视化的方法和工具。概括来说,网络数据的可视化主要以基于图表和基于图像两种可视化技术为基础,其中基于图表的可视化技术主要用于网络性能的可视化,包括折线图、散点图、柱状图、饼图等多种方法,基于图像的可视化技术主要用于网络管理和安全研究数据的可视化,包括气象图(WeatherMap)、热图(Heat Map)以及三维图像可视化等许多方法。总之,通过网络数据的可视化,可以实现:

  1.方便快速地获取更多的网络性能、网络状态等参考信息;
  2.深入了解和分析已知的网络现象和规律;
  3.能够从繁杂的数据中找出其中蕴含的关系,发现新问题并提出解决方法。
  因此,深入研究和使用数据可视化技术对于开展网络监测、网络管理以及网络安全等研究工作具有重要意义。下面我们将通过实际的图例来详细介绍几种典型的网络数据可视化方法及其应用。

  基于图像的可视化技术

  网络气象图
  网络气象图是一种直观的显示网络拓扑、设备节点和链路状态等网络数据信息的可视化工具。网络气象图最早是由Panagiotis Christia实现的一个基于Perl的开源的可视化工具,以后Howard Jone又在功能、界面等方面进行了许多改进,发展成为一个受到普遍欢迎的网络数据可视化技术。目前,网络气象图在国外许多网络中得到了实际部署与应用,国内的CERNET、中国科技大学等也都使用网络气象图作为一种网络拓扑显示和监测的方法,如图1。网络气象图能够实时显示网络节点状态、链路利用率等信息,实现网络拓扑、网络设备和链路状态的实时监控。随着网络技术和应用的发展,网络气象图开始与Flash动态显示技术、Google Maps等新的可视化方法相结合,从而能以更加直观友好的方式显示丰富的网络状态信息,典型的代表是GlobalNoc的RealTime Atlas项目。

 

  热图
  热图是将二维空间中的数据用不同颜色的像素来区分,其中黑色或灰色像素表示大的数值,而小的数值则用浅颜色像素来表示。热图最初来源于数据矩阵的二维图形展示,Sneath首先采用热图来显示数据聚类分析的结果,Wilkinson则在1994年利用计算机程序产生出了第一个高分辨率热图。目前,热图已经应用于IP地址范围、AS域分布以及BGP路由表等网络数据的可视化。图2是根据BGP Routing测量结果绘制的IPv4地址分布范围热图,图3则用热图显示了Internet中存在恶意行为的IP地址范围的监测结果,两者均使用Hiebert曲线将IPv4地址映射到二维空间,来实现同种类型IP地址的临近分布,另一种可能的映射方法是QuadTree算法。此外,Google Analytics也通过热图来分析显示不同Web的访问频率,CDN服务商Akamai也使用热图来比较显示来自不同地区的网络攻击、数据流量、网络延时等信息。

  三维图像可视化方法

  以上介绍的都是二维空间的平面可视化方法,随着计算机图形技术的发展,基于三维空间的数据可视化方法越来越普及,许多现有的二维可视化技术也逐步向三维可视化转移。相对于二维可视化方法,三维可视化能够更丰富的展示海量的网络数据,更深层次的挖掘数据之间的内涵关系,更准确地发现数据中蕴含的问题,有利于揭示新现象和新规律,提出新的解决方法。下面我们主要以两个实例进行说明。

  与AWStat等日志分析软件不同,Raju Varghese使用三维图来实现Web服务器日志的可视化,可以同时显示时间、IP地址、访问对象和服务器状态等多维数据信息。

  与Flowtools等流量分析工具相比,Flamingo可以实现网络流量的实时三维可视化,它提供了一系列方法来展示Netflow数据所蕴含的不同方面,并分析其中存在的现象和问题。Flamingo在实验中也发现了图5中所展示的相同问题,并称之为“Slashdot现象”。

  总之,网络数据可视化是网络技术研究和应用中的一个非常重要的组成部分。随着计算机图形学和数据处理技术的不断发展,新的数据可视化方法层出不穷,并被不断应用到网络数据的可视化实现中,因此,网络数据可视化技术具有方法越来越丰富,功能越来越强大、结果越来越美观的特点。本文主要结合实际的应用图例,概要性地介绍了现有的几种典型的网络数据可视化方法,希望能达到抛砖引玉的目的。
  (作者单位为山东大学网络信息中心)

 

站长资讯网
. TAG: 网络 计算机技术 数据 可视化 应用
推荐内容最近更新人气排行
关于我们 | 友情链接 | 网址推荐 | 常用资讯 | 网站地图 | RSS | 留言