当前位置: 主页 > 编程知识 > xml编程 > XML简介

XML简介

时间:2009-9-30来源:站长资讯网 点击:

XMLeXtensible Markup Language,可扩展置标语言)是由W3CWorld Wide WebConsortium,互联网联合组织)于19982月发布的一种标准,是 SGMLStandard Generalized MarkupLanguage,标准通用置标语言)的一个简化子集。由于它将SGML的丰富功能与HTML的易用性结合到了Web的应用中,,以一种开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。这样所组织的数据对于应用程序和用户都是友好的、可操作的。 XML推出以来,迅速得到软件开发商的支持和程序开发人员的喜爱,显示出强大的生命力。

1、为什么需要XML

Internet提供了全球范围的网络互连与通信功能,Web技术的发展更是一日千里,其丰富的信息资源给人们的学习和生活带来了极大的便利。特别是应运而生的HTML(超文本置标语言),以简单易学、灵活通用的特性,使人们发布、检索、交流信息都变得非常简单,从而使Web成了最大的环球信息资源库。然而,电子商务、电子出版、远程教育等基于Web的新兴领域的全面兴起使得传统的Web资源更加复杂化、多样化。同时,人们对Web服务功能的需求也达到更高的标准,比如:用户需要对Web进行智能化的语义搜索和对数据按照不同的需求进行多样化显示等个性化服务;公司和企业要为客户创建和分发大量有价值的文档信息,以降低生产成本,以及对不同平台、不同格式的数据源进行数据集成和数据转化等等,这些需求越来越广泛和迫切。

传统的HTML由于自身特点的限制,不能有效地解决上述问题:作为一种简单的表示性语言,它只能显示内容而无法表达数据内容。而这一点恰恰是电子商务、智能搜索引擎所必需的。另外,HTML语言不能描述矢量图形、数学公式、化学符号等特殊对象,在数据显示方面的描述能力也不尽如人意。最重要的是:HTML只是SGML(StandardGeneralized MarkupLanguage,标准通用置标语言)的一个实例化的子集,可扩展性差,用户根本不能自定义有意义的置标供他人使用。这一切都成为Web技术进一步发展的障碍。

SGML是一种通用的文档结构描述置标语言,为语法置标提供了异常强大的工具,同时具有极好的扩展性,因此在数据分类和索引中非常有用。但SGML复杂度太高,不适合网络的日常应用,加上开发成本高、不被主流浏览器所支持等原因,使得SGML在Web上的推广受到阻碍。在这种情况下,开发一种兼具SGML的强大功能、可扩展性以及HTML的简单性的语言势在必行。由此诞生了XML语言。

脱胎于SGML的XML(可扩展标记语言 Extensible Markup Language)对 SGML和HTML的改造是简单的。这种简单继承了SGML的高度概括和HTML的易懂易读,使之自然平滑地过渡,为工程师和浏览器的升级创造了很好的技术“接口”;同时,这种改造的影响是巨大的, XML将Web信息的组织结构彻底改写。 XML已经不满足于HTML 的“所见即所得”,它通过上下文的数据关联、规范化的数据格式和灵活的自定义,使Web 具备了表达网页中的元素究竟“是”什么的能力。这种能力对于人脑来说也许仅仅需要瞬间逻辑的判断,但对于尚处于非智能化阶段的PC来说,无疑是一次“学习的革命”。

2XML的优点

XML的优势之一是开放性,它允许各个组织、个人建立适合自己需要的置标集合,并且这些置标可以迅速地投入使用。这一特征使得XML可以在电子商务、政府文档、司法、出版、CAD/CAM、保险机构、厂商和中介组织信息交换等领域中一展身手,针对不同的系统、厂商提供各具特色的独立解决方案。

XML的优势之二是分离性,它的数据存储格式不受显示格式的制约。一般来说,一篇文档包括三个要素:数据、结构以及显示方式。对于HTML来说,显示方式内嵌在数据中,这样在创建文本时,要时时考虑输出格式,如果因为需求不同而需要对同样的内容进行不同风格的显示时,要从头创建一个全新的文档,重复工作量很大。此外HTML缺乏对数据结构的描述,对于应用程序理解文档内容、抽取语义信息都有诸多不便。

XML把文档的三要素独立开来,分别处理。首先把显示格式从数据内容中独立出来,保存在样式单文件(StyleSheet)中,这样如果需要改变文档的显示方式,只要修改样式单文件就行了。XML的自我描述性质能够很好地表现许多复杂的数据关系,使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,忽略其他不相关部分。XML还有其他许多优点,比如它有利于不同系统之间的信息交流,完全可以充当网际语言,并有希望成为数据和文档交换的标准机制。

当然,XML作为一个新建立的标准,还有许多不足之处:它在强调了数据结构的同时,语义表达能力上略显不足,例如定义了<地址>这样一个置标,如果不是在文档中实际定义内容,我们就无法知道是要表达家庭住址还是E-mail地址。另外,XML的有些技术尚未形成统一的标准,充分支持XML的应用处理程序很少,甚至浏览器对XML的支持也是有限的。

3XML前景展望

XML的诞生为电子数据交换提供了新的思路,EDI的缺陷正是XML应用的长处,XML充分利用了现有的网络资源,通过定制DTD/Schema可以方便灵活地体现新的商业规则,无论从技术还是成本上,XML都更容易流行。许多基于XMLWeb服务的最初应用都被用十分基础的数据交换应用上。 同时,XML也应用在本地计算,数据的多种显示和网络出版,支持Web应用的互操作和集成等领域。

XML同时会带来商业的机会。可以想象,当整个互联网的信息在XML的平台上整合应用,使信息海洋的杂乱无章无疑会得到根本的改善。每一个数据节点都将信息有序地存储,并能为对方所接受。如果说目前静态的基于元素位置摆放的第一代Web还可勉强应付B2C的挑战,那么其缺乏统一数据交换规范无疑是目前B2B商务急待解决的问题。毕竟,商家之间交易所涉及的物流、管理流、信息流和资金流需要在规范和标准的轨道上进行,这在现实社会中通过成功应用标准化的纸制文档已有数个世纪,并借助这些规范创造了无以计数的财富。

置身于这样的发展空间,捕捉互联网的发展轨迹,我们就不难理解2000年业界对XML倾注的热情和投入。从互联网到华尔街,从硅谷的IT精英到医药界的HIS应用,从在线新闻出版到远程教育培训,从企业财会报表到内部资源管理系统建设,各种各样的行业XML标准和规范纷纷出台,据不完全统计已经有多达350项。

现在可以预见的是,在不久的将来,会有更多的网络应用支持并采用XML技术和平台,在此基础上,第三代互联网轮廓凸现。未来的Web,将在高度统一、开放的数据标准之下,透过无所不在的应用终端,展开随时随地的移动交换和计算,真正为商务时代的互联网提供一个个性化的界面、规范化的流程和数据质量的保证。

XML自从19982月成为推荐标准后,许多厂商加强了对它的支持力度,包括MicrosoftIBMORACLESUN等,它们都推出了支持XML的产品或改造原有的产品支持XMLW3C也一直在致力于完善XML的标准体系。然而由于XML的复杂性和灵活性,加上工具的相对缺乏,增加了XML使用的难度。因此,XML很难在短期内完全替代HTML,成为互联网的主角。另外,由于XML是元置标语言,任何个人、公司和组织都可以利用它定义新的标准,这些标准间的通信成为了巨大的问题,因此人们在各个领域形成一些标准化组织以统一这些标准,但是这些努力并不一定能够形成理想的结果。无论如何,XML的出现为互联网的发展提供了新的动力,终将成为互联网上全新的开发平台。它促使了新的类型的软件和硬件的形成和发展,而这些发展又将反过来促进XML的发展。

站长资讯网
. TAG: XML 简介
推荐内容最近更新人气排行
关于我们 | 友情链接 | 网址推荐 | 常用资讯 | 网站地图 | RSS | 留言