欢迎来到通信人在线![用户登录] [免费注册]

超文本标记语言(HTML)与可扩展标记语言(XML)

浏览:6313  来源:通信人在线  日期:2026-05-23

一、引述

1、关于标记语言

在计算机发展史中,信息的表示方式经历了从文本格式、脚本语言到二进制编码的变化。现在标记语言(Markup Language)己经成为最高级的信息表示方式。“标记”一词源于出版业,编辑会在手稿上做校对符号,告诉排版工人哪里加粗、哪里缩进等。计算机标记语言沿用了这个思想:用特殊符号(如尖括号 < >、反引号等)包围的标签或指令,不直接出现在最终视觉内容中。核心思想是将内容与表现形式分离,通过标记描述“这段文字是什么”(标题、段落、列表)或“这段文字应该怎样处理”(居中、加粗),让机器可以自动解析、渲染或转换文档。如在HTML中的标记语言形式如下图1-1所示。

1-1HTML中的标记语言形式

标记语言是一种用标记(标签)来注释文本的编码系统,使计算机能够处理文本的结构、含义或呈现方式。核心是将内容与元数据结合,它是一套用来给文本添加结构、语义或显示指令的编码规则。它通过在纯文本中嵌入特定标记,让计算机能够“读懂”并处理文档的内在结构,而不是把文本当作一长串无差别的字符。

2、标记语言的产生

起源于20世纪60年代,当时IBMCharles Goldfarb等人提出通用标记语言(GMLGeneralized Markup Language)。它首次将标记系统化,规定用 :h1. 等格式定义文档结构,核心思想是文档结构应独立于最终呈现。基于GML,国际标准化组织(ISO)发布了标准通用标记语言(SGMLStandard Generalized Markup Language),即ISO 8879:1986,它是一个巨大且严谨的元语言,可以定义其他标记语言。SGML强大但极复杂,让开发者望而却步,是HTMLXML的鼻祖。在上世纪九十年代初,蒂姆·伯纳斯-李(Tim Berners-Lee)用SGML的规则创造了一个简单应用,即超文本标记语言(HTMLHyper Text Markup Language)。它专为网页而生,定义了标题、链接、图片等基本元素,是万维网的基石,迅速普及。为了既保留SGML的可扩展性又去除其复杂性,在1998W3C推出了可扩展标记语言(XML)。它让用户可自定义标签(如 <书名>),使XML成为跨平台数据交换的通用格式,被广泛应用在配置文件、办公文档、网络服务中。无论是SGML还是XML,繁多的尖括号对普通写作不太友好。因此,在2004年,以Markdown为代表的一批语法极其简单、直接可读的轻量级标记语言应运而生。它们专为写作者设计,能轻松转换为HTML等格式,在博客、笔记、论坛和知识管理中迅速成为标准。

3、标记语言的分类

对于计算机的标记语言的分类方法,通常可采用按标记的作用方式分类和按语法重量的分类等。按标记的作用方式分类可分为表象型标记、过程型标记和描述型/语义型标记;按语法重量的分类可分为重量级标记语言和轻量级标记语言。像SGMLHTMLXML均属于重量级标记语言。下表1-3具体给出了计算机的标记语言的分类方法。

1-3:计算机的标记语言的分类方法

下述对于编辑语言发展过程产生的HTMLXML给以介绍。

二、超文本标记语言(HTML

1HTML概述

超文本标记语言(HTMLHyper Text Markup Language是专门为万维网(WWW上客户与服务器共同识别的一种语言,是标准通用标记语言(SGML)的一个延伸,是一种由标识来表示某些特性或功能的描述语言。对于超文本标记语言(HTML的可以从三个关键词来理解:超文本(Hyper Text);标记(Markup);语言(Language),具体详见下表2-1。一个HTML文档的基本结构就像一副骨架,由嵌套的标签组成,如下图2-1所示。简单来说,HTML 就是通过标签给文本、图片等内容赋予结构和意义,告诉浏览器“这是什么”。

2-1:超文本标记语言(HTML)的概念

2-1:超文本标记语言(HTML)文档的基本结构

欲详细了解万维网介绍请进入

2HTML的发展

超文本标记语言(HTML)的诞生与万维网(WWWWorld Wide Web)密不可分,其发展脉络大致如下:

首先是萌芽阶段(1989-1991):1989年,在欧洲核子研究组织(CERN)工作的英国科学家蒂姆·伯纳斯-李提出了万维网的构想,旨在让全球的研究人员能够方便地共享和链接文档。为此,他在1990年创建了第一套Web技术:HTML(用于编写网页)、HTTP(用于传输网页)和 URL(用于定位网页)。1991年,他发布了首个非正式的HTML文档,定义了最初包含18个标签的简单标记语言,这就是HTML的雏形,具体详见下表2-2-1

2-2-1HTML雏形的18个标签

其二是标准化及演进阶段(1995-1999):随着互联网的快速普及,HTML的标准化工作变得至关重要。互联网工程任务组(IETF)和后来的万维网联盟(W3C)接手了标准制定。于是其关键版本诞生:1995年第一个正式规范HTML 2.0发布(RFC 1866),确定了核心标签(注:19936IETF曾发布过被称为“HTML 1.0”草案的非正式标准,也从未被主流浏览器广泛采用)。1997年由W3C推出的HTML 3.2,它出现于浏览器大战时期,纳入了许多厂商特性(如表格、表单等),试图统一混乱的局面。1999年由W3C推出的HTML 4.01(它是199712W3C发布的HTML 4.0的修订版),一个非常重要的版本,引入了样式表(CSS)和语义化思想,将页面的结构(HTML)与表现(CSS)分离,使HTML回归结构标记的本质。

其三是标准统一化阶段(2000年至今):进入21世纪的2000年,W3C曾试图用更严格的XHTML(,扩展XHTML,基于XMLHTML)来取代HTML 4.01,但因其过于严苛而进展缓慢(注:曾发布过XHTML1.0XHTML1.1 XHTML2.0三个版本,详见下表2-2-2的介绍)。

2-2-2XHTML1.0XHTML1.1 XHTML2.0简介

2004年,苹果、MozillaOpera等浏览器厂商成立了网页超文本应用技术工作组(WHATWG),致力于推动HTML向前发展,尤其是增强Web应用功能。最终,W3CWHATWG合作,于2008年发布HTML5首个公开草案,并在2014年完成HTML5的正式推荐标准。此后,W3CWHATWG在标准上出现分歧,最终于2019年达成协议,确认WHATWG维护的“HTML动态标准”(HTML Living Standard)成为唯一的标准版本,这意味着HTML进入了持续迭代、不再有版本号的“动态标准”时代。下表 2-2-3反映了HTML各版本的基本情况。HTML5标志着HTML从文档标记语言向应用平台转型,其主要特性详见下表2-2-4,下附录2按功能分类给出了HTML5常用标签一览表。

2-2-3HTML各版本的基本情况

2-2-4HTML5的主要特征

附录 2HTML5常用标签一览表

3HTML的功能与作用

HTML 的核心功能是描述和定义网页的内容与结构,具体体现在下表2-3所述的5个方面。HTML Web生态中扮演着基础且不可替代的角色,其作用体现在以下表2-3中所述的4个层面。总而言之,HTML历经三十余年的演进,已从一种简单的文档链接语言,成长为构建现代、复杂、跨平台Web应用的强大而灵活的基石。下附件2HTML教程,可以更多了解HTML技术的使用。

2-3HTML的功能与作用简述

附件 2HTML教程

三、可扩展标记语言(XML

1XML概述

可扩展标记语言(XMLExtensible Markup Language)是一种用于描述、存储和传输结构化数据的标记语言。它既是互联网信息交换的重要基础,也是无数软件系统配置文件与文档格式的基石。XML 是一种元标记语言,这意味着它不提供一组固定的标签,而是允许用户根据自身需要定义自定义标签,从而描述任意结构的数据。它由万维网联盟(W3C)制定,是一种开放标准。其核心设计思想是数据与表现分离,专注于数据的内容、结构和含义,而不关心数据最终如何显示(这与 HTML 的侧重点截然不同)。XML的主要技术特点详见下表3-1-1的描述;下表3-1-2介绍了XML技术的优缺点。

3-1-1:可扩展标记语言(XML)的主要技术特点

3-1-2:可扩展标记语言(XML)的主要优缺点

2XML的发展

XML是基于SGMLHTML的困境而产生。SGML功能极其强大,在航空、军事等大型工业文档中应用广泛,但它太复杂、太昂贵,根本无法在 Web 浏览器中实现。而HTML简单易用,推动了 Web 的繁荣,但它的标签集是固定且面向显示的,无法表达数据的语义,同时,早期 HTML 语法的松散性导致页面表现不可预测。

于是,W3C1996年开始着手设计一种全新的标记语言,目标很明确:一是像 SGML 一样强大、可扩展,并像 HTML 一样适于在 Internet 上使用;二是易于各类应用程序处理和生成;三是格式要正规、简洁。19982月,W3C正式推出 XML 1.0推荐标准,这是数据交换领域的一个里程碑。此后,XML 1.0 历经多次修订,至今仍是绝大多数场景下的主要版本。2004年曾推出 XML 1.1,主要改善了对 Unicode 新字符和行尾字符的处理,但由于兼容性等原因,并未取代 1.0XML 的推出不仅仅在于其本身,更在于围绕它迅速生长起来的一整套支撑技术标准,具体详见下表3-2的介绍。

3-2:完整的“XML 家族”生态

3XML的功能与作用

XML 的核心价值在于充当了不同系统之间的“通用数据语言”,下表3-3-1列举了XML的主要功能与作用。基于上述XML技术,XML 被广泛应用于下表3-3-2所列的几个技术应用领域。

3-3-1XML的主要功能与作用

3-3-2XML的主要技术应用领域

随着 Web 2.0 和移动应用的爆发,JSONJava Script Object Notation)以其极简的结构、与 JavaScript 的无缝对接和更高的传输效率,已成为 Web API 和数据传输的主流格式,XML 不再像过去那样独占鳌头。然而,XML 并未被淘汰,而是在文档标记、企业级复杂数据交换、持久化配置和金融/医疗等行业标准领域依然牢牢占据核心地位。目前的局面更多是一种按场景分工:JSON 主导“轻快”的 Web 数据传输,而 XML 专注于“严谨、复杂、长生命周期”的文档与数据描述。两者各擅胜场,共同构成了结构化数据生态中不可或缺的部分。

另外,下表x从十多个维度给出了HTMLXHTMLXML的特征比较,以供了解。

xHTMLXHTMLXML的特征比较

欲进一步了解Web2.0互联网应用技术介绍的请进入

附件
HTML教程

563.15KB

百度云服务器
© 2004-2026 通信人在线 版权所有 备案号:粤ICP备06113876号 网站技术:做网站