前言
HTML 5如同一场革命,正在Web2.0后时代轰轰烈烈的进行着。
HTML 5是什么,无须我在这里赘述了。对于HTML 5的革新,按我的理解,可以总结为语义明确的标签体系、化繁为简的富媒体支持、神奇的本地数据存储技术、不需要插件的富动画(canvas)、强大的API支持。总之,HTML 5让人机交互,人网交互变得更加舒适,贴合用户。以往对富媒体应用与本存储的支持乏力也不再是浏览器的切肤之痛。将Web从内容平台推向标准化的应用平台,并一统各在平台阵营的标准,才是HTML 5革命的初衷。
本文,我就抛砖引玉,阐述HTML 5的革新之一:语义更明确简洁的结构。
从”头”说起
一个标准的XHTML头部代码应该是这样:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "">
<html xmlns="">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
</head>
你能记住吗?你会去死记硬背吗?当然不会!我们只需要机械的复制粘贴即可。
再看看一个标准的HTML 5头部是如何的:

<!doctype html>
<meta charset=gb2312>
孰繁孰简,就不用我说了。是的,HTML 5的头部可以如此简单,可以轻易的记住!并且,可以忽略大小写,引号以及最后一个尖括号前的反斜线。
为什么可以如此松散?其实,如果把XHTML当成text/html发送,浏览器一样可以很好的解析,浏览器并不在乎代码的语法。所以,HTML 5是形而上的,它可能会破坏原有的一些标准,但仍可在浏览器中很好的表现。
当然,为了团队协助与后续维护的方便,我们还是应该统一一种你喜欢的风格的写法,比如:

<!doctype html>
<html>
<head>
<meta charset="gb2312" />
...
</head>
<body>
...
</body>
</html>
另外,HTML 5虽然目前并不为所有浏览器所支持,但这个能省去100多字节(对于日PV百万级以上的站点,能省下不少的流量哦)的头部已可以完美的兼容了。如果你对浏览器解析模式有研究的话,你应该知道,页面在没有定义doctype的情况下会触发怪异模式,而只要定义了<!doctype html>浏览器就可以在标准模式下解析页面,而不需要指定某个类型的DTD。
新的语义化标签体系
语义化编码是一个合格前端Developer必备的技能,但随着网页的日渐丰富化,仅仅用原有的xhtml标签去语义化显然已经力不从心。上帝说:”要有光!”便有了光。于是,HTML 5提供了一系列新的标签及相应属性,以反应现代网站典型语义。实践出真理。还是写一个例子吧:

<div id="header">
 <div class="hgroup">
  <h1>网站标题</h1>
  <h1>网站副标题</h1>
 </div>
 <div id="nav">
  <ul>
   <li>HTML 5</li>
   <li>CSS</li>
   <li>JavaScript</li>
  </ul>
 </div>
</div>
<!--//header end-->
<div id="left">
 <div class="article">
  <p>这是一篇讲述HTML 5新结构标签的文章。</p>
 </div>
 <div class="article">
  <p>这还是一篇讲述HTML 5新结构标签的文章。</p>
 </div>
</div>
<!--//left end-->
<div id="aside">
 <h1>作者简介</h1>
 <p>Mr.Think,专注Web前端技术的凡夫俗子。</p>
</div>
<!--//side end-->
<div id="footer">
页面的底部
</div>
<!--//footer end-->
上面是一个简单的博客页面部分HTML,由头部、文章展示区、右侧栏、底部组成。编码整洁,也符合XHTML的语义化,即便是在HTML 5中也可以很好的表现。但是对浏览器来说,这就是一段没有区分开权重的代码,而不是一个让机器也能读懂语义的标签来定义相应的区块。比如,标准浏览器(比如Firefox、Chroome甚至新版的IE)都有一个快捷键可以带引客户直接跳转到页面的导航,但问题是所有的区块都是用DIV定义,并且DIV的ID值是同开发者定的,所以,浏览器并不知道哪个应该是导航链接所在区块。HTML 5新标签的出现,正好弥补了这一缺憾。那么,上面的代码,换成HTML 5就可以这样写:

<header>
 <hgroup>
  <h1>网站标题</h1>
  <h1>网站副标题</h1>
 </hgroup>
 <nav>
  <ul>
   <li>HTML 5</li>
   <li>CSS</li>
   <li>JavaScript</li>
  </ul>
 </nav>
</header>
<div id="left">
 <article>
  <p>这是一篇讲述HTML 5新结构标签的文章。</p>
 </article>
 <article>
  <p>这还是一篇讲述HTML 5新结构标签的文章。</p>
 </article>
</div>
<aside>
 <h1>作者简介</h1>
 <p>Mr.Think,专注Web前端技术的凡夫俗子。</p>
</aside>
<footer>
 网页底部
</footer>
原来,HTML的页面结构可以如此之美,不用注释也能一目了然。对于浏览器,找到对应的区块也不再会茫然无措。
如何用HTML 5新标签结构化元素
通过上面的示例,我们了解到HTML 5的新标签对结构化的革新,但切换到实际使用中,该如何恰当的使用它们呢?我想这也是很多HTML 5学习者想问一个问题。如同XHTML语义化一样,HTML 5语义化标签的使用也应该遵循:每个标签都有它特定的意义,而语义化,就是让我们在适当的位置用适当的标签,以更好的让人和机器(机器可理解为浏览器可理解为搜索引擎)都一目了然。比如header标签一般是页面的第一个区块元素(header标签也可用于类型的头部元素中,比如文章区块的标题),包含的了页面的主题信息;nav标签一般用于包裹导航信息;footer一般用来包裹页面底部信息;等等。
下面是我参考HTML 5手册列出的结构类常用新标签的语义解释及使用指引:
<header>标签
手册释义:定义 section 或 document 的页眉。
使用指引:一般用来包含页面头部,也可用于其他区域头部,比如article头部:

<header>
 <hgroup>
  <h1>网站标题</h1>
  <h1>网站副标题</h1>
 </hgroup>
</header>
<hgroup>标签
手册释义:用于对网页或区段(section)的标题进行组合。
使用指引:用于标题类的组合,比如文章的标题与副标题:

<hgroup>
 <h1>这是一篇介绍HTML 5结构标签的文章</h1>
 <h2>HTML 5的革新</h2>
</hgroup>
<nav>标签
手册释义:定义导航链接的部分。
使用指引:用于定义页面的导航部分:

<nav>
 <ul>
  <li>HTML 5</li>
  <li>CSS</li>
  <li>JavaScript</li>
 </ul>
</nav>
<aside>标签
定义 article 以外的内容。aside 的内容应该与 article 的内容相关。
使用指引:用于成节的内容,会在文档流中开始一个新的节,一般用于与文章内容相关的边栏:

<aside>
 <h1>作者简介</h1>
 <p>Mr.Think,专注Web前端技术的凡夫俗子。</p>
</aside>
<section>标签
手册释义:定义文档中的节(section)。比如章节、页眉、页脚或文档中的其他部分。
使用指引:用于成节的内容,会在文档流中开始一个新的节:

<section>
 <h1>section是什么?</h1>
 <h2>一个新的章节</h2>
 <article>
  <h2>关于section</h1>
  <p>section的介绍</p>
  ...
 </article>
</section>
<footer>标签
手册释义:定义 section 或 document 的页脚。典型地,它会包含创作者的姓名、文档的创作日期以及/或者联系信息。
使用指引:一般用来包裹整个页面通用底部,也可用于其他区域底部,比如article底部:

<footer>
 
</footer>
<article>标签
手册释义:定义外部的内容。比如来自一个外部的新闻提供者的一篇新的文章,或者来自 blog 的文本,或者是来自的文
本。亦或是来自其他外部源内容。
使用指引:顾名思义,一般用于文章区块:

<article>
 <header>
  <hgroup>
   <h1>这是一篇介绍HTML 5结构标签的文章</h1>