HTML文档的节点小知识

本文介绍了如何使用DOM操作HTML和XML文档,包括遍历、搜索、修改和添加新内容等基本操作。通过多个实例展示了如何利用DOM API进行文档树的遍历及节点的增删改查。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        DOM下,HTML文档各个节点被视为各种类型的Node对象。每个Node对象都有各自的属性和方法,利用这些属性和方法可以遍历整个文档树。由于HTML文档的复杂性,DOM定义了nodeType来表示节点的类型。这里列出Node常用的几种节点类型:
接口nodeType常量nodeType值备注
ElementNode.ELEMENT_NODE1元素节点
TextNode.TEXT_NODE3文本节点
DocumentNode.DOCUMENT_NODE9document
CommentNode.COMMENT_NODE8注释的文本
DocumentFragmentNode.DOCUMENT_FRAGMENT_NODE11document片断
AttrNode.ATTRIBUTE_NODE2节点属性

  DOM树的根节点是个Document对象,该对象的documentElement属性引用表示文档根元素的Element对象(对于HTML文档,这个就是<html>标记)。Javascript操作HTML文档的时候,document即指向整个文档,<body>、<table>等节点类型即为Element。Comment类型的节点则是指文档的注释。具体节点类型的含义,请参考《Javascript权威指南》,在此不赘述。

  Document定义的方法大多数是生产型方法,主要用于创建可以插入文档中的各种类型的节点。

常用的Document方法有:

方法描述
createAttribute()用指定的名字创建新的Attr节点。
createComment()用指定的字符串创建新的Comment节点。
createElement()用指定的标记名创建新的Element节点。
createTextNode()用指定的文本创建新的TextNode节点。
getElementById()返回文档中具有指定id属性的Element节点。
getElementsByTagName()返回文档中具有指定标记名的所有Element节点。

  对于Element节点,可以通过调用getAttribute()、setAttribute()、removeAttribute()方法来查询、设置或者删除一个Element节点的性质,比如<table>标记的border属性。下面列出Element常用的属性:

属性描述
tagName元素的标记名称,比如<p>元素为P。HTML文档返回的tabName均为大写。

  Element常用的方法:

方法描述
getAttribute()以字符串形式返回指定属性的值。
getAttributeNode()以Attr节点的形式返回指定属性的值。
getElementsByTabName()返回一个Node数组,包含具有指定标记名的所有Element节点的子孙节点,其顺序为在文档中出现的顺序。
hasAttribute()如果该元素具有指定名字的属性,则返回true。
removeAttribute()从元素中删除指定的属性。
removeAttributeNode()从元素的属性列表中删除指定的Attr节点。
setAttribute()把指定的属性设置为指定的字符串值,如果该属性不存在则添加一个新属性。
setAttributeNode()把指定的Attr节点添加到该元素的属性列表中。

  Attr对象代表文档元素的属性,有name、value等属性,可以通过Node接口的attributes属性或者调用Element接口的getAttributeNode()方法来获取。不过,在大多数情况下,使用Element元素属性的最简单方法是getAttribute()和setAttribute()两个方法,而不是Attr对象。

7.4.3、使用DOM操作HTML文档
  Node对象定义了一系列属性和方法,来方便遍历整个文档。用parentNode属性和childNodes[]数组可以在文档树中上下移动;通过遍历childNodes[]数组或者使用firstChild和nextSibling属性进行循环操作,也可以使用lastChild和previousSibling进行逆向循环操作,也可以枚举指定节点的子节点。而调用appendChild()、insertBefore()、removeChild()、replaceChild()方法可以改变一个节点的子节点从而改变文档树。

  需要指出的是,childNodes[]的值实际上是一个NodeList对象。因此,可以通过遍历childNodes[]数组的每个元素,来枚举一个给定节点的所有子节点;通过递归,可以枚举树中的所有节点。下表列出了Node对象的一些常用属性和方法:

  Node对象常用属性:

属性描述
attributes如果该节点是一个Element,则以NamedNodeMap形式返回该元素的属性。
childNodes以Node[]的形式存放当前节点的子节点。如果没有子节点,则返回空数组。
firstChild以Node的形式返回当前节点的第一个子节点。如果没有子节点,则为null。
lastChild以Node的形式返回当前节点的最后一个子节点。如果没有子节点,则为null。
nextSibling以Node的形式返回当前节点的兄弟下一个节点。如果没有这样的节点,则返回null。
nodeName节点的名字,Element节点则代表Element的标记名称。
nodeType代表节点的类型。
parentNode以Node的形式返回当前节点的父节点。如果没有父节点,则为null。
previousSibling以Node的形式返回紧挨当前节点、位于它之前的兄弟节点。如果没有这样的节点,则返回null。

  Node对象常用方法:

方法描述
appendChild()通过把一个节点增加到当前节点的childNodes[]组,给文档树增加节点。
cloneNode()复制当前节点,或者复制当前节点以及它的所有子孙节点。
hasChildNodes()如果当前节点拥有子节点,则将返回true。
insertBefore()给文档树插入一个节点,位置在当前节点的指定子节点之前。如果该节点已经存在,则删除之再插入到它的位置。
removeChild()从文档树中删除并返回指定的子节点。
replaceChild()从文档树中删除并返回指定的子节点,用另一个节点替换它。

  接下来,让我们使用上述的DOM应用编程接口,来试着操作HTML文档。

  A、遍历文档的节点

  DOM把一个HTML文档视为树,因此,遍历整个树是应该是家常便饭。跟之前说过的一样,这里我们提供两个遍历树的例子。通过它,我们能够学会如何使用childNodes[]和firstChile、lastChild、nextSibling、previousSibling遍历整棵树。

  例子1:

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>

</head>

<body>
    <a href="javascript:void(0)" onclick="alert('标记总数:' + countTotalElement(document) +
     '; '+'全部标记如下:' + elementName + '; ' +'elementName = '+elementName+';')">开始统计</a>
</body>
<script language="javascript">
    var elementName = ""; //全局变量,保存Element标记名,使用完毕要清空
    function countTotalElement(node) { //参数node是一个Node对象
        var total = 0;
        if (node.nodeType == 1) { //检查node是否为Element对象
            total++;  //如果是,计数器加1
            elementName = elementName + node.tagName + "/r/n"; //保存标记名
        }
        var childrens = node.childNodes;		//获取node的全部子节点
        for (var i = 0; i < childrens.length; i++) {
            total += countTotalElement(childrens[i]); //在每个子节点上进行递归操作
        }
        return total;
    }
</script>

</html>

  这个例子使用了childNodes[]和递归方式来遍历整个文档,统计文档中出现的Element元素总数,并把Element标记名全部打印出来。需要特别注意的是,在使用DOM时,必须等文档被装载完毕再执行遍历等行为操作文档。

  例子2 :

  接下来使用firstChile、lastChild、nextSibling、previousSibling遍历整个文档树。修改一下countTotalElement函数:

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>

</head>

<body>
    <a href="javascript:void(0)" onclick="alert('标记总数:' + countTotalElement(document) +
     '; '+'全部标记如下:' + elementName + '; ' +'elementName = '+elementName+';')">开始统计</a>
</body>
<script language="javascript">
    var elementName = ""; //全局变量,保存Element标记名,使用完毕要清空
    function countTotalElement(node) { //参数node是一个Node对象
        var total = 0;
        if (node.nodeType == 1) { //检查node是否为Element对象
            total++;			//如果是,计数器加1
            elementName = elementName + node.tagName + "/r/n"; //保存标记名
        }
        var childrens = node.childNodes;		//获取node的全部子节点
        for (var m = node.firstChild; m != null; m = m.nextSibling) {
            total += countTotalElement(m); //在每个子节点上进行递归操作
        }
        return total;
    }
</script>

</html>

  B、搜索文档中特定的元素
  在使用DOM的过程中,有时候需要定位到文档中的某个特定节点,或者具有特定类型的节点列表。这种情况下,可以调用Document对象的getElementsByTagName()和getElementById()方法来实现。

  document.getElementsByTagName()返回文档中具有指定标记名的全部Element节点数组(也是NodeList类型)。Element出现在数组中的顺序就是他们在文档中出现的顺序。传递给getElementsByTagName()的参数忽略大小写。比如,想定位到第一个<table>标记,可以这样写:document.getElementsByTagName(“table”)[0]。例外的,可以使用document.body定位到<body>标记,因为它是唯一的。

  getElementsByTagName()返回的数组取决于文档。一旦文档改变,返回结果也立即改变。相比,getElementById()则比较灵活,可以随时定位到目标,只是要实现给目标元素一个唯一的id属性值。这个我们在《AJAX开发简略》的“级联菜单”例子中已经使用过了。

  Element对象也支持getElementsByTagName()和getElementById()。不同的是,搜索领域只针对调用者的子节点。

  C、修改文档内容
  遍历整棵文档树、搜索特定的节点,我们最终目的之一是要修改文档内容。接下来的三个例子将使用Node的几个常用方法,来演示如何修改文档内容。

  例子3 :

  这个例子包含三个文本节点和一个按钮。点击按钮后,三个文本节点和按钮的顺序将被颠倒。程序使用了Node的appendChild()和removeChild()方法。

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>

</head>

<body>
    <p>第一行</p>
    <p>第二行</p>
    <p>第三行</p>
    <p>
        <input type="button" name="reverseGo" value="颠倒" onclick="reverseNode(document.body)">
    </p>
</body>
<script language="javascript">
    function reverseNode(node) { // 颠倒节点node的顺序
        var kids = node.childNodes; //获取子节点列表
        var kidsNum = kids.length; //统计子节点总数
        for (var i = kidsNum - 1; i >= 0; i--) { //逆向遍历子节点列表
            var c = node.removeChild(kids[i]); //删除指定子节点,保存在c中
            node.appendChild(c); //将c放在新位置上
        }
    }
</script>

</html>

  例子4:
  例子1通过直接操作body的子节点来修改文档。在HTML文档中,布局和定位常常通过表格<table>来实现。因此,例子4将演示操作表格内容,将表格的四个单元行顺序颠倒。如果没有使用<tbody>标签,则<table>把全部的<tr>当做是属于一个子节点<tbody>,所以我们采用数组缓存的方式,把行数据颠倒一下。这个例子同时也演示了如何使用DOM创建表格单元行。

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>
</head>

<body>
    <table width="200" border="1" cellpadding="4" cellspacing="0">
        <tr><td height="25">第一行</td></tr>
        <tr><td height="25">第二行</td></tr>
        <tr><td height="25">第三行</td></tr>
        <tr><td height="25">第四行</td></tr>
    </table>
    <br>
    <input type="button" name="reverse" value="开始颠倒" onclick="reverseTable()">
</body>
<script language="javascript">
    function reverseTable() {
        var node = document.getElementsByTagName("table")[0]; //第一个表格
        var child = node.getElementsByTagName("tr"); //取得表格内的所有行
        var newChild = new Array(); //定义缓存数组,保存行内容
        
        for (var i = 0; i < child.length; i++) {
            newChild[i] = child[i].firstChild.innerHTML;
        }
        node.removeChild(node.childNodes[1]); //删除全部单元行
        // return false;
        var header = node.createTHead(); //新建表格行头
        for (var i = 0; i < newChild.length; i++) {
            var headerrow = header.insertRow(i); //插入一个单元行
            var cell = headerrow.insertCell(0); //在单元行中插入一个单元格
            //在单元格中创建TextNode节点
            cell.appendChild(document.createTextNode(newChild[newChild.length - i - 1]));
        }
    }
</script>

</html>

  例子5:

  正如我们在Node节点介绍部分所指出的那样,appendChild()、replaceChild()、removeChild()、insertBefore()方法会立即改变文档的结构。下面的例子包含两个表格,我们试着把表格二的内容替换表格一的内容。

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>

</head>

<body>
    <table width="200" border="1" cellspacing="0" cellpadding="0">
        <tbody>
            <tr>
                <td>表格一</td>
            </tr>
        </tbody>
    </table>
    <br>
    <table width="200" border="1" cellspacing="0" cellpadding="0">
        <tbody>
            <tr>
                <td>表格二</td>
            </tr>
        </tbody>
    </table>
    <br>
    <input type="button" name="replaceNode" value="替换" onClick="replaceContent()">
</body>

<script language="javascript">
    function replaceContent() {
        var table1 = document.getElementsByTagName("table")[0];
        var table2 = document.getElementsByTagName("table")[1];
        var kid1 = table1.firstChild.firstChild.firstChild; //定位到<td>节点
        var kid2 = table2.firstChild.firstChild.firstChild; //定位到<td>节点
        var repKid = kid2.firstChild; //定位到表格二<td>内含的TextNode节点
        try {
            //用表格二的单元格内容替换表格一的单元格内容,表格二变成没有单元格内容
            kid1.replaceChild(repKid, kid1.firstChild);
            //下面注释如果开放,将出现object error,因为表格二已经被改变
            //kid2.replaceChild(kid1.firstChild,kid2.firstChild);
        } catch (e) {
            alert(e);
        }
    }
</script>

</html>

  注意,当执行kid1.replaceChild(repKid,kid1.firstChild);的时候,table2的子节点已经被转移到table1了,table2已经没有子节点,不能再调用table2的子节点。看看代码的注释,试着运行一下,应该就知道文档是怎么改变的了。

  D、往文档添加新内容
  在学会遍历、搜索、修改文档之后,我们现在试着网文档添加新的内容。其实没有什么新意,只是利用我们上述提到的Node的属性和方法而已,还是操作<table>标记的内容。有新意的是,我们要实现一个留言簿。是的,留言簿,你可以往里面留言,只是不能刷新噢。

  例子6 :

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>
</head>

<body>
    <form name="form1" method="post" action="">
        <input name="str" type="text" id="str" value="">
        <input name="insert" type="button" id="insert" value="留言" onClick="insertStr()">
    </form>
    <table width="400" border="1" cellspacing="0" cellpadding="0" id="table1">
        <tbody>
            <tr>
                <td height="25">网友留言列表:</td>
            </tr>
        </tbody>
    </table>
</body>
<script language="javascript">
    function insertStr() {
        var f = document.form1;
        var value = f.str.value;
        if (value != "") {
            // 从最终的TextNode节点开始,慢慢形成<tbody>结构
            var text = document.createTextNode(value); //新建一个TextNode节点
            var td = document.createElement("td"); //新建一个td类型的Element节点
            var tr = document.createElement("tr"); //新建一个tr类型的Element节点
            var tbody = document.createElement("tbody"); //新建一个tbody类型的Element节点
            td.appendChild(text); //将节点text加入td中
            tr.appendChild(td); //将节点td加入tr中
            tbody.appendChild(tr); //将节点tr加入tbody中
            var parNode = document.getElementById("table1"); //定位到table上
            parNode.insertBefore(tbody, parNode.firstChild); //将节点tbody插入到节点顶部
            //parNode.appendChild(tbody); //将节点tbody加入节点尾部
        }
    }
</script>

</html>

  我们之前说过,<table>的子节点是<tbody>,<tbody>的子节点才是<tr>,<tr>是<td>的父节点,最后<td>内部的TextNode节点。所以,往<table>增加单元格行要逐级形成,就像往树里面添加一个枝桠一样,要有叶子有径。看看,这个留言簿是不是很简单啊。这个例子同时也演示了往<table>表格标记里面增加内容的另一种方法。


  E、使用DOM操作XML文档
  在数据表示方面,XML文档更加结构化。DOM在支持HTML的基础上提供了一系列的API,支持针对XML的访问和操作。利用这些API,我们可以从XML中提取信息,动态的创建这些信息的HTML呈现文档。处理XML文档,通常遵循“加载XML文档à提取信息à加工信息à创建HTML文档”的过程。下面的例子演示了如何加载并处理XML文档。

  这个例子包含两个JS函数。loadXML()负责加载XML文档,其中既包含加载XML文档的2级DOM代码,又有实现同样操作的Microsoft专有API代码。需要提醒注意的是,文档加载过程不是瞬间完成的,所以对loadXML()的调用将在加载文档完成之前返回。因此,需要传递给loadXML()一个引用,以便文档加载完成后调用。

  例子中的另外一个函数makeTable(),则在XML文档加载完毕之后,使用最后前介绍过的DOM应用编程接口读取XML文档信息,并利用这些信息形成一个新的table表格。

  例子7:

<!DOCTYPE html>
<html lang="zh-cn">

<head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <title>Html文档节点</title>

    <link href="css/style.css" rel="stylesheet" type="text/css">
</head>

<body onLoad="loadXML(makeTable)">
</body>
<script language="javascript">
    function loadXML(handler) {
        var url = "employees.xml";
        if (document.implementation && document.implementation.createDocument) {
            var xmldoc = document.implementation.createDocument("", "", null);
            xmldoc.onload = handler(xmldoc, url);
            xmldoc.load(url);
        }
        else if (window.ActiveXObject) {
            var xmldoc = new ActiveXObject("Microsoft.XMLDOM");
            xmldoc.onreadystatechange = function () {
                if (xmldoc.readyState == 4) handler(xmldoc, url);
            }
            xmldoc.load(url);
        }
    }
    function makeTable(xmldoc, url) {
        var table = document.createElement("table");
        table.setAttribute("border", "1");
        table.setAttribute("width", "600");
        table.setAttribute("class", "tab-content");
        document.body.appendChild(table);
        var caption = "Employee Data from " + url;
        table.createCaption().appendChild(document.createTextNode(caption));
        var header = table.createTHead();
        var headerrow = header.insertRow(0);
        headerrow.insertCell(0).appendChild(document.createTextNode("姓名"));
        headerrow.insertCell(1).appendChild(document.createTextNode("职业"));
        headerrow.insertCell(2).appendChild(document.createTextNode("工资"));
        var employees = xmldoc.getElementsByTagName("employee");
        for (var i = 0; i < employees.length; i++) {
            var e = employees[i];
            var name = e.getAttribute("name");
            var job = e.getElementsByTagName("job")[0].firstChild.data;
            var salary = e.getElementsByTagName("salary")[0].firstChild.data;
            var row = table.insertRow(i + 1);
            row.insertCell(0).appendChild(document.createTextNode(name));
            row.insertCell(1).appendChild(document.createTextNode(job));
            row.insertCell(2).appendChild(document.createTextNode(salary));
        }
    }
</script>

</html>

供读取调用的XML文档 – employees.xml:

<?xml version="1.0" encoding="gb2312"?>
<employees>
    <employee name="J.Doe">
        <job>Programmer</job>
        <salary>32768</salary>
    </employee>
    <employee name="A.Baker">
        <job>Sales</job>
        <salary>70000</salary>
    </employee>
    <employee name="Big Cheese">
        <job>CEO</job>
        <salary>100000</salary>
    </employee>
</employees>


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值