<?php
$doc = new DOMDocument();
$doc ->loadHTML($str);//$str为一段HTML代码
$element = $doc->getElementById();//返回一个DOMElement对象,类似js中的dom对象
$elements = $doc->getElementByTagName();//返回一个DOMElementList对象,它有一个属性length,表示它$elements含有的直接子元素个数;它还有一个方法item(i),0<=i<=length-1
$len = $elements->length;
$ele = $elements->item($len-1);//获得第$len-1个子元素,$ele为一个DOMElement对象
$attr = $ele->getAttribute("id");//获得$ele的id值
?>
把这几个常用的搞明白,基本上就可以解析HTML了。这对于爬虫是非常方便的。