TiXmlComment、TiXmlDeclaration、TiXmlDocument、TiXmlElement、TiXmlTest和TiXmlUnknown这几个类都是继承自TiXmlNode类的,继承关系,当tinyxml在解析XML文件时,是如何判断此时解析的输入流是什么类型的呢?这就是Identify()函数的功能了,Identify()函数验证输入流中字符是什么,然后new相应的类型并返回。
// 验证输入流中字符是什么,然后new相应的类型并返回
TiXmlNode* TiXmlNode::Identify( const char* p, TiXmlEncoding encoding )
{
TiXmlNode* returnNode = 0;
p = SkipWhiteSpace( p, encoding );
if( !p || !*p || *p != '<' )
{
return 0;
}
p = SkipWhiteSpace( p, encoding );
if ( !p || !*p )
{
return 0;
}
// What is this thing?
// - Elements start with a letter or underscore, but xml is reserved.
// - Comments: <!--
// - Decleration: <?xml
// - Everthing else is unknown to tinyxml.
//
const char* xmlHeader = { "<?xml" };
const char* commentHeader = { "<!--" };
const char* dtdHeader = { "<!" };
const char* cdataHeader = { "<![CDATA[" };
if ( StringEqual( p, xmlHeader, true, encoding ) ) // xml文件的开头
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing Declaration\n" );
#endif
returnNode = new TiXmlDeclaration();
}
else if ( StringEqual( p, commentHeader, false, encoding ) ) // xml声明的开头
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing Comment\n" );
#endif
returnNode = new TiXmlComment();
}
else if ( StringEqual( p, cdataHeader, false, encoding ) )
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing CDATA\n" );
#endif
TiXmlText* text = new TiXmlText( "" );
text->SetCDATA( true );
returnNode = text;
}
else if ( StringEqual( p, dtdHeader, false, encoding ) ) // xml注释的开头
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing Unknown(1)\n" );
#endif
returnNode = new TiXmlUnknown();
}
else if ( IsAlpha( *(p+1), encoding )
|| *(p+1) == '_' ) // "<"后是字符或者是"_"的
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing Element\n" );
#endif
returnNode = new TiXmlElement( "" );
}
else
{
#ifdef DEBUG_PARSER
TIXML_LOG( "XML parsing Unknown(2)\n" );
#endif
returnNode = new TiXmlUnknown();
}
if ( returnNode )
{
// Set the parent, so it can report errors
returnNode->parent = this;
}
return returnNode;
}
TiXmlComment、TiXmlDeclaration、TiXmlDocument、TiXmlElement、TiXmlTest和TiXmlUnknown这几个类的源码写的很清晰,我就不再复制代码了。 注意:
1、
<addr>hang zhou</addr>
这是一个TiXmlElement,其Value为"addr",它只有一个child,其child为TiXmlText,TiXmlText的Value是“hang zhou”,而不是TiXmlElement的Value为"hang zhou"。
2、
TiXmlElement成员有一个是TiXmlAttributeSet类型的,表示element的属性
<recipename cuisine="american" servings="1">Ice Cream Sundae</recipename>
其中cuisine和servings就是element的属性。当element有多个属性的时候,这些属性之间组成了一个双向链表的结构。
3、
TiXmlDocument节点总是XML文件的最顶层的节点,TiXmlDocument包括了所有的tinyxml中的类,可以解析XML文件、打印出来、保存为另外一个文件。注意:TiXmlDocument的Value就是XML文件名。
参考: