轻量、使用简单,不需要编译lib,完善、功能强大,支持复杂标签
搬运:https://github.com/rofldev/pugihtml
用法:
pugihtml::html_document doc;
bool b = doc.load(docString);
if (b) {
auto p = doc.child("P");
for (auto node = p.child("A"); node; node = node.next_sibling())
string s = node.first_child().value();
}
测试string: (R"(<p style="color:#FF0000;"><a>文件哦是的 </a><a href="rerecv:RDpcW3dlaXlhXVxPQ1NfV2VpWWFcZGVidWdcdXNlcnMvUUExQGp6eGxpdC5jb20vZmlsZXMvc2NyZWVuLnBuZw==:67d843cc-78f2-4bc4-859a-b39b790a0708:0c16c6e8e0986623e04013ecf92f1dfe:359335" >重新第三方</a></p>)");
PugiHTML是一款轻量级且易于使用的HTML解析库,无需编译额外的库文件即可实现强大的功能,支持复杂的HTML标签处理。用户可以通过简单的API加载HTML字符串,并进行节点遍历等操作。

被折叠的 条评论
为什么被折叠?



