- 博客(1)
- 收藏
- 关注
原创 HTML解析-第二版(C/C++)
背景: 基于某些不着边际想法,只为取得HTML页面上的所有“URL”和“文本”,其它的内容都不在关心之列。 问题: 对于“文本”搜索,如果搜索了除英文以外的语言还好说些,如果要搜索的内容是英文本, 那么就难以区分是“标记”还是“本文”了。对于“URL”的搜索,因为“标记”就是英文, 这样就绕回到“对于‘文本’搜索”。另外字母的大小写,被转义的字符,引号,尖括号,都得处理。 例如: csdn 想要
2011-12-14 21:05:36
10816
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人