今天装Qt开发包时遇到了一个问题,确实Xlib包,解决方案:
http://blog.youkuaiyun.com/a1252433913/article/details/8061809,Mark一下。
python太简便了,版本问题让人十分不爽,装pyquery、Ghost.py各种不顺。
一篇很好的关于Ghost.py的介绍
搞了很久Ghost.py还是出问题了,没法正常使用,甚至升级了CentOS系统亦然不行,最终选择了Qt Webkit+BeautifulSoup的结构开走。
目前仍然烦恼于一定的抓取规则只能针对个别的网站,希望能改进,使数据抓取能通用化。
有时间再写一些实践经验
本文分享了在使用Qt开发时遇到的问题及解决方案,包括Python版本问题和Ghost.py使用困难,最终选择了QtWebkit+BeautifulSoup结构进行网页数据抓取。讨论了在网页数据抓取过程中遇到的规则限制问题,并表达了希望数据抓取能够通用化的愿望。

被折叠的 条评论
为什么被折叠?



