spider
文章平均质量分 52
forever_wen
想要接触不一样的东西。学到更多
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Beautiful Soup模块的使用
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.四种对象:Tag: 标签对象NavigableString : 字符内容操作对象BeautifulSoup: 文档对象Comment:下表列出了主要的解析器,以及它们的...原创 2018-10-20 10:04:28 · 533 阅读 · 0 评论 -
关于爬虫
一、“大数据时代”,数据获取的方式:企业生产的用户数据:大型互联网公司有海量用户,所以他们积累数据有天然的优势。有数据意识的中小型企业,也开始积累数据。数据管理咨询公司:通常这样的公司有很庞大的数据采集团队,一般会通过市场调研、问卷调查、固定的样本检测,和各行各业的公司进行合作、专家对话(数据积累很多年了,最后得出科研结果)来采集数据。政府/机构提供的公开数据:政府通过各地政府...原创 2019-06-25 21:20:32 · 660 阅读 · 1 评论
分享