
探寻爬虫世界
文章平均质量分 85
酒城译痴无心剑
国家三级笔译。一手代码一手诗,酸甜苦辣寸心知。杏坛泊梦千秋事,万古云山日迟迟。讲授高等数学、Java高级程序设计、动态网站设计与开发(JSP、Servlet)、企业信息系统设计与开发(Spring Boot)、智能移动终端应用开发(Android)、Python Web开发(Django)、大数据离线分析(Hadoop、Hive、Spark)、计算机专业英语等课程,教学深入浅出,语言生动、经验丰富,深受学生好评。指导学生参加移动应用开发省赛和国赛,多次获奖,被授予优秀指导教师称号。热爱翻译,曾翻译西奥尼·帕帕斯数学科普读物《天天数学》与两千余首诗词,已形成独特的译诗风格。
展开
-
爬取Q房二手房房源信息
本次实战项目旨在通过编写Python爬虫程序,抓取深圳Q房网上的二手房房源信息。我们将分析网页结构,确定房源信息的XPath路径,并实现数据的提取与CSV文件存储。通过本项目,学习如何运用requests库发送HTTP请求,使用lxml.etree解析HTML,以及如何高效地处理和存储爬取的数据。原创 2024-12-17 22:52:05 · 645 阅读 · 0 评论 -
探寻爬虫世界01:HTML页面结构
本文旨在通过爬取51job网站数据解决实际用户需求,首先探讨了51job的网页结构,分析其整体布局与关键元素设计。随后深入解读HTML基础结构,详解表格、列表、超链接及容器等核心标签的使用,并结合51job实例剖析页面HTML构成。在明确了实战目标后,制定了针对性的数据抓取策略。总结而言,文章以理论与实践相结合的方式,详细阐述了从理解网页结构到制定数据抓取方案的过程,为后续的数据分析与应用奠定了坚实基础。原创 2024-01-14 23:59:26 · 1386 阅读 · 0 评论