
爬虫
文章平均质量分 73
OverlordDuke
这个作者很懒,什么都没留下…
展开
-
Spark魔力:招聘网站数据深度分析系统
在本文中,我们将介绍一款基于Spark的招聘网站数据分析系统,该系统使用爬取的前程无忧招聘数据。通过结合Flask、Pandas、PySpark、以及MySQL等技术,实现了对招聘数据的高效处理、分析和可视化展示。原创 2024-01-01 14:54:39 · 1664 阅读 · 0 评论 -
基于Python的新闻爬取和推荐系统实践
在这个全功能的新闻爬取和推荐系统项目中,我们致力于构建一个高效、智能的平台,为用户提供个性化的新闻阅读体验。采用了Python语言,结合Flask技术、B/S架构和MySQL数据库,我们成功地搭建了一个强大的Web应用。原创 2023-12-31 10:07:44 · 2558 阅读 · 0 评论 -
【基于Python的新闻文本分类系统设计与实现】
本文介绍了一种基于Python语言、Flask技术以及贝叶斯算法的新闻文本分类系统的设计与实现。通过爬取中国新闻网站的网页数据获取数据集,利用Python爬虫对新闻数据进行获取并进行预处理,包括去除重复值、异常值处理、截取纯文本和标签列等操作。接着进行简单的数据分析和可视化,以了解数据的分布规律。最终,采用朴素贝叶斯模型对新闻文本数据进行分类,先进行分词、去停用词、向量化等处理,再评估模型效果。本文介绍了基于Python的新闻文本分类系统的设计与实现过程,展示了爬取、预处理、分析、分类等关键步骤。原创 2023-12-15 14:34:16 · 464 阅读 · 0 评论