- 博客(10)
- 收藏
- 关注
原创 selenium安装与配置、模拟登录、二维码图片验证
获得网页中被加载的内容,那么就能绕过手动构造ReqTime和sum的过程,可以直接使用XPath来获得想要的内容。这种情况下,就需要使用Selenium操作浏览器来解析JavaScript,再爬取被解析以后的代码。Selenium是一个网页自动化测试工具,可以通过代码来操作网页上的各个元素。
2025-03-17 10:11:07
775
原创 多网爬虫项目
项目简介在各大公司开发平台中,或多或少都要用到从其他网站平台中获取对应的数据来做数据分析、处理等等,那么对于其他网站平台中的数据需要做相关的数据采集操作,并用于对公司相关的项目研发。那么则需要在互联网中获取数据。而互联网是由一个个站点和网络设备组成的大网,我们通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析、渲染,将丰富多彩的网页呈现我们眼前。
2025-03-16 16:17:58
1328
原创 数据分析多项目
项目简介数据分析多项目通常涉及对数据的收集、处理、分析和解释,旨在发现数据中的规律、趋势和关联性,从而为决策提供支持。具体功能如下:1、数据处理与清洗:这是数据分析的基础步骤,包括去除重复数据、处理缺失值、数据类型转换等,以确保数据的质量和准确性。2、数据可视化与探索性分析:通过图表、图形等方式直观展示数据,帮助理解数据的分布、趋势和异常值等,为进一步的分析提供直观依据。项目客户群1、大数据分析公司:实现数据分析处理等功能;2、网站可视化平台系统、数据研发公司:实现后端数据分析处理与可视化。
2025-03-16 16:16:30
995
原创 pygame飞机游戏
项目简介飞机大战是一个经典的2D射击游戏,玩家需要控制一架英雄飞机,通过发射子弹击落敌机并躲避敌人的攻击。这个游戏不仅能够锻炼玩家的反应速度和策略规划能力,同时也是学习游戏开发的一个绝佳案例。通过这个项目,开发者可以深入理解游戏设计原理,并提升使用Python及pygame库进行游戏开发的实战技能。具体功能如下:1、玩家飞机显示:在飞机大战游戏中,玩家控制的飞机是游戏的主体。它通常以一个精致且具有辨识度的图像呈现,并能够根据玩家的操作在屏幕上移动。
2025-03-16 16:15:26
996
原创 机器学习sklearn k-近邻算法
定义:如果一个样本在特征空间中的,则该样本也属于这个类别。来源: KNN算法最早是由Cover和Hart提出的一种分类算法例:求出距离:结合为:如何求距离?两个样本的距离可以通过如下公式计算,又叫欧式距离比如说,a(a1,a2,a3),b(b1,b2,b3)a1−b12a2−b22a3−b32。
2023-01-26 12:51:10
205
原创 机器学习之特征工程
特征工程是数据分析中最耗时间和精力的一部分工作。数据和特征决定了机器学习的上限,而模型和算法则是逼近这个上限。因此,特征工程就变得尤为重要了。特征工程的主要工作就是对特征的处理,包括数据的采集,数据预处理,特征选择,甚至降维技术等跟特征有关的工作。
2023-01-01 17:58:49
5261
1
原创 机器学习转换器与估计器
无监督学习( 英语: unSupervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。 监督学习(英语: Supervised learning),可以由输入数据中学到或建立-一个模型,并依此模式推测新的结果。在sklearn中,估计器(estimator)是一个重要的角色,注:只要记住一点,离散型是区间内不可分,连续型是区间内可分。概念:分类是监督学习的一个核心问题,在监督学习中,,即判断是非,从两个类别中选择一个作为预测结果;
2023-01-01 17:45:05
240
原创 朴素贝叶斯、精确率与召回率、交叉验证
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
2023-01-01 17:41:25
1723
1
原创 大数据:豆瓣电视剧爬虫反爬代理IP、spark清洗、flask框架做可视化
豆瓣电影大数据项目全步骤1.豆瓣爬虫:我开始写豆瓣电视剧爬虫时觉得很简单,但在实操时出现了封IP的情况,导致我苦恼了好久,现在终于写出来了 爬虫第一步:先拿一个网页来测试,...
2021-04-17 14:56:53
2077
4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人