- 博客(1)
- 收藏
- 关注
原创 python+selenium实现链家网二手房网站数据爬虫
二手房数据爬虫和可视化的意义在于能够帮助我们更好地了解和分析房地产市场,为我们提供更准确的信息和决策依据,同时也为房地产从业者提供市场分析和预测的依据。此外,二手房数据爬虫和可视化也是数据分析和可视化技术的应用实践,对于数据分析和可视化领域的学习和研究也具有一定的参考价值。2、数据采集与数据清洗:使用selenium库自动化浏览链家网,并采集所需的二手房数据(如每个二手房的标题、售价、单价、小区、商圈、户型等信息),在爬取的过程中对数据进行清洗,去除无效和重复的数据,确保数据的准确性和完整性;
2024-03-02 18:44:29
629
opencv+python+pyqt5实现答题卡的识别(可判断正确率)
## 功能说明
程序支持对一类固定模板的答题卡进行检测选项、校对答案的功能。用户只需拍摄一张角度偏差较小、亮度适中的答题卡照片,再提供标准答案文件,即可进行答题卡的扫描与答案评测。
**由于采用了比较简单的检测方法,所以对图片的要求较高,最好在答题卡下面放置一张空白A4纸进行拍照,拍的照片不要有过大角度倾斜,拍到的卡要完整,照片内不要有其他干扰物品。**
## 使用说明
到目录下运行excute.py,选择答题卡图片、标准答案文件后,可比对答案并给出对错和正确率评判。
环境变量中需有python3环境,需要cv2、pyqt5的依赖包。
python excute.py
## 文件说明
sheet.py -- 读取/扫描答题卡的功能函数
mainwindow.py -- 界面类
excute.py -- 启动程序
test/ -- 正常的测试的图片和答案文件
在运行过程中,当前目录下出现的jpg文件是过程中产生的临时文件
## 相关技术
### 寻找图形轮廓
寻找一个图形轮廓前,需要先对输入的图片的一个复制进行以下几个操作:
1. 转换成灰度图
2. 进行高斯模糊以消除噪声、模糊细节
2023-04-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人