
python
文章平均质量分 50
hokool
这个作者很懒,什么都没留下…
展开
-
pyqt用pyinstaller打包设置界面图标跟任务栏图标
请注意,你需要将 “icon.png” 替换为实际的图标文件名,并将 “my_company.my_product.sub_product.version” 替换为实际的应用程序 ID。在 PyQt 中,你可以使用 pyrcc 工具将 .qrc 文件编译为 Python 模块,然后将这个模块导入到你的程序中,从而设置应用程序图标和任务栏图标。这个文件包含了你在 .qrc 文件中定义的资源。这里,“-o” 选项用于指定输出文件的名称,“icons_rc.py” 是你想要指定的 Python 模块文件名。原创 2023-06-10 14:20:14 · 3633 阅读 · 0 评论 -
python多线程多进程与Java区别(整理笔记9)
JavaJava编写的程序都运行在Java虚拟机里面,每用到Java命令启动一个Java应用程序,就会启动一个JVM进行。在同一个JVM进程中,有且只有一个进程,就是他自己。在这个JVM环境中,所有程序代码的运行都是运用线程来运行的。JVM找到程序的入口点main(),然后运行main()方法,这样就产生了一个线程,这个线程称之为主线程,当main方法结束后,主线程运行完成。JVM进程也随即...原创 2019-11-15 20:38:53 · 1726 阅读 · 0 评论 -
用python爬取前程无忧招聘网
直接上代码了,相比前篇文章智联招聘网的数据,前程无忧网的数据可以爬取很多。相比之下,这份获取的数据更适合练习学习数据分析。爬取的方法跟步骤跟智联招聘网那篇一样。都是用到了第三方库requestsimport requestsimport reimport osimport timeclass Spider(object): page_count = 0 def ...原创 2019-04-19 09:31:20 · 3098 阅读 · 4 评论 -
爬取二手房信息--python爬虫
本次爬取贝壳找房网二手房信息所使用的第三方库有:lxml、requests;先贴上完整代码:# -*- coding:utf-8 -*-import requestsfrom lxml import etreeimport reimport csvclass Spider(object): def __init__(self): self.url = '...原创 2019-05-10 09:59:51 · 4694 阅读 · 2 评论 -
简单的scrapy项目案例-获取豆瓣电影信息
创建项目scrapy startproject douban创建spidercd doubanscrapy genspider douban_spider movie.douban.com编写项目文件1、修改items.pyimport scrapyclass DoubanItem(scrapy.Item): # define the fields for your ...原创 2019-06-04 11:54:07 · 672 阅读 · 0 评论 -
爬虫过程中cookie保存的方法
这里我用的是第三方库requests。有两种思路:一、访问过后直接保存cookie到代码中;二、开启一个session,将cookie保存到session中。这两种都可以将cookie保存,并在接下来的访问中不需要再验证cookie。一、import requestsfrom requests.cookies import RequestsCookieJarclass Spid...原创 2019-05-21 10:31:54 · 1898 阅读 · 0 评论 -
爬虫获取智联招聘网数据
今天学习爬虫的网址是:https://sou.zhaopin.com/?jl=489&sf=0&st=0(智联招聘网)爬虫思路还是跟以前一样:一、找到网址入口请求访问获取网页字符串;二、解析数据;三、整理数据存档。这里使用了第三方库requests我这次实验中没有选定城市获取网页字符串1、在该网站上寻找需要的资源信息在哪里、发现,我们所需要的数据都在某一职业的招聘简介里...原创 2019-04-16 19:25:04 · 1647 阅读 · 0 评论 -
Python爬虫 --爬取京东商品信息
本次学习的爬取内容是京东商品列表信息网址是:https://search.jd.com/Search?keyword=手机&enc=utf-8使用了第三方库 requests因为京东每一页的商品信息被分为前30件商品和后30件商品信息,所以将分为两部分爬取第一步:获取页面前30件信息利用开发者工具查看headers信息 # 构造headers信息 header...原创 2019-02-23 11:42:57 · 5452 阅读 · 0 评论 -
Python爬虫 --爬取2016里约奥运会参赛运动员信息
今天学习爬取的网址是2016里约奥运会参赛运动员的信息网址是:http://info.2016.163.com/2016/athlete/list/使用了第三方库 requests1. 第一步:# 构造headers信息headers = { 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (K...原创 2019-02-20 15:56:44 · 1540 阅读 · 3 评论 -
Python爬虫 --简单多线程爬取糗事百科
学习爬虫的过程中练习爬取网页的HTTP协议请求大多数是get,相比post请求来说获取数据量小受浏览器限制get请求与post请求的一般区别:get方法:1、用来请求资源2、url中传输实体数据3、传输的数据量小(受浏览器限制)post方法:1、用来传输实体数据(本质上更专业)2、在实体中传输数据3、传输的数据量大我在这里给大家介绍糗事百科的多线程爬取糗事百科网址:https...原创 2019-03-04 11:27:56 · 528 阅读 · 1 评论 -
Python CSV模块
CSVCSV(逗号分隔值)格式是电子表格和数据库最常用的导入和导出格式。该csv模块实现了以CSV格式读取和写入表格数据的类。它允许程序员说“以Excel首选格式编写此数据”或“从Excel生成的此文件中读取数据”,而不知道Excel使用的CSV格式的精确细节。程序员还可以描述其他应用程序理解的CSV格式或定义自己的专用CSV格式。常用功能# 读取csv文件import csvwith...转载 2019-05-21 10:31:24 · 4350 阅读 · 0 评论 -
Python学习 --汉诺塔递归算法
前言:使用递归函数需要注意防止栈溢出。在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出。汉诺塔:汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵...转载 2019-03-21 11:20:59 · 674 阅读 · 0 评论 -
Python爬虫 --爬取京东酒店旅行信息
在之前学习爬虫的过程中,发现这个网址拿来练习是非常的舒服。现在将这个爬取的过程写下来分享给大家。网址:https://hotel.jd.com/list.html?cityId=36&cityName=北京&star=2&checkInDate=2019-04-02&checkOutDate=2019-04-03在这里使用了第三方库 requests 2.19....原创 2019-04-01 16:27:08 · 1822 阅读 · 3 评论 -
python学习--json解析
1. 获取http的请求结果import requestsheaders = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36'}url = 'https://www.lagou.co...原创 2019-05-21 10:29:57 · 196 阅读 · 0 评论