- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 Python 爬虫:xpath多线程抓取豆瓣电影top250影片名
多线程抓取豆瓣top250,其实数据量不多,单线程完全够用,初学多线程抓取,就当练练手好了,下次换个数据量大的网页来抓取import requestsfrom lxml import etreeimport timefrom concurrent.futures import ThreadPoolExecutordef download_one_page(url, headers): # 拿到页面源代码 resp = requests.get(url=url, headers
2022-01-18 17:55:16
2090
1
原创 Python 爬虫:抓取豆瓣top250电影数据
接到项目需求为爬取豆瓣top250电影数据,主要包含以下四个字段信息:‘电影名称’,‘上映年份’,‘豆瓣评分’,‘点评人数’本文通过re正则对豆瓣网页数据进行解析提取import requestsimport reimport pandas as pddf = pd.DataFrame(columns=['电影名称','上映年份','豆瓣评分','点评人数']) #创建表头#创建空列表用于存放数据movie_name =[]first_year =[]douban_score =[
2021-11-24 16:43:39
8162
2
原创 Pandas报错处理: Columns (6) have mixed types
Columns (6) have mixed types.Specify dtype option on import or set low_memory=False.DtypeWarning: Columns (6) have mixed types. Specify dtype option on import or set low_memory=False.意思就是:第6列的数据类型不一样。调试进去看了看,发现pandas在读取的时候确实把同一列数据中同一个数值识别为不同的类型,比如:200
2021-11-09 11:03:17
4540
原创 利用python实现年会抽奖程序
利用python实现年会抽奖程序:假设某公司假设有1000名员工,开年会抽奖,奖项如下: 一等奖2名:8888元红包 二等奖5名:扫地机器人一台 三等奖10名:小型空气净化剂一盒 抽奖规则: 1.共抽三次,第一次抽三等奖,第二次抽二等奖,第三次压轴抽一等奖。 2.每个员工限中奖一次,不得重复初步代码实现如下,如果抽奖次数和和人数不定,只需修改列表中的元素即可import randomimport fakerfake = faker.Faker(locale='zh_CN')
2021-09-06 01:05:35
3183
原创 python练习:打印九九乘法
使用for循环遍历中乘法表中的行和列,代码如下for i in range(1,10): #外循环 for j in range(1,i+1): #内循环 print("{i}×{j}={k}".format(i=i,j=j,k=i*j),end=" ") print() #内循环循环结束记得换行执行后结果如下:...
2021-08-30 15:17:57
93
原创 oracle修改主键方法
修改主键方法:step1:删除已建好的主键alter table [表名] drop primary key --有主键无主键约束名的情形alter table [表名] drop constraint [主键约束名] --有主键约束名的情形step2:重新新建主键alter table add primary key ([字段名1],[字段名2],...) --重建主键alter table add constraint [主键约束名] primary key ([字段名1],[字段名2
2020-11-27 18:22:03
5650
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人