
python学习笔记
python随笔以及爬虫学习
此去何从
这个作者很懒,什么都没留下…
展开
-
python关于excel多个sheet的导入导出
python导入从一个excel导入多个sheetimport pandas as pddf = pd.read_excel('test.xlsx', sheet_name = None) # 导入一个excel中的所有sheetdf导入的是一个字典类型数据,具体如下:提取字典中的每个键值对:chinese = df.get('语文成绩')math = df.get('数学成绩')math查看其中一个变量,可以看出是一个数据框:python导出多个数据框到同一个excel的不同s原创 2021-07-01 20:21:54 · 6173 阅读 · 3 评论 -
python 对两列互补的数据合并
对两列互补的数据合并# 导入相应的库import pandas as pdimport numpy as np# 创建数据框data = {'name':['张三','李四','王五','陈六'], 'chinese':[90,85,78,88], 'math_a':[88,np.nan,98,np.nan], 'math_b':[np.nan,90,np.nan,80], 'score_a':[120,98,95,np.nan],原创 2021-06-13 22:34:15 · 1164 阅读 · 1 评论 -
python 提取三国每回的内容
import pandas as pdif __name__ == '__main__': raw = pd.read_csv('./sanguo.txt', names=['txt'],sep='aaa',encoding='utf-8') # print(len(raw)) # 章节判断与变量预处理 def m_head(tmpstr): return tmpstr[:1] def m_mid(tmpstr): retu原创 2020-12-05 18:15:44 · 266 阅读 · 0 评论 -
python 批量爬取糗事百科里的所有图片
import requestsimport reimport osif __name__ == '__main__': # 创建一个文件夹,保存所有图片 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36 Edg/86.0.622.68'原创 2020-11-25 12:29:29 · 205 阅读 · 0 评论 -
python 爬取《三国演义》电子书
# 需求:爬取三国演义小说所有的章节标题和内容import requestsfrom bs4 import BeautifulSoupif __name__ == '__main__': # 创建一个文件夹,保存所有图片 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.19原创 2020-11-25 12:27:25 · 1373 阅读 · 1 评论