
Python笔记与积累
笔记和积累
Mercy92
这个作者很懒,什么都没留下…
展开
-
【Python小笔记】零碎同步
【代码】【Python小笔记】零碎同步。原创 2023-08-03 09:49:50 · 280 阅读 · 0 评论 -
【Python小笔记】使用循环读取并合并多个sheet
假设一个excel文件多个sheet具有相同的结构import pandas as pdtofile='E:\tofilename.xlsx'fromfile=r'E:\fromfilename.xlsx'#获取sheet名列表sheetlist=pd.ExcelFile(fromfile).sheet_names#使用循环读取并拼接for sn in sheetlist: dfi=pd.read_excel(fromfile,sheet_name=sn)#依次读取sheet原创 2021-09-09 18:01:06 · 1093 阅读 · 0 评论 -
【Python小笔记】1解决pandas to_excel覆盖原sheet,2同时写入多个sheet
from openpyxl import load_workbookimport pandas as pdtopath='E:\Mercy\data\public\门店名称匹配test.xlsx'excel_writer = pd.ExcelWriter(topath, engine='openpyxl')#生成一个ExcelWriter对象book = load_workbook(excel_writer.path)#记录下这个Excel文件的原有sheetexcel_writer.book原创 2021-09-06 14:51:18 · 4369 阅读 · 4 评论 -
【Python小笔记】找到文件夹下最新文件
import os# 输入目录路径,输出最新文件完整路径def find_new_file(dir): '''查找目录下最新的文件''' file_lists = os.listdir(dir) file_lists.sort(key=lambda fn: os.path.getmtime(dir + "\\" + fn) if not os.path.isdir(dir + "\\" + fn) else 0) print('原创 2021-09-06 14:50:10 · 1971 阅读 · 0 评论 -
【Python小笔记】读取模糊文件名
import sysimport reimport pandas as pdimport ospat=re.compile('全渠道.*?')for file_name in os.listdir('E:\Mercy\data\public'): if re.match(pat,file_name): depart_path='E:\Mercy\data\public\\'+file_namedf_depart=pd.read_excel(depart_path,she原创 2021-09-06 14:49:06 · 1520 阅读 · 0 评论 -
【Python小笔记】xlsxwriter写入excel文本和图片
import xlsxwriter as xlsx #读取/创建文件book=xlsx.Workbook('E:\\Mercy\\data\\mytest\\xlsxwriter_test.xlsx')#添加工作表sheet=book.add_worksheet('demo')#输入文本amount=56sheet.write('A1','实际支付金额:'+str(amount))#输入图表import matplotlib.pyplot as pltimport numpy a原创 2021-04-10 10:18:18 · 451 阅读 · 1 评论 -
【Python小项目】Python进行RFM用户价值分析
一、准备源数据从订单表中抽样查询确定时间段的订单数据SELECT USERID,PROVINCE,ORDERDATE,ORDERID,AMOUNTFROM RETAIL.ORDERS_ALL SAMPLE (50)WHERE TO_CHAR(ORDERDATE,'YYYYMMDD')>=20200101导出到csv文件《sales.csv》二、读取源文件默认格式下,USERID、ODERDATE、ORDERID默认都是数值型,需要进行类型转换dtypes={'USERID':obj原创 2020-12-31 10:59:46 · 849 阅读 · 0 评论 -
【Python小项目】批量爬取人民币外汇数据并整理储存可视化
一、需求由于该网站(http://www.safe.gov.cn/safe/rmbhlzjj/index.html)日期选择最长间隔只能90天,因此如果手动点击下载表格,需要多次选择日期,并且将多个表格手动合并后存入数据库。为了解决这些问题,本篇使用爬虫爬取,pandas整理数据后存入数据库。二、实现STEP1 爬取第一批数据打开网站,输入在允许范围内的日期,点击查询,就发送了一个POST请求F12打开开发者工具刷新后,可以看到这个请求的url和请求体信息,仿照该请求体,设置发送请求的data参原创 2020-08-29 17:37:20 · 2253 阅读 · 1 评论 -
【Python小笔记】Python处理XML数据
文件:《Data\weather.xml》<china dn="nay"><city quName="黑龙江" pyName="heilongjiang" cityname="哈尔滨" state1="0" state2="1" stateDetailed="晴转多云" tem1="7" tem2="22" windState="西南风小于3级转4-5级"/><city quName="吉林" pyName="jilin" cityname="长春" state1="0"原创 2020-08-19 14:14:55 · 306 阅读 · 0 评论 -
【Python小笔记】Python连接Oracle数据库——cx_Oracle
文章目录一、安装第三方库cx_Oracle二、连接oracle数据库三、执行语句四、输出结果1)、输出查询表头2)、输出查询内容3)、创建成DataFrame一、安装第三方库cx_Oracle二、连接oracle数据库提供账户、密码、监听import cx_Oracle#连接数据库(本地)name='scott'pwd='123456'tes='localhost/orcl.16...原创 2020-04-28 14:59:56 · 4643 阅读 · 0 评论 -
【Python小项目】文档字词整理
问题:一个文档中,有多余的空格、空行、Tab制表符、换行符,现在需要去除这些多余符号,并且根据该文档索引分段,一个索引引导一个段落。问题分解:1、去除多余空格、空行、Tab制表符、换行符:step1需要先读取文件流open(file)step2将流转成字符串f.read()step3将字符串打散,分裂成列表split(),每个单词成为一个元素,剔除多余元素step4新列表拼接成新的字...原创 2019-03-19 15:41:47 · 314 阅读 · 0 评论 -
【Python小笔记】读写模式w+、r+、a+实例对比
1、w+模式:在w模式的基础上增加可读功能。可读可写模式打开文本,文件不存在时新建,文件有内容时以写入的内容覆盖。写入内容with open('write_plus.txt','w+') as f: f.write('hi,I am write plus')相应目录下生成’write_plus.txt’文档内容:hi,I am write plus内容覆盖with...原创 2019-03-13 11:36:54 · 3401 阅读 · 3 评论 -
【Python小笔记】python处理yaml文件
一、yaml简介语法:Structure通过空格来展示。Sequence里的项用"-“来代表,Map里的键值对用”:"分隔.#family.ymlname: Tom Smithage: 37spouse: name: Jane Smith? age: 25children: - name: Jimmy Smith age: 15 - name1: Jenny ...原创 2019-01-04 11:18:18 · 657 阅读 · 0 评论 -
【Python小笔记】命令行参数:sys.argv和getopt模块
一、sys.argvsys.argv 是命令行参数列表。#test_sys_argv.pyimport sysprint(sys.argv)#命令行参数列表print(sys.argv[0])print(len(sys.argv))#命令行参数列表个数二、getopt模块getopt模块是专门处理命令行参数的模块,用于获取命令行选项和参数,也就是sys.argv。命令行选项使得...原创 2019-01-03 15:21:24 · 467 阅读 · 0 评论