
python
文章平均质量分 51
咚咚咚咚咚咚咚咚锵
这个作者很懒,什么都没留下…
展开
-
python 时间序列
数据挖掘模型转载 2021-05-17 15:23:25 · 154 阅读 · 0 评论 -
python 二分查找
如果输入3要求返回1,那就用bisect_left如果输入3要求返回2,那就用bisect_rightfrom bisect import bisect_lefta = [0, 3, 7, 29, 30]print(bisect_left(a, 4))原创 2021-05-17 14:32:32 · 96 阅读 · 0 评论 -
python 连接、操作mysql、sqlserver、oracle数据库
python连接mysql:pymysql1、安装导入pymysqlimport pymysql2、连接db = pymysql.connect(host=ip, port=port, database=database_name, user=user_name, password=password)3、查询版本(测试连接)sql = "SELECT VERSION()"4、使用cursor()方法获取操作游标cursor = db.cursor()5、执行sql语句cursor原创 2020-08-03 10:46:24 · 599 阅读 · 0 评论 -
python加密
geturl + ? +参数eg:url?a=1&b=2取参排序将参数拼成字符串:a=1&b=2,再用MD5将字符串和校验唯一码key拼接,再加密。MD5(a=1&b=2 + key)=sign将参数和sign加到url中。url?参数&signposturl + ?+ sign=…1.将传入的json的body中的内容组成字典,然后将字典的键...原创 2020-06-10 15:56:48 · 209 阅读 · 0 评论 -
将多行多列转成多行一列,即多层索引
group_data_dict = {}for name, group in factor_data.groupby(color[color.columns[0]]): iterable = [group.iloc[:, 0].tolist(), group.columns[1:].tolist()] group_data = pd.DataFrame(group.iloc[:,...原创 2020-06-10 15:55:50 · 410 阅读 · 0 评论 -
python 文件解压
def untar_files(file_dir): files = get_file_name(file_dir) file_names_list = [] new_file_path = '' for My_file_name in files: if My_file_name.find(".tar.gz") != -1: ...原创 2020-04-28 09:25:42 · 241 阅读 · 0 评论 -
用于清洗从hbase中捞取出来的数据code
""" 用于清洗从hbase中捞取出来的数据 author:tian date: 2020-02-27"""import pandas as pddef get_data(path): data = pd.read_excel(path, names=['glassid_operacode', 'attribute', 'name', 'value'])...原创 2020-02-27 10:41:18 · 317 阅读 · 0 评论 -
去除使用pivot_table后产生的多重索引
参考来源将列中的重复索引删除pro_data.columns = pro_data.columns.droplevel(0)使用reset_index()将行的多重索引去除但是此时name和glass_id仍为索引pro_data = pd.concat([pro_data,pd.DataFrame(data=pro_data.index.tolist(),columns=[p...原创 2020-02-23 15:52:50 · 6337 阅读 · 0 评论 -
python使用pivot_table长表转宽表报错:No numeric types to aggregate 解决办法
python使用pivot_table长表转宽表报错:No numeric types to aggregate 解决办法首先查看数据的类型再将数据类型强制转换赋值给原数据原创 2020-02-21 20:10:55 · 16164 阅读 · 0 评论 -
DataFrame常用操作
1、DataFrame切片(1)df [ [ 'a '] ]得到一列列名为a的DataFrame(2)df [ 'a ']得到一列Name为a的Series(3)df.loc[ [1,2], ['a ', 'b '] ]得到第1、2行,a、b列的DataFrame(4)df.iloc[4:5, 1:3]得到第4行,1、2列的DataFrame(5)df.iloc[0,:]与df....原创 2020-01-10 17:05:46 · 3927 阅读 · 0 评论 -
list、tuple、dict、set
list增append末尾插入一个元素insert指定位置,插入元素extend末尾插入多个元素+通过 + 合并多个 listIn[1]: list1 = ['a','b',1,5]In[2]: list1.append('z') In[3]: print(lsit1)Out[3]: ['a','b',1,5,'z']In[1]: li...原创 2019-12-27 17:20:08 · 206 阅读 · 0 评论 -
python获取文件名中的目标字段
提取’TB…'在内的文件名的目标字符串os.path.basename(path)# header=1,从第二行开始读# delim_whitespace=True 指定空格为分隔符data = pd.read_csv(path, header=1, delim_whitespace=True) id_name = os.path.basename(path)[26:]通过spli...原创 2019-08-27 11:49:26 · 3780 阅读 · 0 评论