
Python
没人关注
诗情画意藏心底,抑郁忧伤留昨天,即使没人关注,依然心平气和研究数据分析。分析路上多寂寞,一条大道走到底。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python groupby
【代码】python groupby。原创 2025-03-13 17:13:51 · 119 阅读 · 0 评论 -
pyhon-基础代码
【代码】pyhon-基础代码。原创 2024-05-31 15:31:25 · 74 阅读 · 0 评论 -
python-自定义函数-多个风险指标统计
~import osos.chdir(r’Z:\赵燕工作\2023\202307\反欺诈’)try :else:except:!!!!!!!!!!!!!!!!!!')注:Y标签必须保证都有值,否则会报错。原创 2023-07-21 15:50:54 · 9 阅读 · 0 评论 -
Python数据类型转化astype(‘**‘)
【代码】Python数据类型转化astype(‘**‘)原创 2023-07-03 17:48:02 · 7 阅读 · 0 评论 -
python_概率密度图
【代码】python_概率密度图。原创 2023-06-12 14:22:20 · 570 阅读 · 0 评论 -
python-重复数据统计
python重复数据统计原创 2022-08-04 15:34:01 · 1046 阅读 · 0 评论 -
python_%
格式化符号当你看到输出语句存在%d,%s,%f等百分号的时候,就接触到python 字符串格式化输出相关知识。Python 支持字符串格式化输出,尽管这样可能遇到非常复杂的表达式,但最基本的是用法就是将一个值插入到一个有字符串格式符%s的字符串中。如,例1:name = '阿昌'print("大家好,我叫%s"%name)输出大家好,我叫阿昌...原创 2021-07-01 18:24:24 · 341 阅读 · 0 评论 -
Python_MD5加密
定义: MD5信息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致。不可逆:对于MD5,明文与密文一一对应。明文可根据算法加工成密文,但是密文无法返回明文。用途:一些敏感数据(验证三要素:姓名、身份证号、密码;用户名、密码)的传输。撞库等。pyhon代码实现import pandas as pdimport numpy as npimport ha原创 2020-11-18 17:05:06 · 438 阅读 · 0 评论 -
Python_自定义函数
# ============================================================================= # 函数功能:导出不同放款月份(季度)缺失率函数# 函数名称:Miss_rate(data,yvar)# data:需要计算的数据(申请、通过或者通过层面)# yvar:需遍历指标向量,一般用放款月份或季度 # 函数使用案列:Miss_rate(data,dat原创 2021-01-07 14:25:01 · 208 阅读 · 0 评论 -
Python_with(把数据保存在本地同一excel不同sheet页中)
with实现闭环管理,否则可能会遗忘后半截案例:#保存数据于已存在的excel中的不同sheet页中writer=pd.ExcelWriter('json_all.xlsx')data_json_all.to_excel(writer,'Shee2')data_json_all.to_excel(writer,'Shee3')writer.save()#容易被遗忘#使用with后with pd.ExcelWriter('json_all.xlsx') as writer: data原创 2020-10-27 17:01:30 · 2159 阅读 · 0 评论 -
Python_Json解析(+读取同一文件夹下所有文件)
用途:遍历同一文件夹下所有表格,并把每个表格内json格式数据解析,最终汇总在同一个表格内。import pandas as pdimport numpy as npimport osimport jsonlocation=r'C:\Users\Administrator.20170801-163855\Desktop\工作内容\PYTHON\JSON'os.chdir(location)data_json=pd.DataFrame([])data_json_all=pd.DataF原创 2020-10-27 16:32:58 · 1501 阅读 · 1 评论 -
python--有关sql函数中case when的探索
apply函数针对dataframe的每一行进行运行较为方便案例一:把日期修改为季度1:借用for函数,很费时for i in range(len(data)-1): print(i) data.loc[data.index==i,'quarter_decison']=str(data.iloc[i]['time_decision_at'].year)+str('-Q')+str(data.iloc[i]['time_decision_at'].quarter)2:借用apply函原创 2020-10-21 18:09:46 · 782 阅读 · 1 评论 -
Python_if_else_for循环函数应用
对标Mysql中case when 函数,在Pyhon中可使用for+if函数。代码如下:for i in range(len(tot_2019_lo.index)): print(i) if (tot_2019_lo.iloc[i]['a11']>=7) & (tot_2019_lo.iloc[i]['d1']>=48): tot_2019_lo.loc[tot_2019_lo.index==i,'rule_seg'] ='rule_a'原创 2020-09-23 11:51:07 · 318 阅读 · 0 评论 -
Python_决策树应用
# -*- coding: utf-8 -*-"""Created on Wed Sep 16 16:06:42 2020@author: zhaoyan"""import pandas as pdimport numpy as np# =============================================================================# 一、导入数据# =======================================原创 2020-09-18 22:40:32 · 309 阅读 · 0 评论 -
Python--KNN(K近邻)模型
KNN模型在信贷风控中的运用结论:不是很适用原因:对于贷后有表现客户,坏客户量相对较少,使用K邻近算法,大部分坏客户也会被预测为好客户(好客户着实太多了,1个坏客户身边可能有20个好客户)以下案例,虽然预测准确率为97%,但是把所有客户都预测为了好客户。(坏客户占比2%左右,量少)import pandas as pdimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn.m原创 2020-07-29 16:30:58 · 588 阅读 · 0 评论 -
python--测试集训练集分类
sklearn的train_test_splittrain_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。格式:X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)参数解释:train_data:被划分的样本特征集train_target:被原创 2020-07-26 18:30:12 · 523 阅读 · 0 评论 -
python--缺失值处理
删除无效项df[df.isnull()] #返回的是个true或false的Series对象(掩码对象),进而筛选出我们需要的特定数据。df[df.notnull()]df.dropna() #将所有含有nan项的row删除df.dropna(axis=1,thresh=3) #将在列的方向上三个为NaN的项删除df.dropna(how='ALL') #将全部项都是nan的row删除填充空缺项df.fillna(0)df.fillna({1:0, 2:0.5})原创 2020-07-26 17:59:46 · 379 阅读 · 0 评论 -
python--数据选取loc/iloc/ix
loc中的数据是列名,是字符串,所以前后都要取;iloc中数据是int整型,所以是Python默认的前闭后开一. loc函数:主要通过行标签索引数据,前闭后闭df 0 1 2 30 green M 10.1 class11 red L 13.5 class22 blue XL 15.3 class1In[10]: df.loc[0:1] #取第一和第二行,loc[]中的数字其实是行索引,所以算是前闭加后闭Out[10]:原创 2020-07-22 15:24:57 · 362 阅读 · 0 评论 -
Python--json解析数据
Python–json解析from openpyxl import Workbookimport pandas as pdimport numpy as npimport jsonimport tracebackimport osfrom pandas.core.frame import DataFrame# 读取csvdf_req = pd.read_csv(r"F:\报表\三方数据分析\税贷CAP规则调整\data_loan_infos.csv",header = 0,原创 2020-07-16 17:47:33 · 151 阅读 · 0 评论 -
pthon v.s mysql (2)
"""Created on Tue Jan 14 18:06:08 2020@author: Administrator"""import pandas as pdimport numpy as np# =============================================================================# 一、导数据# ===...原创 2020-02-24 20:14:34 · 172 阅读 · 0 评论 -
python v.s. mysql
"""Created on Thu Feb 6 20:41:22 2020@author: Administrator"""import pandas as pdimport numpy as npdf = pd.DataFrame({'colA' : list('AABCA'), 'colB' : ['X','','Ya','Xb','Xa'],'colC' : [100,50...原创 2020-02-24 20:11:41 · 150 阅读 · 0 评论 -
python_樱花树
樱花树# -*- coding: utf-8 -*-"""Created on Fri Dec 27 15:20:47 2019@author: Administrator"""import turtle as Timport randomimport time# 画樱花的躯干(60,t)def Tree(branch, t): time.sleep(0.0005...原创 2019-12-27 15:29:48 · 3558 阅读 · 2 评论 -
python_小牛试刀1-数据清洗
具体包括:读取输出数据、筛选数据、连接、分组、groupby、缺失值替换"""Created on Wed Dec 18 11:45:11 2019@author: zhaoyan"""import pandas as pdimport numpy as npapplications=pd.read_csv('applications.csv',encoding='gb1803...原创 2019-12-19 11:18:31 · 223 阅读 · 0 评论 -
python-spyder常用快捷键
常用快捷键快捷键 中文名称Ctrl+R 替换文本Ctrl+1 单行注释,单次注释,双次取消注释Ctrl+4 块注释,单次注释,双次取消注释F5 运行程序Ctrl+P 文件切换Ctrl+L 清除shellCtrl+I 查看某个函数的帮助文档Ctrl+Shift+V 调出变量窗口Ctrl+up 回到文档开头Ctrl+do...原创 2019-12-18 12:10:05 · 876 阅读 · 0 评论 -
Python_修改路径
import osos.getcwd() #当前目录os.chdir("目标目录") #更改路径原创 2019-11-28 12:34:23 · 1089 阅读 · 0 评论 -
Python_%
%是一种将其他变量置入字符串特定位置以生成新字符串的操作比如说:n = "Aki""My name is %s" % n # My name is Aki字符串中的%后面会附带一个字母,代表着用来替换的变量的类型,比如说%d代表着你将替换到此处的变量是一个整数,而%s代表着一个字符串。 "www.%s.com"%"zhihu"#字符串'www.zhihu.com' ...原创 2019-11-28 12:28:35 · 311 阅读 · 0 评论 -
Python_list/dictionary
列表 list索引my_integers = [5, 7, 1, 3, 4]print(my_integers[0]) # 5print(my_integers[1]) # 7print(my_integers[4]) # 4relatives_names = [ "Toshiaki", "Juliana", "Yuji", "Bruno", "Kaio"]...原创 2019-11-28 12:24:00 · 150 阅读 · 0 评论 -
Python--入门
我很幸运,因为我的同事都很优秀,对我帮助很大。以下是月粱给的Python入门学习代码,主要包含numpy及pandas两个包的学习。学会了这两个包,Python基本也就学会了一半。代码如下:# -*- coding: utf-8 -*-"""Created on Tue Aug 6 13:41:19 2019@author: lyl"""import numpy as npimpo...原创 2019-11-02 20:13:39 · 214 阅读 · 0 评论