- 博客(8)
- 收藏
- 关注
原创 使用Python做数据可视化
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsnp.set_printoptions(suppress=True) # 取消科学计数法输出N=1000x=np.random.randn(N)y=np.random.randn(N)### 使用matplotlib画散点图#plt.scatter(x,y,marker = 'x')#plt.scatter
2021-05-21 19:44:47
363
原创 R 评分卡模型 等宽分箱
R 等宽分箱等宽分箱近期做评分卡模型,对等宽分箱自定义了一个函数,可输出的结果包含分箱区间,分箱节点,每个分箱下的样本总计、坏样本总计、好样本总计、坏样本占比、woe值、iv值及总的IV值。代码如下:#参数说明:data为待分箱的特征变量,target为目标变量,bins为分箱个数(若数据集中包含空值,空值会单独自成一箱,不计算在bins之内)width_dt=data.frame()width_cut=function(data,target,bins){ count_pos_sum =
2021-05-17 10:46:27
408
原创 数据分析实战
数据分析实战数据分析基础数据分析全景图及修炼指南学习数据挖掘的最佳路径学数据分析要掌握哪些基本概念用户画像:标签化就是数据的抽象能力数据采集:如何自动化采集数据数据采集:如何用八爪鱼采集微博上的“D&G”评论数据分析算法数据分析实战数据分析工作数据分析基础数据分析全景图及修炼指南当我们谈论数据分析的时候,都在讲些什么呢?这里我可以把数据分析分成三个重要的组成部分。1、数据采集。它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。2、数据挖掘。它可以说是最“高大上”的部分,
2021-03-24 08:39:13
10849
2
原创 Python进阶
Python进阶决策树CART分类树CART回归树泰坦尼克号乘客生存预测决策树CART分类树from sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scorefrom sklearn.metrics import roc_curvefrom sklearn.metrics import roc_auc_scorefrom sklearn.tree import Decisi
2021-03-23 14:25:06
402
1
原创 Python基础
Python基础字符串字符串的表示方式字符串的下标和切片字符串常见操作字符串字符串的表示方式在python里,可以使用一对单引号(’’)、一对双引号("")、一对三个单引号(’’’ ‘’’)、一对三个双引号(""" “”")来表示字符串a = 'hello'b = "good"c = '''happy'''d = """sunshine"""字符串里外要使用不同的引号进行区分m = ' xiaoming said:"I am xiaoming" 'n = " xiaoqiang sai
2021-01-26 08:50:01
189
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人