- 博客(15)
- 收藏
- 关注
原创 外地父母常住北京-医疗问题-新农合北京就医实时结算
父母来京医疗,怎样将老家的新农合在北京看病的时候进行实时结算?父母常住北京,如何申请居住证?
2021-02-22 23:24:19
15294
3
原创 python concat ValueError: Shape of passed values is indices imply
使用pd.concat产生报错python concat ValueError: Shape of passed values is indices imply主要原因是合并的多个df对象中,index有存在重复的对象,从而导致合并时,必须舍弃相应对象,但是函数本身没有这个功能,所以报错解决方案:将涉及的多个df中index重新看一遍,有重复的,需要删除掉...
2020-07-06 19:53:20
17847
2
原创 代价复杂度剪枝的意义或中心思想是什么
代价复杂度剪枝的意义或中心思想是什么写在前面:为什么要剪枝?三种后剪枝方法的中心思想对比写在前面:本文都是我自己的理解,非官方,小白请绕行,避免带到坑里,大神万一看到,欢迎指点一下看思路是否正确为什么要剪枝?很多教程只说怎么剪枝,其实在解决这个问题之前,需要明白,为什么要剪枝:1,原树废话太多(看起来太复杂),能不能简洁概括?2,提高泛化能力3,降低复杂度,运行起来快我理解的上面三个原因的重要性,应该是1>2>3所以,从某种角度上来说,剪枝会降低在训练集上对结果预测的准确率,但
2020-06-15 18:46:44
1116
原创 decode 和case when 转换函数
decode 和case when 转换函数背景因工作需要经常在mysql数据库和oracle数据库等切换,造成写完的代码经常要迁移,但是mysql里面没有decode,所以用python写了一个通过decode转换成 case when写法的函数代码def decode_case(str1): #对字符串进行分列 t0 = str1.split(',') #取出待...
2019-12-20 17:05:27
1976
原创 [学习任务]_01
线性回归损失函数的极大似然推导:西瓜书公式3.4除了用最小二乘法以外,怎么用极大似然推得?一元线性回归的参数求解公式推导:西瓜书公式3.7和3.8怎么推来的?多元线性回归的参数求解公式推导:西瓜书公式3.10和3.11怎么推来的?线性回归损失函数的最优化算法:什么是批量梯度下降、随机梯度下降、小批量梯度下降?1 线性回归损失函数的极大似然推导:西瓜书公式3.4除了用最小二乘法以外,怎么用...
2019-01-27 21:31:30
355
转载 sql oracle/mysql 滑动窗口 统计每日近7日的数据
开窗olap转自 https://www.cnblogs.com/sooner/p/7735154.html range和row的区别转自 http://www.cnblogs.com/woodytu/p/4709020.html Oracle分析函数-OLAP函数总结 ORACLE OLAP 函数 最近这个东东用得特别多,总结了一下 。 语法: FUNCTION_...
2018-09-01 12:34:22
7265
原创 [Python] [py2neo][neo4j] TypeError: Parameters of type map are not supported
使用py2neo时报错: TypeError: Parameters of type map are not supported以下为问题复现:from py2neo import Graph,Node,Relationshipg = py2neo.Graph('http://localhost:7474', user='yudeng',password='yudeng')a = N...
2018-08-21 20:03:01
1315
原创 python 数据库导出的csv乱码怎么解决
使用cx_oracle导出数据至csv中文变成了乱码 可以采用以下代码解决df.to_csv('users.csv', encoding='utf_8_sig')
2018-07-25 17:34:38
819
原创 Python 数据集的相对路径/选择上级文件夹
选取相对路径关键在于两行代码import osdataset_path = ''datafile2 = os.path.join(dataset_path, '跨境审核辅助表.xls')其中dataset_path = ''表示在Python工作文件夹 dataset_path = '..'表示在Python工作文件夹的上级文件夹 dataset_path = '某某文件夹/'...
2018-07-25 17:25:45
10378
原创 python 怎样将dataframe中的字符串日期转化为日期
方法一:也是最简单的 直接使用pd.to_datetime函数实现data['交易时间'] = pd.to_datetime(data['交易时间'])方法二: 源自利用python进行数据分析P304 使用python的datetime包中的 strptime函数,datetime.strptime(value,’%Y/%M/%D’) strftime函数,datetime....
2018-07-25 16:58:13
57957
4
原创 Python dataframe更换列名称
方法1:使用pd.rename函数a.rename(columns={'A':'a', 'C':'c'}, inplace = True)上面代码的意思是: 1,对a这个df进行操作,涉及的列为A和C两列 2:将涉及的列用字典括起来,’A’:’a’的意思是将原大A列的列名称修改为小a列 3,inplace指的是直接修改,不使用复制的方式,要是没有inplace这个参数,或者这个参...
2018-07-25 16:51:50
27282
原创 python 如何读取竖线分隔符的文本
data = pd.read_csv('20180201.txt',sep = '|',dtype = 'str')以上代码意思是: 1,读取本工作路径下的20180201.txt文件 2,使用’|’分割不同的列 3,所有列数据类型为字符串’str’...
2018-07-25 16:40:46
8071
原创 python 01数据类型转换_如何将所有或部分dataframe的数据类型转换为字符串
读取原始数据的时候,经常会遇到字符型变量读入变成了数值型,比较定性的就是商户ID,银行卡号这类标识型数据, 可以使用三种方法解决这个问题:第一种:在读取数据的时候,指定数据类型data = pd.read_csv('test.txt',sep = '|',dtype = 'str')上面说的是, 1,读取工作文件路径中标题为test.txt的文件, 2,采用的分割符是’|’分隔符...
2018-07-25 16:37:20
46095
3
原创 Python_数据预处理
## 数据预处理分类1,最大值最小值处理法_MinMaxScaler2,正态化处理方法_StandardScaler3,标准化数据处理方法_Normalizer4,二值处理法_Binarizer ### MinMaxScaler使得特征的分布是在一个给定最小值和最大值的范围内的。一般情况下是在[0,1]之间,或者是特征中绝对值最大的那个数为1,其他数以此维标准分布在[0,1]之...
2018-07-23 10:58:02
590
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人