- 博客(4)
- 收藏
- 关注
原创 关于成员判断in、isin
第三个报错是因为判断series中数据的成员资格不能用 in,要用集合方法isin(),isin()是专门判断矢量化集合的成员资格,常在布尔型索引中使用
2019-10-31 16:03:01
1065
原创 贷款分析
import pandas as pdimport numpy as npimport sqlite3df=pd.read_csv(r"D:\lending-club-loan-data\loan.csv",iterator=True)chunk=df.get_chunk(10)chunk id member_id ...
2019-09-18 23:06:01
718
原创 k近邻算法--约会网站预测案例
案例背景:整体思路:1、准备数据:解析文本文件(KNN.py中添加file2matrix函数)2、分析数据:Matplotlib画二维散点图3、构造分类器:计算新数据点与样本数据中各点的距离,取距离最小的前K个点,找出其对应的分类标签,再在这些标签总找出频率最高的分类标签,作为新数据点的分类。(KNN.py中添加classify0函数)4、归一化处理:剔除数值绝对大小的规模因素。如将取值...
2019-09-03 22:07:06
499
原创 Python 将Series的空字符串replace无反应
在pandas里空值是指NA,包括numpy的np.nan,python的None,pandas对空值进行操作可以用isnull/notnull/isna/notna/fillna/dropna等等,但是,这些操作对空字符串均无效。空字符串包含:'' 、' ' 、 ' ' 等各种含个数不等空格或不含空格的。那么对空字符串有正则表达式匹配:对Se...
2019-08-22 14:22:43
1377
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人