- 博客(4)
- 收藏
- 关注
原创 朴素贝叶斯算法分类
使用朴素贝叶斯算法进行新闻分类本文使用sklearn中的数据集20newsgroups1. 解决20newsgroups下载缓慢甚至出错的问题在获取数据阶段,下载十分缓慢,等了好久没有反应,索性自己下载了操作,在执行下面代码的时候会有数据下载链接from sklearn import datasetsnews = datasets.fetch_20newsgroups(subset='all')## Downloading 20news dataset. This may take a few
2021-01-14 14:13:42
393
3
原创 泰坦尼克存活预测-KNN
kaggle项目-泰坦尼克存活预测此文代码都是在Jupyter notebook运行的;主要步骤:1.数据获取 ;2. 数据预处理 ;3. 数据集拆分 ;4. 特征工程–无量钢化 ;5. 算法–模型 ;6. 模型评估;7. 最终预测由于博主目前只学习了KNN算法,所以本次就用KNN算法实现预测。1) 获取数据train_data=pd.read_csv('./train.csv')train_data.info()从上面的代码块可以看到训练集数据是有空值的,后续数据预处理要处理掉空值以
2020-12-11 17:14:24
914
4
原创 pandas中好用的函数--apply()
python 中的apply()函数在操作过程中,对数据框中的某一列操作读入了一个csv文件,文件中有多列,其中有一时间列(“date”),该列数据格式不一,如“2019-6-19”,“2019/6/18”都存在,此时希望改变时间列,将所有的“-”替换为“/”,且数据框其他列不改变f = lambda x : x.replace("-", "/")df["date"] = df["da...
2019-06-19 11:39:21
538
1
原创 小白记录python学习经历
pd.value_counts()函数在对统计数据出现次数时,pd.value_counts()还挺好用的,此函数默认按照统计次数从大到小排序data=[2,3,4,8,3,4,3]pd.value_counts(data)得到的结果如下:3 34 28 1 2 1...
2019-06-15 15:10:06
166
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人