
数据预处理
文章平均质量分 76
南师大蒜阿熏呀
帅的人已经醒来~~~
∩∩
(´・ω・)
_| ⊃/(___
/ └-(____/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄
展开
-
模型应用系实习生-模型训练笔记(更新至线性回归、Ridge回归、Lasso回归、Elastic Net回归、决策树回归、梯度提升树回归和随机森林回归)
检测函数,输入dataframe用for循环对每列检测和操作, 自动检测空值,object类型数据,并且进行默认操作,df.fillna(method=‘pad’, inplace=True) # 填充前一条数据的值df.fillna(method=‘bfill’, inplace=True) # 填充后一条数据的值独热编码返回处理好的dataframe。原创 2023-11-01 17:16:39 · 1421 阅读 · 0 评论 -
文本分析合集,文本向量处理的方法jieba,对文本的特征工程之TfidfVectorizer以及结合TruncatedSVD,WordCloud词云图展示
文本分析合集,文本向量处理的方法jieba,对文本的特征工程之TfidfVectorizer以及结合TruncatedSVD,WordCloud词云图展示对于一列文本我们需要对其进行操作的话首先要进行分词处理例如如下列表我们进行最简单的jieba分词处理这是分词后的结果。原创 2023-03-11 17:39:10 · 747 阅读 · 0 评论 -
机械学习房价预测实战(mse 回归 交叉验证)
机器学习的框架有哪些?请写出其构建一个机器学习的流水线。原创 2022-09-28 12:48:51 · 1211 阅读 · 5 评论 -
map reduce案例超详细讲解
map输出,分割单词增加尾部1,方便统计reduce统计调用管道符测试上面是一个简单的例子加大一点点难度使用MapReduce实现如下功能(要mapreduce思维实现,考虑多节点协同处理,非以往的Python单节点处理数据思维)现有数据 emp.csv 、 dept.txtemp.csv ----------------------------- ------------------------ dept.csv部门编号 姓名原创 2022-06-29 14:48:12 · 2496 阅读 · 0 评论 -
python 用pandleocr批量图片读取表格并且保存为excel
导包,这个很重要稍微有点难度噢pip install opencv-pythonpip install paddlepaddlepip install paddleocr这里的paddleocr时会报错如果说电脑没有安装.NET c++这个的话官网地址记住是c++然后创建一个文件夹存放图片,我写的代码的文件名是img...原创 2022-03-05 19:11:55 · 10422 阅读 · 11 评论 -
my sql安装(为数据预处理准备安装jdk后)
1、附上官网链接下载https://dev.mysql.com/downloads/file/?id=506256直接点击No thanks, just start my download.即可2、相对于传统的安装这砸要密码还是随机的额所以出个教程第一是怕自己忘了哈哈第二获取点那个我们打开文件后(别在子文件安装,在根)需要创建一个文本txt看到下面代码没,别直接复制,你看清楚点修改部分[mysqld]# 设置3306端口port=3306# 设置mysql的安装目录 ----------原创 2021-10-13 21:15:14 · 194 阅读 · 2 评论