数据分析
weixin_42294517
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 连接Postgresql 批量查询 插入操作
1、首先安装 Psycopg2 模块( 这是用来与postgresql进行连接并操作的)安装命令: pip install Psycopg22进行连接conn = psycopg2.connect(database="数据库名", user="用户名", password="密码", host="ip地址如果是本机就写localhost)", ...原创 2020-03-13 22:03:24 · 1434 阅读 · 0 评论 -
机器学习 之评估指标 召回率,查准率,F1分数(f1值)
1、召回率:评价模型的完整性预测样本中的预测正确的信息条数/总样本中所有的属于这类样本的信息条数 举例:这里用鱼和虾举例 TP:将鱼预测为鱼 FP:将虾预测为鱼 FN:将鱼预测虾 TN:将虾预测为虾 召回率R = TP/(TP+FP) (正确预测鱼的信息条数/原样本中所有鱼的信息条数)2、查准率:评价模型的正确性预测样本中的预测正确的信息条数/预测样本中所有的信息条数准确率P =...原创 2020-02-18 14:30:54 · 2355 阅读 · 0 评论 -
机器学习 数据预处理之标签编码
1、什么是标签编码将字符型的特征映射为整数(将字符串转换为整数)但没有被广泛使用因为求平均值之类的数据会出现问题(不过具体需求具体分析)有[dog,cat,dog,mouse,cat],我们把其转换为[1,2,1,3,2]。这里就产生了一个奇怪的现象:dog和mouse的平均值是cat。所以目前还没有发现标签编码的广泛使用(不过在决策树,随机森林对数据值不做要求的算法中是常见的)调用库包代码...原创 2020-02-13 15:08:37 · 4482 阅读 · 0 评论 -
机器学习 数据预处理之二值化
1、什么是二值化用0和1来表示样本矩阵中相对于某个给定阈值高于或者低于它的元素2、作用作用:一般用在图像处理 (将图像分成黑和白 常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群)3、示例代码import numpy as npsample = np.array([ [2, 4, 5, -1], [3, 1, 7, -2],...原创 2020-02-13 14:52:32 · 1818 阅读 · 0 评论
分享