自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习小组系列笔记--简单的数据预处理和特征工程

【将在后面的应用中来实践应用】学习目标有四个: 无量纲化:最值归一化、均值方差归一化及sklearn中的Scaler 缺失值处理 处理分类型特征:编码与哑变量 处理连续型特征:二值化与分段 相关的参考资料:关于最值归一化、均值方差归一化及sklearn中的Scaler方面的学习,可以参考:《机器学习的敲门砖:归一化与KD树》及《特征工程系列:特征预处...

2020-03-15 23:29:32 357

原创 机器学习小组系列笔记---(二)

一、本周学习内容知识点描述:如何评价模型的好坏。本周是机器学习小组第二期的第二周,我们这周学习机器学习的一些相关基础知识我们的学习目标有三个:数据拆分:训练数据集&测试数据集评价分类结果:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等评价回归结果:MSE、RMSE、MAE、R Squared二、学习资料为了方便大家学习,我们推荐了相关的参考资料。首先...

2020-03-08 22:51:26 254

原创 机器学习小组系列笔记---(一)knn算法

一、本周学习内容知识点描述:用代码打开AI的大门本周是机器学习小组第一期的第一周,我们这周从最简单的机器学习算法“K-近邻算法”开始,通过代码走进机器学习的大门,搞定传统机器学习算法。我们的学习目标有三个:了解kNN算法的思想及其原理 使用python手动实现kNN算法 ...

2020-03-01 19:08:40 270

原创 实验研究--安装fasttext

在安装文本处理模块 fasttext时,报错“一大串红字”,最后是gcc不对的问题。<忘了报错截图了>所以先安装gcc,尝试了很多方法都不可行,一来网速不太好,二来很多办法在我的mac上都不适用。最后参考了这位博主的文章,通过安装xcode来安装gcc,成功!https://blog.youkuaiyun.com/runfarther/article/details/54378251...

2020-03-01 15:16:08 304

原创 求职--统计与概率--统计--假设检验

常用假设检验整理自https://www.cnblogs.com/zhizhan/p/4784065.html假设检验--A/B test应用举例:https://baijiahao.baidu.com/s?id=1629865394478984240&wfr=spider&for=pc1.t检验  适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配...

2019-07-02 15:15:10 196 1

原创 求职--统计与概率--统计--假设检验--方差分析

整理参考https://blog.youkuaiyun.com/snowdroptulip/article/details/790309861. 方差分析方差分析:又称变异分析,是英国统计学家R.A.Fisher于1923年提出的一种统计方法,故有时也称为F检验。可简写为ANOVA。用于多组均数之间的显著性检验。要求:各组观察值服从正态分布或近似正态分布,并且各组之间的方差具有齐性。基本思...

2019-07-02 15:07:10 454

原创 求职--统计与概率--统计--假设检验--卡方检验

整理自此文:https://www.jianshu.com/p/807b2c2bfd9b1.卡方检验:检验两个变量之间有没有关系以运营为例:卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别; 不同城市级别的消费者对买SUV车有没有什么区别;如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。2. 以投硬币为例1) 根据投硬币观察到的正面,反面次数,判断这个硬...

2019-07-02 14:59:14 217

原创 求职--统计与概率--统计--假设检验--t检验

统计:描述统计 与 推断统计描述统计:均值,方差,中位数,众数;推断统计:参与估计 与 假设检验参数估计:点估计,矩阵估计,最大似然估计通过参数估计得到数据分布的参数值。假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。预先对总体参数的取值做出假定,然后用样本数据来验证,从而做出是接受还是拒绝的结论。具体...

2019-07-02 14:49:11 1102

原创 学习笔记-《python程序员面试宝典》-基础知识-数据结构-编程思维(一)

1. 时间空间复杂度时间复杂度主要看算法中多次调用或者主要调用的部分,重点看循环、递归等;空间复杂度:通常来说,只要算法不涉及到动态分配的空间以及递归、栈所需的空间,空间复杂度通常为0(1)。2.字符串逆转函数 时间复杂度O(n),空间O(1)def roundString(S): begin = 0 end = len(S)-1 ss = li...

2019-06-29 14:32:22 3422

原创 #Anaconda 安装#windows

若出现pip install xxx 错误,将安装源换成清华镜像依然错误。出现了:CondaHTTPError: HTTP 000 CONNECTION FAILED for url &lt;https://repo.continuum.io/pkgs/msys2/noarch/repodata.json.bz2&gt; Elapsed: -  An HTTP error occurred whe...

2018-04-27 14:59:50 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除