
机器学习笔记集
Walter_Silva
这个作者很懒,什么都没留下…
展开
-
【转】机器学习各算法比较
http://www.csuldw.com/2016/02/26/2016-02-26-choosing-a-machine-learning-classifier/转载 2018-06-22 10:08:12 · 238 阅读 · 0 评论 -
强化学习之动态规划
原创 2018-09-24 23:53:13 · 500 阅读 · 0 评论 -
数据可视化之matplotlib
https://www.bilibili.com/video/av29438238/?p=4plt.plot()plt.xtrick(rotation=45)plt.xlabel()/plt.ylabel()fig=plt.figure(figsize=(3,3))fig.add_subplot(4,1,(1/2/3/4))labelplt.legend(loc='be...原创 2018-10-20 10:34:41 · 327 阅读 · 0 评论 -
数据可视化之seaborn_1
https://www.bilibili.com/video/av29438608?p=2seanborn是在matplotlib基础上封装了一层,应用了大量的模版,让我们很容易画出比较美观的图1 主题风格设置2 调色板 ...原创 2018-10-21 12:30:37 · 277 阅读 · 0 评论 -
特征选择的几个不错的网址
http://dataunion.org/14072.htmlhttp://sklearn.apachecn.org/cn/0.19.0/modules/feature_selection.html原创 2018-10-25 18:34:55 · 453 阅读 · 0 评论 -
数据可视化之seaborn_2
https://www.bilibili.com/video/av29438608/?p=10一 单变量1 直方图2 散点图3 回归分析图二 多变量分析1 类别变量三 盒图 四 琴图五 两张图的叠加五 条形图六 点图七 多层分类图...原创 2018-10-21 13:18:30 · 265 阅读 · 0 评论 -
数据可视化之seaborn_3
https://www.bilibili.com/video/av29438608/?p=11一 facetgrid展示数据集中的子集二 热力图:数据趋势变化用颜色表示出来原创 2018-10-21 14:19:06 · 222 阅读 · 0 评论 -
神经网络训练中的技巧
一、防止过拟合1、早期停止2、正则化3、Dropout 二、局部最低点和梯度消失的问题梯度值过小的话每次迭代得就会很慢,甚至不变,找不到最优点下面是一些解决方法1、改变激活函数如从sigmoid改为双曲正切函数或者relu2、批次和随机梯度下降3、学习率衰退4、随机重新开始5、动量 三、其他...原创 2018-10-30 23:00:30 · 299 阅读 · 0 评论 -
word2vec的学习资料
一个全面的了解 https://blog.youkuaiyun.com/itplus/article/details/37969519和Xin Rong 的论文:『word2vec Parameter Learning Explained』源码解析 https://schwimmer.github.io/2018/03/17/NLP/Word2vec-C%E4%BB%A3%E7%A0%81/源码地...原创 2018-11-01 19:35:33 · 547 阅读 · 0 评论 -
CNN卷积神经网络
1、MLP和CNN的区别MLP丧失了二维图像信息,必须转成向量2、将全连接层转换为局部连接层stride和填充:stride步长,对于超出范围的区域,可以删除或者填充默认值,根据需要选择(pandding分别对应valid和same)3、卷积层的维度公式:卷积层中的参数数量卷积层中的参数数量取决于 filters、kernel_size 和 input_shap...原创 2018-11-04 16:59:48 · 671 阅读 · 0 评论 -
三大相关性检验的介绍和选择
https://blog.youkuaiyun.com/sinat_24143931/article/details/78798630根据这篇文章的介绍可以知道:1、person correlation coefficient(皮尔森相关性系数)就是两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。它要求数据是连续数...原创 2018-11-13 10:26:32 · 21437 阅读 · 0 评论 -
str和unicode的异同---Python
str是字节串,由unicode经过编码(encode)后的字节组成的unicode才是真正意义上的字符串,由字符组成unicode->encode->strstr->decode->unicode默认读取的时候是str,这也是在pandas读取csv时指定encoding的原因type('中文'.decode('utf-8'))---->unico...原创 2018-12-28 14:35:03 · 444 阅读 · 0 评论 -
强化学习之蒙特卡洛方法
MC 预测:状态值解决预测问题的算法会确定策略 \piπ 对应的值函数 v_\pivπ(或 q_\piqπ)。 通过与环境互动评估策略 \piπ 的方法分为两大类别: 在线策略方法使智能体与环境互动时遵守的策略 \piπ 与要评估(或改进)的策略相同。 离线策略方法使智能体与环境互动时遵守的策略 bb(其中 b\neq\pib≠π)与要评估(或改进)的策略不同。 状态 s\i...原创 2018-09-27 16:30:39 · 1487 阅读 · 0 评论 -
知乎上很不错的一个系列课
知乎上的系列课,很不错,记录下地址https://zhuanlan.zhihu.com/p/43601077https://mp.weixin.qq.com/s?__biz=MzI3ODkxODU3Mg==&mid=2247485759&idx=1&sn=afe6ae3fc719bdf95897a6c1f50081f2&chksm=eb4eedfcdc396...原创 2018-09-10 19:57:29 · 641 阅读 · 0 评论 -
SVM核函数选择和调参
https://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdfAndrew Ng给的建议:n:特征的维度m:训练集的条数1、n相对m很大时,如n=10000,m = 10,......,1000建议用逻辑回归或者SVM(不带核函数即线性核)2、n比较小,m居中,如n=1-1000,m=10,......,10000建议使用带高斯核(rbf,径向基...原创 2018-06-22 10:09:02 · 1522 阅读 · 0 评论 -
【转】判别式模型和生成式模型的介绍与区别
https://blog.youkuaiyun.com/ruyueyini/article/details/53302882转载 2018-06-22 10:21:57 · 329 阅读 · 0 评论 -
教你对抗机器学习数据集里的不均衡数据
收藏下地址:英文原文:https://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/汉文翻译:https://blog.youkuaiyun.com/jiandanjinxin/article/details/50857205其他文章:https://blog.c...原创 2018-06-08 11:27:22 · 813 阅读 · 0 评论 -
逻辑回归和线性回归的区别(转)
原地址:https://blog.youkuaiyun.com/bitcarmanlee/article/details/51263233 相同点: 两者都是广义线性模型GLM(Generalized linear models)不同点: 1.线性回归要求因变量(假设为Y)是连续数值变量,而logistic回归要求因变量是离散的类型变量,例如最常见的二分类问题,1代表正样本,0代...转载 2018-06-15 15:07:58 · 1415 阅读 · 0 评论 -
机器学习中的损失函数(转)
https://www.cnblogs.com/luxiao/p/5783017.html转载 2018-06-15 16:25:47 · 232 阅读 · 0 评论 -
【转】教程 | 算法太多挑花眼?教你如何选择正确的机器学习算法
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650744560&idx=3&sn=39248755937d36f3d7195bc86897e6b6&chksm=871ae28eb06d6b98580d679937370d9564b164f333675225c813719e03841821d7b04fe...转载 2018-07-02 09:41:03 · 288 阅读 · 0 评论 -
如何处理类别变量
https://www.analyticsvidhya.com/blog/2015/11/easy-methods-deal-categorical-variables-predictive-modeling/1、Convert to number(1)Label Encoder(2)Convert numeric bins to number2、Combine Levels(...转载 2018-07-17 15:51:18 · 2681 阅读 · 0 评论 -
[转]一次完整的机器学习过程
https://mp.weixin.qq.com/s/TKDrDT4sXRL0YvE7Vkx23A转载 2018-07-13 16:39:49 · 331 阅读 · 0 评论 -
逻辑回归应用的case--kaggle
https://www.kaggle.com/juliencs/a-study-on-regression-applied-to-the-ames-datasetL0:计算非零个数,用于产生稀疏性,但是在实际研究中很少用,因为L0范数很难优化求解,是一个NP-hard问题,因此更多情况下我们是使用L1范数L1:计算绝对值之和,用以产生稀疏性,因为它是L0范式的一个最优凸近似,容易优化求解L...转载 2018-08-06 16:54:42 · 305 阅读 · 0 评论 -
异常检测专题
1、吴恩达老师的课程主要阐述一元高斯分布和多元高斯分布https://blog.youkuaiyun.com/u012328159/article/details/514629422、实例:用机器学习检测异常流,作者尝试过NN、高斯分布和Isolation Foresthttp://www.sohu.com/a/160849130_6427623、Isolation Foresthtt...原创 2018-08-31 17:34:49 · 372 阅读 · 0 评论 -
Python高级编程特性和技巧
昨今两天把Python高级编程过了遍,编程语言通用的部分都比较熟悉了,就跳过了。总结下:1、列表推导def _treatment(pos,element): return '%d, %s' %(pos,element)#列表推导print([i for i in range(0,10,1) if i%2==0])seq = ["one","two","three"]...原创 2018-09-09 16:29:04 · 875 阅读 · 0 评论 -
Python迭代器大全
本文代码大都来源于:http://www.wklken.me/posts/2013/08/20/python-extra-itertools.html#itertoolsisliceiterable-stop补充介绍:Python中的迭代器协议如下:1、实现__iter__()方法,返回一个迭代器2、实现next方法,返回当前的元素,并指向下一个元素的位置,如果当前位置已无元素,则抛...原创 2018-09-10 15:06:59 · 178 阅读 · 0 评论 -
Python的线程池和进程池实现、使用示例和注意点
1、线程池的内部实现可以先看https://www.jb51.net/article/139005.htm下面是代码示例和注释#coding='utf-8'#threadpool.ThreadPool,线程池类import osimport timeimport threadpooldef print_file_head(filename): print("begin r...原创 2019-01-11 21:48:08 · 814 阅读 · 0 评论