
机器学习基础概念
春卷同学
中南大学 软件工程 硕士研究生
展开
-
稀疏矩阵存储格式
原博地址:https://blog.youkuaiyun.com/wangjian1204/article/details/52149199当运算数据数量很大且稀疏的时候,使用稀疏的数据存储格式可以节省大量的存储空间且加快计算速度。本文介绍三种比较常见的稀疏矩阵表示方式:COO(Coordinate Format坐标表示),CSR(Compressed Sparse Row行压缩),CSC(Compr...转载 2018-08-20 14:15:40 · 344 阅读 · 0 评论 -
机器学习常用算法的概念
概率建模概率建模(probabilistic modeling)是统计学原理在数据分析中的应用。它是最早的机器学习形式之一,至今仍在广泛使用。其中最有名的算法之一就是朴素贝叶斯算法。朴素贝叶斯是一类基于应用贝叶斯定理的机器学习分类器,它假设输入数据的特征都是独立的。这是一个很强的假设,或者说“朴素的”假设,其名称正来源于此。logistic 回归(logistic regression...原创 2018-12-04 22:01:13 · 469 阅读 · 0 评论 -
pip要换成pip3
如果是python3.x的用户,要将pip换成pip3使用pip3之前,最好pip3 install --upgrade pip来将pip更新至最新版原创 2018-12-02 13:53:29 · 4235 阅读 · 0 评论 -
RNN,LSTM和GRU和word2vec及embedding等的联系与区别解析。
普通的MLP和CNN都没有事件维度,可以从RNN开始引入了事件维度,这在理解上给我们带来了一些困难,笔者为了避免遗忘,将这种区别和特点记录如下。(没时间画图,就看文字吧,写的比较简单。。。)资料 https://zhuanlan.zhihu.com/p/36455374这篇博客讲的其实很清楚了,为了帮助理解,我总结如下::1. RNN可以看成是有t个3层的全连接神经网络,从1-t代...转载 2018-11-18 20:09:35 · 2008 阅读 · 0 评论 -
【转载】中文word2vec的python实现
转自https://blog.youkuaiyun.com/sinat_29694963/article/details/79177832 1、语料相关说明第一种方法是去网上下载相关语料,我这里有一个英文语料模型点我下载,它适合于使用word2vec英文训练的语料,约96M,包括常用的英文词汇。而由于中文语料比较少,暂时也是写前期代码测试,就去网上下载了《倚天屠龙记》小说全集,为txt格式,作...转载 2018-11-15 22:31:19 · 795 阅读 · 0 评论 -
word2vec总结
转自https://blog.youkuaiyun.com/luoxinyurose/article/details/77648347?locationNum=11&fps=1 简单的总结一下最近学的word2vec不知道自然语言处理有没有发展前景,先学了再说,只有好处没有坏处。word2vec将词转化为向量,可以为后续的处理,比如说生成歌词,生成唐诗之类的应用做铺垫。生成一个word2...转载 2018-11-15 22:24:18 · 477 阅读 · 0 评论 -
scikit-learn 线性回归模型的score函数,返回值是决定系数R^2
http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegressionhttp://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_s...原创 2018-09-11 11:28:48 · 35809 阅读 · 1 评论 -
注意:Classifier和Regressor的score函数,是不同的!
下面以sklearn的KNeighbors模型举例:1.对于分类(Classifier)模型,score函数计算的是精确度。底层是accuracy_scorehttp://scikit-learn.org/stable/modules/generated/sklearn.neighbors.RadiusNeighborsClassifier.html#sklearn.neighbors.R...原创 2018-09-11 12:50:56 · 6342 阅读 · 2 评论 -
【收集】机器学习相关的比较好的博客
朱小虎XiaohuZhuhttps://www.jianshu.com/u/696dc6c6f01c【实战】TF-IDF,WORD2VEC,机器学习算法,深度学习算法在新浪新闻分类表现https://blog.youkuaiyun.com/qq_41664845/article/details/80305101【API爬虫】30分钟百万条新浪新闻信息爬取。python得极速之旅...原创 2018-11-19 12:40:19 · 221 阅读 · 0 评论