
机器学习
文章平均质量分 81
sigmeta
Peking University / Microsoft
展开
-
windows下编译的fasttext 0.9.2 命令行工具
基于官方代码在windows下编译的命令行工具,fasttext 0.9.2最新release版本,支持autotune等功能。csdn下载链接:fasttext0.9.2windowscommandlinetools-机器学习文档类资源-优快云下载或到github免费下载,大家可以帮忙star一下~:sigmeta/fastText-Windows: fastText built for Windows (github.com)...原创 2020-12-30 17:11:32 · 425 阅读 · 0 评论 -
最大熵马尔可夫模型MEMM
信息与熵熵(信息熵)可被认为是系统不确定性(混乱程度)的度量,熵值越大,系统越混乱。一个X值域为{x1, ..., xn}的随机变量的熵值H定义为:其中,E 代表了期望函数,而I(X)是X的信息量(又称为信息本体),熵是随机变量的各值域概率及其信息量积的加总。信息量是用来衡量单一随机变量发生时所含信息的的多寡,随机变量发生的概率越低,其发生后消除系统不确定性的能力越强,所含信...转载 2018-11-02 11:25:17 · 2360 阅读 · 0 评论 -
RNN & LSTM 网络结构及应用
http://www.jianshu.com/p/f3bde26febed/这篇是 The Unreasonable Effectiveness of Recurrent Neural Networks(by Andrej Karpathy,Stanford的Li Fei-Fei的博士生。文章介绍了RNN和LSTM,同时也介绍了RNN取得的各种瞩目成果。)以及Understanding LS...转载 2018-10-09 23:30:35 · 2350 阅读 · 0 评论 -
随机森林算法学习(RandomForest)
随机森林算法学习最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm,log回归,knn等算法效果好。因此想琢磨琢磨这个算法的原理。要学随机森林,首先先简单介绍一下集成学习方法和决策树算法。下文仅对该两种方法做简单介绍(具体学习推荐看统计学习方法的第5章和第8章)。Bagging和Boosting的概念与区别该部分主要学习自:http://www....转载 2018-06-26 13:03:03 · 1714 阅读 · 0 评论 -
word2vec词向量训练及gensim的使用
一、什么是词向量词向量最初是用one-hot represention表征的,也就是向量中每一个元素都关联着词库中的一个单词,指定词的向量表示为:其在向量中对应的元素设置为1,其他的元素设置为0。采用这种表示无法对词向量做比较,后来就出现了分布式表征。在word2vec中就是采用分布式表征,在向量维数比较大的情况下,每一个词都可以用元素的分布式权重来表示,因此,向量的每一维都表示一个特征向量,作用...转载 2018-06-08 11:42:25 · 2516 阅读 · 0 评论 -
scikit-learn中PCA的使用方法
@author:wepon@blog:http://blog.youkuaiyun.com/u012162613/article/details/42192293在前一篇文章 主成分分析(PCA) 中,我基于python和numpy实现了PCA算法,主要是为了加深对算法的理解,算法的实现很粗糙,实际应用中我们一般调用成熟的包,本文就结束scikit-learn中PCA使用的方法和需要注意的细节,参考:skle...转载 2018-04-06 20:55:56 · 1700 阅读 · 1 评论 -
一只兔子帮你理解 kNN
导语:商业哲学家 Jim Rohn 说过一句话,“你,就是你最常接触的五个人的平均。”那么,在分析一个人时,我们不妨观察和他最亲密的几个人。同理的,在判定一个未知事物时,可以观察离它最近的几个样本,这就是 kNN(k最近邻)的方法。作者:肖睿编辑:宏观经济算命师本文由JoinQuant量化课堂推出,本文的难度属于进阶(上),深度为 level-1简介kNN(k-Nearest Neighb...转载 2018-04-11 17:33:50 · 354 阅读 · 0 评论 -
3行Python代码完成人脸识别
Face Recognition软件包这是世界上最简单的人脸识别库了。你可以通过Python引用或者命令行的形式使用它,来管理和识别人脸。该软件包使用dlib中最先进的人脸识别深度学习算法,使得识别准确率在《Labled Faces in the world》测试基准下达到了99.38%。它同时提供了一个叫face_recognition的命令行工具,以便你可以用命令行对一转载 2017-10-12 22:18:36 · 564 阅读 · 0 评论 -
Coursera机器学习 第五周Neural Networks: Learning 测验题目和答案
1point1。You are training a three layer neural network and would like to use backpropagation to compute the gradient of the cost function. In the backpropagation algorithm, one of the steps原创 2017-08-24 16:59:34 · 3758 阅读 · 0 评论