
Machine/DeepLearning
Scofield_Phil
RxNLP.
展开
-
几个名词解释:大数据、Hadoop、云计算、机器学习、NLP、数据挖掘
几个名词解释:大数据、Hadoop、云计算、机器学习、NLP、数据挖掘大数据:大数据是相对于传统"小数据"的,传统由于数据处理的成本很高,所以只能处理部分信息系统中产生的非常规范的数据,而对于文本、图片等数据不能处理,而且数据量非常大的话,只能通过抽样的方式来降低数据量。大数据的所谓4个特征是,Volume(数据量大,海量数据),Variety(数据类型多,文本/音频/原创 2016-09-16 00:53:22 · 8675 阅读 · 0 评论 -
各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)
学习笔记:各大神经网络框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrentNN, recursiveNN)several basic neural networks[mlp, autoencoder, CNNs, recurrentNN, recursiveNN] impl原创 2018-01-19 16:09:43 · 8328 阅读 · 2 评论 -
TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注 源码
在TensorFlow (RNN)深度学习下 BiLSTM+CRF 跑 sequence labeling 双向LSTM+CRF跑序列标注问题去年底样子一直在做NLP相关task,是个关于序列标注问题。这 sequence labeling属于NLP的经典问题了,开始尝试用HMM,哦不,用CRF做baseline,by the way, 用的CRF++。关于CRF的理论就不再啰原创 2017-03-04 20:32:54 · 45315 阅读 · 5 评论 -
数据挖掘 NLP 之 文本挖掘 文本处理 通用流程
数据挖掘 NLP 之 文本挖掘 文本处理 通用流程 数据挖掘中的文本挖掘不论是对于企业应用,还是研究者工作,或者是参与数据竞赛项目,都是基础的工作。通过前面的一些实践工作,现总结出文本挖掘文本处理的通用流程。注意,这里的文本挖掘任务主要指的是如文本分类、文本聚类、信息抽取、情感分类等等的常规NLP问题。一、获取语料获取文本语料通原创 2017-06-07 22:18:52 · 15316 阅读 · 0 评论 -
NLP 主题抽取 Topic LDA代码实践 gensim包 代码
NLP 主题抽取Topic LDA代码实践 gensim包 代码 分享一个代码实践:用gensim包的LDA模型实践NLP的一个典型任务,主题抽取。 顺带提一点,对于NLP任务,最好的方式就是先在代码上跑通起来,然后再进行理论深究,最后自己实现DIY学习模型算法框架。 顺带再提一点,跑通NLP或者ML任务,推荐在Python下用原创 2017-06-07 22:49:13 · 10342 阅读 · 0 评论 -
NLP 工具包 大调查 自然语言处理工具包合集
NLP 工具包 大调查 自然语言处理工具包合集 可以想一想,如何你把NLP领域的所有的工具都能掌握的数如家珍,是不是很NB?必然的。 只用过这里面的一部分。。。 这份调查是基于使用语言差别来归纳的,别问我什么这么分类哈。。。一、多语言多环境编译1、THULA原创 2017-06-07 23:06:18 · 7315 阅读 · 0 评论 -
从不同角度看机器学习的几种学习方式
从不同角度看机器学习的几种学习方式:1、在线学习与离线学习offline learning and online learning. In offline learning, the whole training data must be available at the time of model training. Only when training is c原创 2017-04-27 20:11:22 · 8349 阅读 · 0 评论 -
DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)
DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)词向量、word embedding、分布式表示、word2vec、glove 术语解释!自然语言处理表示学习词向量、word2vec无门槛理解! 其实顺便分享下,在我个人的方法论思维中,一个带有完整上下文以及结构构建良好的知识框架,在某种程度上,比一些细枝末节的详细知识点来的重要的多了!因为,一旦构建了一个完备的知识结构框架,那么剩下你要做的是将一些零零碎原创 2017-04-04 20:48:33 · 35100 阅读 · 32 评论 -
ubuntu下 tensorflow 升级到 新版本 0.11.0版本
ubuntu 升级 tensorflow 到 0.11.0版本之前在ubuntu上安装的比较早的0.8版本的TensorFlow,现在遇到一些库的不兼容问题,所以得升级下tf包。1:确认最可升级的最高版本【https://www.tensorflow.org/versions/】,注意两点:a).你的平台是cpu 还是gpu b).官方对应的版本有没有你的cp原创 2017-03-04 17:19:58 · 6911 阅读 · 0 评论 -
[转发]机器学习资源大全
机器学习资源大全本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。转载 2017-04-03 11:05:28 · 3746 阅读 · 0 评论 -
机器学习 数据挖掘 数据集划分 训练集 验证集 测试集
机器学习之数据集划分: 训练集 验证集 测试集Q:将数据集划分为测试数据集和训练数据集的常用套路是什么呢?A:three ways shown as follow:1.像sklearn一样,提供一个将数据集切分成训练集和测试集的函数:默认是把数据集的75%作为训练集,把数据集的25%作为测试集。2.交叉验证(一般取十折交叉验证:10-fold原创 2017-04-10 12:40:59 · 13073 阅读 · 1 评论 -
自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict
过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法。人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给人们的提升,然而最重要的一点却是机器学习算法的通用性。如果你想写一段程序来识别社交媒体平台上的侮辱性帖转载 2017-03-14 19:42:53 · 6701 阅读 · 0 评论 -
Ubuntu安装tensorflow报错:tensorflow-xx.whl not a supported wheel on this platform
解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this platform.TensorFlow only be installed under a 64bit platform but not a 32bit machine!亲,TensorFlow是不支持32位机的~原创 2017-01-08 17:18:39 · 19217 阅读 · 6 评论 -
python机器学习包 Windows下 pip安装 scikit-learn numpy scipy
python机器学习包 Windows10下 pip安装 scikit-learn numpy scipyrequirements:` windows10` python2.7` pip9.0.1` numpy` scipy` sklearn1 pip的安装1.1 下载pip下载地址是:https://pypi.python.原创 2017-03-18 21:21:33 · 7758 阅读 · 0 评论 -
python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'
python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'在用pandas读取csv数据进行处理时,报了个错:pd.read_csv(train_path, delimiter='\t', quoting=csv.QUOTE_NONE, skip_bla原创 2017-03-04 19:24:16 · 20154 阅读 · 0 评论 -
深度学习DeepLearning推荐论文清单 初学者入门推荐学习路线
深度学习DeepLearning papers初学者入门推荐学习论文清单(供下载)—————————————每一位DL初学者都想找到一条卓有成效的学习路线,我推荐的是沿着历史发展路线将前辈们的经典papers一一读一遍。所以有的兄弟已经做好了工作了:这里有位仁兄的(Deep Learning Papers Reading Roadmap就归纳了还比较齐全的paper清单。里面提供了下载器,但限于TGW的原创 2017-01-08 01:01:17 · 21513 阅读 · 1 评论 -
概率图模型学习笔记:HMM、MEMM、CRF
概率图模型学习笔记:HMM、MEMM、CRF原创博客,转载请注明出处。From Scofield. RxNLP一、Preface二、Prerequisite 2.1 概率图 2.1.1 概览 2.1.2 有向图 vs. 无向图 2.1.3 马尔科夫假设&马尔科夫性 2.2 判别式模型 vs.原创 2018-01-29 15:00:57 · 7845 阅读 · 2 评论