文本分类
程序猿进化之旅
JAVA 研发工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
scikit - learn 做文本分类
文章来源: https://my.oschina.net/u/175377/blog/84420Scikit Learn: 在python中机器学习Warning警告:有些没能理解的句子,我以自己的理解意译。翻译自:Scikit Learn:Machine Learning in Python作者: Fabian Pedregosa, Gael Varoqu转载 2016-12-08 15:59:25 · 1466 阅读 · 0 评论 -
scikit -learn 的使用
由于做毕业论文方向是文本分类,需要用到scikit -learn 工具,借鉴前辈的基础上做了如下实验:参考了scikit-learn的官方网站1. 数据准备关于分类,我们使用了Iris数据集,这个scikit-learn自带了. Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包原创 2016-12-08 16:04:44 · 459 阅读 · 0 评论 -
FastText的词向量表征
来源:http://blog.youkuaiyun.com/sinat_26917383/article/details/54850933二、FastText的词向量表征1、FastText的N-gram特征常用的特征是词袋模型。但词袋模型不能考虑词之间的顺序,因此 fastText 还加入了 N-gram 特征。 “我 爱 她” 这句话中的词袋模型特征是 “我”,转载 2017-06-17 16:49:14 · 6835 阅读 · 2 评论 -
vmwear 上运行ubantu发行版
软件源:1、Vmwear workstation 102、Ubantu 12.4、win 7安装过程:1、先执行Vmwear 10 安装文件 2、然后在Vmwear 中选择新建虚拟机(可以创建多个)3、创建虚拟机账户名和密码 4、登录虚拟机常用命令:su 切换账户, cd 进入文件目录,apt-get 包管理命令原创 2017-06-02 18:55:57 · 370 阅读 · 0 评论
分享