
机器学习
正版RX-0
一枚移动的搬运代码的碳水化合物
展开
-
PYTHON编程环境管理的必备利器——ANACONDA
随着python丰富多样,性能强大的第三方包不断地扩展着python的生态圈,对于做数据分析/数据挖掘/机器学习的同学来说,python已经成为他们常用必备的语言之一。但对于初学者和数据科学家来说,各种第三方包的安装,选择 python2.x 还是 python3.x这些问题都严重影响到python的使用体验(例如:如果你要安装p原创 2016-08-23 09:45:29 · 4039 阅读 · 0 评论 -
利用sklearn做自然语言处理(NLP)——词向量特征构建
在自然语言处理中,第一步需要面对的就是词向量特征的提取。语言的特征提取在sklearn模块中有相当完善的方法和模块,而针对中文其实也可以同过分词软件做分词然后再按照英文文本的思路开展特征提取,机器学习。原创 2016-09-18 17:29:26 · 12502 阅读 · 1 评论 -
Windows下安装xgboost的过程总结及dll问题解决方案
慕名已久在kaggle大赛上大放异彩的xgboost,但无奈windows在机器学习界二等公民的地位,一直没有在windows下装成功过。今天终于折腾完成功安装xgboost了,在此记录下来以供后人参考。环境windows 7Anaconda 3(这个很重要,如果不是用它的同学应该就不会遇到后面dll的问题了)python 3安装安装的过程官网已经挺详细的描述了,相信根据步骤一步步来,还是原创 2016-11-07 19:59:30 · 4869 阅读 · 1 评论 -
windows下pip报PermissionError解决方案
今天在用sklearn做机器学习的时候发现sklearn有个解决样本不平衡问题的好工具,于是乎,题主便迫不急待地去pip了。BUT, 安装快完成的时候报了这个错:Failed to build scipyInstalling collected packages: scipy, scikit-learn, numpy, imbalanced-learn Found existing insta原创 2017-03-30 16:49:49 · 20861 阅读 · 9 评论