笔记
借&过
什么都不会的菜鸟一枚
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习Python(四)
项目实践之文本分类实例 采用20Newgroups的数据。数据集分为两部分,一部分用来训练模型,一部分是用来评估算法的新数据。这里采用20news-bydate数据集进行项目研究,这个数据集是按照日期进行排序的,并去掉了部分重复数据和header。 使用scikit-learn的loadfiles导入文档数据。利用机器学习对文本进行分类,与对数值特征进行分类最大的区别是,对文本进行分类时要先提取文本特征,提取到的文本特征属性是巨大的,有时会超过万个的特征属性。 rom sklearn.featu.原创 2020-07-28 17:07:24 · 654 阅读 · 0 评论 -
机器学习Pyhton(三)
四、优化模型 1.集成算法 袋装(Bagging)算法 1)袋装决策树(Bagged Decision Trees) 2)随机森林(Randon Forest) 3)极端随机树(Extra Trees) 提升(Boosting)算法 1)AdaBoost 2)随机梯度提升(Stochastic Gradient Boosting) 投票(Voting)算法 2.算法调参 网格搜索优化参数 ...原创 2020-07-28 16:19:40 · 1467 阅读 · 0 评论
分享