
机器学习
文章平均质量分 73
zkkkkkkkkkkkkk
https://pypi.tuna.tsinghua.edu.cn/simple
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
关于自动机器学习flaml训练时的一些报错
SyntaxError: future feature annotations is not definedImportError: cannot import name 'StratifiedGroupKFold'xgboost.core.XGBoostError: C:/Users/xxx/learner.cc:567: Check failed:mparam_.num_feature != 0 (0 vs. 0) : 0 feature is supplied. Are you using raw原创 2023-03-24 14:33:18 · 1140 阅读 · 0 评论 -
决策树结构的解析
对训练的树模型可视化如下所示:本文是想要把里面的结果,特征及运算关系、阈值等参数解析出来。原创 2022-08-17 10:56:30 · 467 阅读 · 0 评论 -
利用决策树找出最优特征组合
利用决策树进行特征组合,决策树的可视化。原创 2022-08-02 17:45:07 · 1754 阅读 · 0 评论 -
canopy+kmeans聚类模式
canopy算法kmeans算法canopy+kmeans原创 2022-07-08 11:26:07 · 2944 阅读 · 7 评论 -
Python实现Kmeans文本聚类
一、数据 数据来源于贴吧,使用爬虫爬取的。一句一行存入到txt中,接着我们要通过对每句话进行分词转向量,最后使用kmeans进行聚类并输出结果。二、代码 2.1、加载停用词 在stop_words目录下有多个停用词表,需要循环加总所有停用词。 2.2、加载数据 这边主要是对原始数据的一个筛选+jieba分词+去停用词。这是相对标准的一个流程。 2.3、计算tf-idf原创 2022-07-01 14:06:14 · 4575 阅读 · 1 评论 -
自动机器学习框架介绍与使用(flaml、h2o)
目录一、介绍二、数据介绍三、flaml框架3.1、flaml简介 3.2、使用flaml3.2.1、下载flaml库 3.2.2、导入相关库3.2.3、数据处理 3.2.4、调用flaml四、h2o框架 4.1、h2o简介 4.2、h2o使用 ...原创 2022-03-09 15:47:07 · 5206 阅读 · 0 评论 -
机器学习分类任务效果评估指标大全(包含ROC和AUC)
1.1、什么是混淆矩阵?混淆矩阵也称误差矩阵(Confusion Matrix),是用来求得分类问题的指标计算。比如分类指标:准确率(正确率),精确率,召回率等等。我们都可以通过混淆矩阵计算得出。具体如下1.2、混淆矩阵是什么样子的?混淆矩阵是用来总结一个分类器结果的矩阵。对于k元分类,其实它就是一个k x k的k维表格,用来记录分类器的预测结果。1.3、常见二分类混淆矩阵 真实为1 真实为0 预测为1 TP ...原创 2021-09-17 15:43:02 · 1325 阅读 · 0 评论