
机器学习
白糖炒栗子~
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【机器学习】数据分析王者 CatBoost vs. Light GBM vs. XGBoost
机器学习领域的一个特点就是日新月异,在数据竞赛中,一件趁手的工具对比赛结果有重要影响。boosting是一种将弱分类器组合成强分类器的方法,它包含多种算法,如GDBT、AdaBoost、XGBoost等等。如果你参加过Kaggle之类的数据竞赛,你可能听说过XGBoost在数据江湖上的领导地位,也可能好奇过LGBM的快速崛起。但是,你听说过俄罗斯最大搜索引擎Yandex开发的CatBoost吗?...转载 2018-10-22 21:06:44 · 3656 阅读 · 0 评论 -
【机器学习】Sklearn 常用分类器(全)
【机器学习】Sklearn 常用分类器(全)### KNN Classifier from sklearn.neighbors import KNeighborsClassifierclf = KNeighborsClassifier()clf.fit(train_x, train_y)_____________________________________________...原创 2018-10-11 13:39:58 · 25003 阅读 · 1 评论 -
【机器学习】特征工程多特征值序列化数值化独热编码处理(LabelEncoder, pd.factorize())
多特征值序列化数值化独热编码处理当我们在运用某些模型时,比如在Scikit-learn中,它要求数据都得是numberic(数值型),若是文本类型就无法进行训练。那么在这种情况下,我们就应该先对数据进行序列化数值化:下面是几种在Python中数值化的方法:1. 自然数编码 : a) 使用sklearn中的LabelEncoder()方法,转换为数值型特征 ...原创 2018-09-15 16:01:04 · 5644 阅读 · 2 评论 -
【机器学习】Python数据标准化方法、聚类方法、分类方法总结:
(一)数据标准化的方法: (1)离差标准化(最大最小值标准化) (2)标准差标准化、 (3)归一化标准化 (4)二值化标准化 (5)独热编码标准化 (二)聚类的方法: (1)划分法(k-means算法(k-均值算法),k-MEDOIDS算法(k-中心),CLARANS算法) (2)层次分析方法(BIRCH算法,cure算法) (3)基于密度的方法(DBSCAN算法,DENCLUS...转载 2018-11-01 19:12:10 · 1251 阅读 · 0 评论