
机器学习复习之路
文章平均质量分 52
复习机器学习的相关知识
魏大明白
一个在程序猿道路一去不复返的小菜鸡~
展开
-
04_机器学习_分类算法
分类问题算法单一的分类方法主要包括:LR 逻辑回归SVM 支持向量机DT 决策树K-近邻NB 朴素贝叶斯NN 人工神经网络集成学习算法:基于Bagging和Boosting算法思想RF随机森林GBDTAdaboostXGBoost原创 2021-04-12 19:33:30 · 385 阅读 · 0 评论 -
03_机器学习流程_特征工程
二、特征工程(特征处理)特征工程是将原始数据转换为更好的代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测的准确性。1.环境配置安装scikit-learn步骤:(前提需要Numpy,Pandas库)sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose测试是否安装成功~from原创 2021-04-12 19:26:10 · 264 阅读 · 0 评论 -
02_机器学习流程_数据获取
机器学习流程_数据的获取这一节回顾机器学习的数据获取流程。1.数据集的构成机器学习的数据通常不是数据库,而是文件csv,由于mysql存在性能瓶颈,读取速度不能满足要求,且格式不符合机器学习数据格式要求。1.1可用数据集数据集网址:kaggle网址:(还有比赛)美国大学协会uci网址:scikit_learn网址:1.2 常用数据集结构1.3 数据集的划分机器学习一般的数据集会划分为两个部分:训练数据(用于训练,构建模型)、测试数据(在模型检验中使用,用于评估模型是否有效)# s原创 2021-04-12 08:52:39 · 613 阅读 · 0 评论 -
01_机器学习概述
机器学习概述机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务。有三种主要类型的机器学习:监督学习、非监督学习和强化学习,所有这些都有其特定的优点和缺点。当训练样本带有标签时是有监督学习;训练样本部分有标签,部分无标签时是半监督学习;训练样本全部无标签时是无监督学习。迁移学习就是就是把已经训练好的模型参数迁移到新的模型上以帮助新模型训练。强化学习是一个学习最优策略(polic原创 2021-04-12 08:39:27 · 499 阅读 · 0 评论