
机器学习
文章平均质量分 50
努力的小航子
这个作者很懒,什么都没留下…
展开
-
sklearn数据集
数据集的划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 数据集划分API:sklearn.model_selection.train_test_split #example li = load_iris() #sklearn.model_selection.train_test_split(*arrays, **options) #x 数据集的特征值 #y 数据集的标签值 #test_size原创 2022-02-25 10:12:55 · 684 阅读 · 0 评论 -
机器学习概述
机器学习算法分类 1、监督学习 输入数据有特征有标签,即有标准答案 可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。 分类 k-近邻算法、贝叶斯分类、决策树与 随机森林、逻辑回归、神经网络 回归 线性回归、岭回归 标注 隐马尔可夫模型 (不做要求) 2、无监督学习 输入数据有特征无标签,即无标准答案 可以由输入数据中学到或建立一个模型,并依此模式推测新的结原创 2022-02-25 09:37:09 · 879 阅读 · 0 评论 -
特征工程。
sklearn特征抽取API #sklearn.feature_extraction 字典特征抽取 #类:sklearn.feature_extraction.DictVectorizer DictVectorizer(sparse=True,…) DictVectorizer.fit_transform(X) #X:字典或者包含字典的迭代器 #返回值:返回sparse矩阵 DictVectorizer.inverse_transform(X) #X:array数组或者sparse矩原创 2022-02-24 17:18:10 · 748 阅读 · 0 评论