
机器学习
liovo先生
这个作者很懒,什么都没留下…
展开
-
使用K-Means算法划分亚洲国家的三个足球梯队
**数据:asina_football_data.csv数据描述: id :国家对应id 国家:国家名称 2019年国际排名:2019 年国际足联的世界排名。 2018年世界杯:2018 年世界杯中,很多球队没有进入到决赛圈,所以只有进入到决赛圈的球队才有实际的排名。如果是亚洲区预选赛 12 强的球队,排名会设置为 40。如果没有进入亚洲区预选赛 12 强,球队排名会设置为 50。 2015年亚洲杯:真是排名。**训练模型基本流程及对应要求:1、获取数据:使用pandas读取数据原创 2020-06-13 00:04:10 · 1759 阅读 · 0 评论 -
朴素贝叶斯分类【垃圾邮件检测】
**训练模型基本流程:获取数据:pandas读取数据;数据分析:;数据处理:数据预处理,划分得到训练集测试集;模型训练与测试:调用sklearn.naive_bayes;模型评估:使用【f1】评估模型**问题描述:根据邮件文本数据预测该邮件是否为垃圾邮件。使用朴素贝叶斯分类器。数据集:“spam_data.txt”(7148条数据)其中垃圾邮件:960条,非垃圾邮件:6188条。数据描述:一共7148条样本,分类标签为{0, 1}分别表示,否和是。基于文本数据,判定邮件是否为垃圾邮件原创 2020-06-12 23:55:11 · 2621 阅读 · 3 评论 -
从疝气病症预测病马是否能够存活
问题描述:从疝气病症预测病马是否能够存活,可以使用GBDT或者XGBoost。数据集: 训练集:“horseColicTrain.txt”(299条) 测试集:“horseColicTest.txt”(67条)数据描述:一共366条样本,其中21个特征表现为疝气病症相关特征,分类标签为{-1, +1}分别表示,死亡和存活。基于21和疝气病症相关个特征,预测病马是否能够存活。部分数据如下:获取数据:使用pandas读取数据,分别读入训练集和测试集;# 1、读取文件, 并将数据分为训练集原创 2020-06-12 22:40:19 · 1473 阅读 · 1 评论 -
使用K-Means完成图像分割(将图片转换为灰度图片)
from sklearn.cluster import KMeansfrom sklearn import preprocessingfrom PIL import Imageimport matplotlib.pyplot as pltimport numpy as npdef load_data(filename): # 加载图像,并对数据进行规范化 # 读文件 f = open(filename, 'rb') data = [] # 得到图像的像素原创 2020-05-21 11:33:43 · 782 阅读 · 0 评论 -
基于数据kmeans_data分析聚类画图 使用sc轮廓系数作为评价指标
1、基于python实现K-Means迭代停止的条件:a、簇中a心相较b上一次迭代未改变 ≈ 所有样本点较上一次迭代未改变划分类别b、达到人为设置的最大迭代次数2、 基于sklearn实现K-Means语法:from sklearn.cluster imports KMeansmodel = KMeans(n_clusters=k)model.fit(data)y_pred = model.predict(data)属性:cluster_centers_:簇中心【数组】centro原创 2020-05-21 09:55:52 · 1855 阅读 · 0 评论 -
Bagging(基学习器可选KNN和决策树)算法,及网格化调参(GridSearchCV) 问题:对玻璃类型进行分类
import pandas as pdfrom sklearn.ensemble import BaggingClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.linear_model import LogisticRegressionfrom sklearn.neighbors import KN...原创 2020-05-21 09:28:43 · 2641 阅读 · 0 评论 -
使用决策树算法评估汽车等级
首先安装号第三方库,绘图软件不需要配置环境变量数据:car.data数据描述:1728条数据(6个特征+评估等级(4个级别)) 特征:[‘buying’, ‘maint’,‘doors’,‘persons’,‘lug_boot’,‘safety’] 标签:[‘unacc’,‘acc’,‘good’,‘v-good’],训练模型基本流程及对应要求:0、使用的第三方库1、获取数据:读取数据2、数据处理:字符型特征转换(from sklearn.preprocessing impo原创 2020-05-19 15:29:16 · 3788 阅读 · 0 评论