
数据分析
pillowss
这个作者很懒,什么都没留下…
展开
-
决策树分类
决策树分类燕尾花,因为练习的数据不太好找,就直接用燕尾花的数据来练习下· from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier import pandas as pd data = load_iris() data1 = pd.DataFrame(data=data.data,co.原创 2021-07-06 16:10:33 · 112 阅读 · 0 评论 -
多项式朴素贝叶斯对新闻的分类处理
from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB import pandas as pd from sklearn.datasets import fetch_20newsgroups # 获取数据 data1 = fetch_20newsgr原创 2021-07-06 10:39:41 · 124 阅读 · 0 评论 -
KNN分类练习
from sklearn.datasets import load_iris # 获取燕尾花数据 from sklearn.model_selection import train_test_split # 测试训练集划分 from sklearn.preprocessing import StandardScaler # 标准化模块 from sklearn.neighbors import KNeighborsClassifier # KNN 分类器 # 第一步获取数据 data = load_iris原创 2021-06-30 11:10:30 · 225 阅读 · 0 评论 -
线性回归分析
今天学习了数据分析中常用的两个模型 MSE (Mean Squared Error)叫做均方误差,公式如下 R2(R-Square)叫做决定系数,公式如下: 这个两个公式python中的sklearn直接调用就可以了,主要作用是检测,训练模型的准确率。其中mse的数值越小越准确,r2的值越接近1越准确。 为了练习,我就去网上随便爬点数据来测试下,考虑到单身,我去单身网爬点妹子吧! # 进行数据分析 import pandas as pd import numpy from matplotlib impo原创 2021-05-26 19:56:27 · 104 阅读 · 0 评论