机器学习
1.数据集的寻找
kaggle
uci
sklearn
1.加载数据集
sklearn.datasets
小规模
1.dataset.load_*();
大规模
2.dataset.fetch_(data_home=none)//后面跟地址
sklearn.datasets.load_iris()//加载并返回鸾尾花数据集
sklearn.datasets.load_boston()//加载并返回波士顿数据集.
获取大数据集
sklearn.datasets.fetch_ddadadadad(data_home=NOne,subset="all")
数据集返回值
datasets.base.Bunch
from sklearn.datasets import load_iris
def datasets_demo():
# sklearn数据集使用
# return None
iris = load_iris()
print("鸾尾花数据集:\n",iris)
print("查看数据集描述:\n",iris["DESCR"])
print("查看特征值的名字:\n",iris.feature_names)
print("查看特征值",iris.target_names)
if __name__=="__main__":
datasets_demo()
print()
2.数据集的划分
1.一部分用于训练,0一部分用于测试
sklearn.model_selection.train_test_split()
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():