
数据分析
TheBestKinlon
这个作者很懒,什么都没留下…
展开
-
机器学习三之数据收集
数据的来源:爬虫、买、实时数据、网上公开的数据集数据处理成指定的格式筛选数据输入模型,进行训练调优保存模型load开头的小数据集fetch开头的是大数据集make 本地数据集from sklearn.datasets import *#鸢尾花数据集data = load_iris()print(data)#获取的特征名print(data.feature_names)...原创 2019-11-26 10:13:06 · 737 阅读 · 0 评论 -
机器学习二之特征工程
特征工程更好的特征意味着更好的结果更好的特征意味着更简单的模型更好的特征意味这更强的鲁棒性特征预处理单个特征:归一化、标准化、缺失值处理多个特征:降维:PCA降维分类特征变量的提取字典特征提取from sklearn.feature_extraction import DictVectorizer#字典特征提取data = [ {'yun':'厚','shidu'...原创 2019-11-26 09:55:40 · 294 阅读 · 0 评论 -
机器学习一之基础知识点
机器学习的特点机器学习的基础特点是从数据中自动分析获得规律,并且利用获取的规律进行预测的算法。也就是说是一个分析数据,总结规律且通过规律去预测别的结果的过程。特征值与目标值个人总结:特征值就是一些事务的特征。目标值就是最终的结果。特征值会影响目标值,而目标值是特征值的最终归属。监督学习与非监督学习监督学习:有特征值有目标值非监督学习:有特征值无目标值训练集与测试集训练集(trai...原创 2019-11-25 19:57:24 · 1802 阅读 · 0 评论 -
Pandas的数据清洗、函数应用、排序
Pandas的数据清洗、函数应用、排序1、pandas数据清洗1-1 判断是否存在空值import pandas as pdimport numpy as np#新建一个df对象df1 = pd.DataFrame([np.random.randint(10,50,4),[1.1,2.2,3.3,]],columns=list('ABCD'))print(df1)如图所示.i...原创 2019-11-08 19:17:21 · 608 阅读 · 0 评论