
数据分析 ---------
主要时用python做数据分析。涉及金融,游戏等。
E2.0
脱坑、脱坑
展开
-
Python_数据分析_序列模式和关联规则区别
区别 我从百度百科找到了这个 : 如果不知道啥是关联规则可以看看这篇博客,我们主要来对比着看看序列模式。 目的:关联规则研究一次事件中的项目组合。序列模式则是求解事件之间的时间关系。也就是后者多了一个一个时间标记,我们将二维的数据展开就是关联规则的数据了,反正都是一个客...原创 2020-02-11 21:35:35 · 1339 阅读 · 1 评论 -
Python_数据分析_关联规则和王者荣耀数据分析实战
如果同学不喜欢看理论,可以直接看后面王者数据分析的部分。 关联规则 如果不知道尿布和啤酒问题,建议百度百科,先有个大致的了解 我们找百度百科上面的例子来讲一下 tid是交易单号,后面每一纵列中1代表购买,0代表没买。 我们只需要明白 支持度==概率(只有这个支持度足够大,说明我们选出的集合买的人多,对于商家的价值也就越大) 置信度==条件概率(这是算关联程度的) ...原创 2020-02-11 17:11:58 · 4568 阅读 · 4 评论 -
Python_数据分析笔记
numpy reshape()改变数组的行列 flatten()讲多维数组转化为1维 shape()查看行列数 np.round()保留数组里数的小数点 数组的计算:支持四则运算(对应位置数组进行计算) axis对数组的维度进行区分 二维与三维数组进行计算:当三维axis的1和2与二位数组axis的0和1相同时,可以进行加和等运算 astype()转化浮点类型 替换数组里的值 demo:将大于...原创 2020-02-08 00:11:29 · 152 阅读 · 0 评论 -
Python_机器学习_sklearn笔记
人工智能低谷 硬件的计算能力 数据的大小 算法的发展 机器学习就是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。 数据集的构成 机器学习的数据:csv文件 MySQL: 性能瓶颈,读取速度遭到限制 格式不符合机器学习要求的格式 pandas:读取数据 读取速度快 numpy:真正的多线程,释放了GIL锁 scipy: sparse矩阵(节约内存,方便处理,用...原创 2020-02-09 23:56:48 · 176 阅读 · 0 评论 -
Python_机器学习_sklearn _5、PCA&&KMeans
from sklearn.decomposition import PCA from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score import pandas as pd import matplotlib.pyplot as plt # 读取四张表的数据 prior = pd.rea...原创 2020-02-09 23:55:22 · 148 阅读 · 0 评论 -
Python_机器学习_sklearn _4、逻辑回归
from sklearn.datasets import load_boston from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegression from sklearn.model_selection import train_test_split from skl...原创 2020-02-09 23:53:39 · 223 阅读 · 0 评论 -
Python_机器学习_sklearn _3、决策树和随机森林
from sklearn.feature_extraction import DictVectorizer from sklearn.model_selection import train_test_split,GridSearchCV from sklearn.tree import DecisionTreeClassifier,export_graphviz from s...原创 2020-02-09 23:52:57 · 238 阅读 · 0 评论 -
Python_机器学习_sklearn _1、数据处理(字典抽取、段落分词统计、文章分类、归一化、删除低方差的特征、标准化、主成分分析进行降维)
from sklearn.feature_extraction import DictVectorizer from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizer from sklearn.preprocessing import MinMaxScaler,Imputer,StandardScaler...原创 2020-02-08 23:43:03 · 501 阅读 · 0 评论 -
利用查找表的思想解决数据分类与缩减问题
问题:将0~360中任意一个数n,放入72个数组(每个数组的数组成员都为5个不同的数)中的一个。 我们可以先定义一个数组m[72],里面72个变量分别对应72个数组名,我们用n/5得到n对应的m数组中存储的数组名即m[n/5]. /////////////////////////////////////////////////////////////////////////////...原创 2018-10-17 16:44:11 · 131 阅读 · 0 评论