
数据分析
YEGE学AI算法
From Zero To Hero!
展开
-
数据分析08-金融领域数据分析
数据分析-08金融领域数据分析示例1. 移动均线3. 布林带1)什么是布林带2)布林带的业务指标与含义3)绘制布林带基于函数矢量化的股票回测模型金融领域数据分析示例1. 移动均线移动均线(Moving Average,简称MA)是用统计分析的方法,将一定时期内的证券价格(指数)加以平均,并把不同时间的平均值连接起来,形成一根MA,用以观察证券价格变动趋势的一种技术指标。移动平均线是由著名的美国投资专家Joseph E.Granville(葛兰碧,又译为格兰威尔)于20世纪中期提出来的。均线理论是当今应原创 2020-07-01 10:45:38 · 2291 阅读 · 1 评论 -
数据分析07-数据清洗、矩阵、数学建模
数据分析-07数据分析-07扩展:数据清洗检测与处理重复值检测与处理缺失值检测与处理异常值矩阵1. 矩阵对象的创建2. 矩阵的乘法运算3. 矩阵的逆矩阵4. ndarray提供的矩阵API5. 矩阵应用数学建模1. 线性模型线性拟合2. 多项式模型3. 基于函数矢量化的股票回测模型数据分析-07扩展:数据清洗检测与处理重复值pandas提供了一个名为drop_duplicates的去重方法。该方法只对DataFrame或者Series类型有效。这种方法不会改变数据原始排列,并且兼具代码简洁和运行稳定原创 2020-06-30 15:17:35 · 2452 阅读 · 0 评论 -
数据分析06-五个pandas可视化项目
数据分析-06)数据分析-06pandas可视化基本绘图Series数据可视化DataFrame数据可视化高级绘图项目:分析影响学生成绩的因素项目:泰坦尼克号生存人员数据分析与可视化项目:movielens电影数据分析与可视化项目:二手房源信息数据分析与可视化项目:电信流失用户数据分析与可视化扩展:数据清洗检测与处理重复值检测与处理缺失值检测与处理异常值数据分析-06pandas可视化基本绘图Series数据可视化Series提供了plot方法以index作为x,以value作为y,完成数据可视化原创 2020-06-29 11:23:09 · 3734 阅读 · 1 评论 -
数据分析05-matplotlib基本绘图、高级绘图
数据分析-05数据分析-05matplotlib基本功能详解基本绘图1)绘图核心API2)设置线型、线宽3)设置坐标轴范围4)设置坐标刻度5)设置坐标轴6)图例7)特殊点8)备注高级绘图1)子图2)散点图3)填充4)条形图(柱状图)5)直方图扩展:随机数模块与概率分布二项分布(binomial)超几何分布(hypergeometric)正态分布(normal)6)饼图pandas可视化基本绘图Series数据可视化DataFrame数据可视化高级绘图数据分析-05matplotlib基本功能详解基本绘原创 2020-06-28 10:23:35 · 753 阅读 · 0 评论 -
数据分析04-pandas(apply函数、排序、数据合、分组聚合、透视表、交叉表及项目分析)
数据分析-04排序数据合并concatmerge & join分组聚合透视表与交叉表项目:分析影响学生成绩的因素apply函数pandas提供了apply函数方便的处理Series与DataFrame;apply函数支持逐一处理数据集中的每个元素都会执行一次目标函数,把返回值存入结果集中。:# series.apply()ary = np.array(['80公斤','83公斤','78公斤','74公斤','84公斤'])s = pd.Series(ary)def func(x):原创 2020-06-28 09:53:45 · 1214 阅读 · 0 评论 -
数据分析03-(数值型描述统计及项目分析)
数据分析-03处理普通文本处理JSON数值型描述统计(统计学)算数平均值加权平均值最值中位数频数与众数四分位数标准差宏观数值统计协方差、相关矩阵、相关系数项目:保健品消费情况特征描述性统计分析相关性系数排序数据合并concatmerge & join处理普通文本读取文本:read_csv() read_table()方法参数参数解释filepath_or_buffer文件路径sep列之间的分隔符。read_csv()默认为为’,’, read_table()默原创 2020-06-23 17:58:14 · 1036 阅读 · 0 评论 -
数据分析02-(pandas介绍、jupyter notebook)
数据分析-02数据分析-02pandaspandas介绍pandas核心数据结构SeriesDataFrame核心数据结构操作复合索引Jupyter notebook数据加载处理普通文本处理JSON数值型描述统计算数平均值加权平均值最值中位数频数与众数四分位数标准差宏观数值统计数据分析-02基于numpy的电信流失用户初步数据分析。import numpy as npimport matplotlib.pyplot as mpdef loadtxt(): """ 读取csv原创 2020-06-22 12:05:04 · 801 阅读 · 0 评论 -
数据分析01-(numpy概述及使用)
数据分析-01数据分析numpynumpy概述numpy`历史`numpy的核心:多维数组numpy基础ndarray数组内存中的ndarray对象ndarray数组对象的特点ndarray数组对象的创建ndarray对象属性的基本操作ndarray对象属性操作详解ndarray数组维度操作ndarray数组索引操作多维数组的组合与拆分ndarray类的其他属性数据分析什么是数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程原创 2020-06-20 10:02:31 · 478 阅读 · 0 评论