
数据分析
快乐的打字员
快乐地输出,输出快乐
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas的dataframe转spark的dataframe 互转
pandas的dataframe转spark的dataframe spark的dataframe转pandas的dataframe pandas的dataframe和spark的dataframe互转 dataframe互转原创 2021-01-12 14:05:07 · 1209 阅读 · 0 评论 -
聚类分析上证50成分股
2020年3月10日是个划时代的日子,在全球主要市场一片惨淡的时刻,我们的大A终于走出了独立行情。 为了纪念这一天,我决定用EM聚类算法对上证50的成分股做一次聚类,将其划分为十类。 然后,我将从每类中随机选一只,打包一个投资组合,以上帝视角回测一下,PK一下ETF指数基金。 数据为10日收盘时,50只成分股收盘时的涨跌幅、成交额、大单流入额等指标。 数据加载 原始数据我已经清洗完毕...原创 2020-03-11 17:56:17 · 1155 阅读 · 0 评论 -
数据分析方法论-不同的分析阶段
根据实际业务发展,针对产品的不同生命周期,数据分析的角度和策略是不同的。 按阶段可有如下分析角度:描述型分析、诊断型分析、预测型分析和策略型分析。 ...原创 2020-03-22 19:27:02 · 652 阅读 · 0 评论 -
主数据和元数据的概述
企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。以下主要讨论主数据、元数据的概念及应用。 主数据和主数据管理的概念 企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。 主 数 据 (masterdata)指 在 企 业 范 围 内跨 部 ...转载 2020-02-15 22:23:46 · 3476 阅读 · 0 评论