
数据分析与挖掘
文章平均质量分 81
无敌的白金之星
这个作者很懒,什么都没留下…
展开
-
数据分析与挖掘入门——学习笔记(四)利用NumPy进行历史股价分析
利用NumPy进行历史股价分析该练习使用的csv文件如下: 其中第二列为日期,格式是%d-%m-%Y;第四到七列分别是当日开盘价,最高价,最低价,收盘价和成交量 准备工作:import sysimport numpy as np# 读入文件,函数是loadtxt# 第一个参数是文件名,delimiter是获取的数据的分隔符,usecols是指定读取哪列的数据,unpack为...原创 2018-08-22 10:55:07 · 855 阅读 · 1 评论 -
数据分析与挖掘入门——学习笔记(九)Pandas高级操作
缺失值处理对于获取到的数据,总会有一些是缺少的,如果这些缺少的数据对于我们的接下来的工作无关紧要,就可以直接舍弃;而有作用的就要应该补齐。我们使用一些电影数据来说明接下来的操作,先看看电影数据的结构import pandas as pd# 读取电影数据movie = pd.read_csv("data/IMDB/IMDB-Movie-Data.csv") index ...原创 2018-09-17 15:59:42 · 1246 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(三)numpy的基本函数使用
numpy的基本函数使用1 通用函数汇总 示例:from numpy.random import randnimport numpy as nparr = np.arange(10)np.sqrt(arr) # 数组开方# array([ 0. , 1. , 1.41421356, 1.73205081, 2. ,...原创 2018-08-21 12:28:23 · 533 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(七)Pandas简介与其数据结构
1 Pandas介绍1.1 Pandas介绍2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 以Numpy为基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构1.2 为什么使用PandasNumpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pan...原创 2018-08-23 17:30:46 · 314 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(二)numpy的基本使用
Numpy的基本使用1 numpy的运算速度用python实现的向量相加def pythonsum(n): a = [i for i in range(size)] b = [i for i in range(size)] c = [] for i in range(len(a)): a[i] = i ** 2 b[i...原创 2018-08-20 22:17:38 · 369 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(六)matplotlib的常用图表
matplotlib的常用图表常见图形种类及意义折线图:以折线的上升或下降来表示统计数量的增减变化的统计图 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。 特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)柱状图:排列在工作表的列或行中的数据可以绘...原创 2018-08-23 16:43:10 · 631 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(五)Matplotlib的简介、折线图与基础绘画功能
一 Matplotlib的简介1.1 什么是Matplotlib专门用于开发2D图表(包括3D图表)使用起来及其简单以渐进、交互式方式实现数据可视化1.2 为什么要学习Matplotlib可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力1.3 实现一个简单的Ma...原创 2018-08-23 14:46:20 · 941 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(一)python中常见的各种数学,字符串符号以及函数
python常用数学函数常用随机函数常用三角函数常见数学常量常见转义字符字符串格式化原创 2018-08-20 15:36:28 · 923 阅读 · 0 评论 -
数据分析与挖掘入门——学习笔记(八)Pandas基本操作、运算、画图和IO操作
一、基本操作为了更好的理解这些基本操作,我们将读取一个真实的股票数据。关于文件操作,后面在介绍,这里只先用一下API# 读取文件data = pd.read_csv("./stock_day/stock_day.csv")# 删除一些列,让数据更简单些,再去做后面的操作data = data.drop(["ma5","ma10","ma20","v_ma5","v_ma10&qu原创 2018-08-26 16:43:58 · 608 阅读 · 0 评论