
数据分析和可视化
分享python的pandas以及numpy的学习,而且包含数据的可视化
hufei_neo
算法里面的小学生,爱好技术,希望能与大家一起交流进步,每天进步一点点
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python pyecharts绘制桑基图(Sankey )
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图” 利用python的pyecharts绘制桑基图 1.node(所有节点) #形如 {'name': ' '} 2.link #形如 {'so...原创 2020-06-19 00:15:54 · 9559 阅读 · 2 评论 -
pandasql用sql一样的操作DataFrame
安装:pip install pandasql from pandasql import sqldf pysqldf = lambda q:sqldf(q,globals()) q=""" SELECT * from df """ data_end=pysqldf(q)原创 2019-10-15 16:23:33 · 542 阅读 · 0 评论 -
熟练掌握pandas的各种操作
pandas是python里面一款非常优秀的做数据分析与挖掘的包,也是所有的数据分析和挖掘从业人员最需要掌握的基本包 下面介绍pandas的基本操作 import pandas as pd import numpy as np 1. 读取数据 # 具体参数在spyder可以快捷键ctrl+i,在jupyter notebook可以快捷键shift+tab data=pd.read_exce...原创 2019-05-20 14:02:54 · 1139 阅读 · 0 评论 -
python怎么判断nan值
nan值不同于None,他的type是float,而None的type是NoneType 所以判断是否为nan import math x=float('nan') math.isnan(x) True 所以dataframe判断是否数据是否为nan, math.isnan(df['col1'][0]) 返回为True ...原创 2019-05-24 16:52:20 · 16621 阅读 · 0 评论 -
插入numpy二维以及三维的方法
1. np.c_[] >>> np.c_[np.array([1,2,3]), np.array([4,5,6])] array([[1, 4], [2, 5], [3, 6]]) >>> np.c_[np.array([[1,2,3]]), 0, 0, np.array([[4,5,6]])] array([[1, 2, 3...原创 2019-05-22 17:32:26 · 2239 阅读 · 0 评论 -
Numpy 中clip函数的用法
np.clip(a, a_min, a_max, out=None) a : array_like >>> a = np.arange(10) >>> np.clip(a, 1, 8) array([1, 1, 2, 3, 4, 5, 6, 7, 8, 8]) >>> a array([0, 1, 2, 3, 4, 5, 6, 7, 8,...原创 2019-06-26 13:30:23 · 786 阅读 · 0 评论 -
numpy多维数组取最大值的索引及前topk最大值的索引
主要介绍numpy的argmax,argsort函数,以及heapq库 # 返回最大值的索引 a = np.array([[6.8284258e-09, 5.7629350e-09, 7.4942248e-09,9.5846470e-11, 5.4229814e-14, 8.6114553e-15], [1.1742729e-09, 9.2132124e-10,...原创 2019-07-13 20:39:42 · 16200 阅读 · 2 评论 -
python读取dat文件
读取dat文件本想像这样 df_train=pd.read_table(r'C:\Users\admin\Desktop\game_test\game\apptype_train.dat', names=['s_no','deal_code','text'],sep='\t',encoding='utf-8') 不是报错就是文件读取数据量可能少了 像这样读取不会有问题的 f=open(...原创 2019-07-13 20:56:13 · 55993 阅读 · 6 评论 -
np.triu()的函数用法
Signature: np.triu(m, k=0) Docstring: Upper triangle of an array.(返回函数的上三角矩阵) np.triu([[1,2,3],[4,5,6],[7,8,9],[10,11,12]], -1) >>>array([[ 1, 2, 3], [ 4, 5, 6], [ 0, 8,...原创 2019-09-12 15:24:13 · 21064 阅读 · 7 评论