- 博客(10)
- 收藏
- 关注
原创 在Anaconda3中安装wordcloud库
step1: 去官网下载wordcloud库官网地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud首先要明确自己的python版本和win版本。本宝宝是python3.7(所以是cp37),win64,因此点击上图红框链接下载(很快就下好了)。step2: 确定下载到的文件夹因为anaconda所有的package都在F:\A...
2020-03-22 14:37:54
8443
4
原创 pandas数据抽取 - 思维导图
一、pandas数据抽取1. Seriess=pd.Series([1,2,3,4])s'''0 11 22 33 4dtype: int64'''#提取多行:s[0:2] #不可用双括号s[[0,1,2]] #不可用单括号'''0 11 2dtype: int64-------------0 11 22...
2020-03-20 22:03:17
410
原创 Pandas中DataFrame修改index、columns名, Series修改index名
常用两个方法:1、使用DataFrame.index = [newName],DataFrame.columns = [newName]#定义一个dataframedict={ 'name':['张三','李四','王五','赵六'],#一列,key为列标签(列索引)。 'sex':['男','男','男','女'], 'age':[18,19,20,21]#不同列的...
2020-03-20 17:25:34
5383
原创 numpy和pandas
1. Pandas - 排序函数sort_values()按照索引(y轴数据标签)排序:by='index', axis=1按照某列排序:by='列', axis=0(axis默认为0)参考文章-有例子2. 中英文的逗号一定要区分开,erro往往来源于此3. Pandas中stack()和unstack(level=0/-1)的形象理解stack是“堆,叠”意思。常见的数据的层...
2020-03-20 16:48:08
242
转载 Hive中存在的数据倾斜问题
真是好久没写博客了。。。趁着今天休息,把以前遇到的问题整理一下吧。互联网中的数据量通常会很大,比如埋点数据。。。因此在日常数据处理中就会遇到数据倾斜的问题,就是那种跑半天跑不出数据或者red...
2020-03-20 10:45:08
317
原创 解决'tuple' object is not callable的报错-python变量命名错误
1. 变量命名要避python内置函数的名字初学python,很容易犯这样的错误,即直接用set, list, tuple, dict, str, int, complex, float等作为变量名。这样会导致这些内置函数:set(), list(), tuple()等等无法执行。例如下例,使用tuple作为变量名,再执行tuple()语句时,会报错 ‘tuple’ object is not...
2020-03-16 17:55:29
24067
转载 SAS data步的操作技能点_2(去重)
1、删除主键有重复的行 nodupkey只要BY主键的值相等,不管其他值是否相等,一律删除data test3;input id1 $ id2 $ extra ;cards;aa ab 3aa ab 3aa ab 2aa ab 1;p...
2020-02-25 13:44:12
3039
原创 SAS语法
1. Use a library to read SAS filelibname libref base "path";proc contents data=libref.table_name;run;libname libref clear;1. Use a library to read EXCEL fileoptions validvarname=V7;libname ...
2020-02-24 09:57:29
2837
原创 Python语法更新
1. 不可变的数据类型,不能赋值Python3 中有六个标准的数据类型:、Number(数字)String(字符串)List(列表)Tuple(元组)Set(集合)Dictionary(字典)Python3 的六个标准数据类型中:不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);可变数据(3 个):List(列表)、Dictionar...
2020-02-19 11:06:58
385
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人