- 博客(5)
- 收藏
- 关注

原创 2017秋季数据挖掘、大数据相关职业于北上广深的职位需求报告
俗话说金9银10,秋季无论对校园招聘、社会招聘的求职者都是一个很不错的时机,我对这类问题比较感兴趣,就专门开了一个如上的项目。针对国内的超一线城市:北京、上海、广州、深圳,从国内的大型招聘网站分别于9、10、11月采集了有关数据挖掘、大数据相关的近25900条职位信息以及其他25个岗位近264100条职位信息,来看看这段时间的人才需求状况,也对各位对数据职业感兴趣的朋友们提供些相关的信息。
2017-12-25 20:33:11
5644
5
原创 pandas数据框,统计某列或者某行数据元素的个数
在《pandas数据框,统计某列数据与其他文件对应关系的个数》之后,我发觉简单版的元素个数统计问题没有说清楚,就在这里介绍两个统计pandas数据框里面列、行元素个数的方法:代码如下:import pandas as pdimport numpy as npdf = pd.DataFrame(np.zeros((8,4)))#新建一个数据框df.iloc[2:6,0]=1#将第0列的第3行...
2018-05-23 10:02:55
75979
6
原创 pandas 添加最大值的列名
在我们处理表格数据的时候,有时候只有几个列和其对应的个数,我们想得到这几个列里面最大值的列名,该怎么做呢?数据样式:我的解决方式是对每一行进行处理,再用pandas里面的apply函数#!/bin/python#-*-coding:UTF-8-*-import osfrom sys import argvimport pandas as pdimport numpy
2018-01-10 10:33:06
4866
原创 pandas数据框,统计某列数据与其他文件对应关系的个数
现在要解决的问题如下:我们有一个数据的表第7列有许多数字,但是数字又有一个对应的关系:我们要得到第7列对应关系的统计,就是每一行的第7列a有多少个,b有多少个好了,我给的解决方法如下:#!/bin/python#-*-coding:UTF-8-*-import pandas as pdimport numpy as npdfid
2017-09-12 15:30:26
8434
原创 小工具:得到目标文件夹中文件名 python
在Windows 系统里面,如果一个文件夹下面的文件太多,我又想得到文件列表,怎么办呢?可以用一下我下面的Python小工具:#!/bin/python#-*-coding:UTF-8-*-#filename: get_name_Aug17.pyimport osfrom sys import argvfiles1 = []for f in os.listdir(argv[1
2017-09-07 09:47:27
373
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人