- 博客(26)
- 收藏
- 关注
原创 泰坦尼克
# coding: utf-8# In[25]:import osimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt# In[26]:plt.rcParams['axes.unicode_minus'] = False #允许坐标轴上显示负数plt.rcParams['font.s...
2018-09-07 22:17:02
523
原创 杭州数据分析师
# coding: utf-8# ## 目录# * 连接数据库# * 获取job表及company表的信息并进行清洗# * 分析职位工资# * 分析职位所处行业# * 分析学历、工作经验与工资的关系# * 分析公司待遇、位置及招聘要求# In[50]:#导入所用模块import pandas as pd#读取数据库from sqlalchemy import cr...
2018-09-07 20:08:34
515
原创 python问题
argsort函数是Numpy模块中的函数:返回的是数组值从小到大的索引值如:>>> x = np.array([3, 1, 2]) >>> np.argsort(x) array([1, 2, 0])
2018-06-11 17:04:00
219
转载 Python 中改变和获取当前工作目录
import osos.chdir("目标目录") #修改当前工作目录os.getcwd() #获取当前工作目录
2018-06-11 14:00:21
4526
转载 数据竞赛参考
https://www.zhihu.com/question/30494274/answer/59199678https://blog.youkuaiyun.com/bryan__https://github.com/wepe020优惠券:https://tianchi.aliyun.com/competition/information.htm?spm=5176.11165320.5678.2.45b92e...
2018-06-09 16:57:16
309
转载 如何将多个excel文件合成一个文件
https://zhidao.baidu.com/question/96195372.html1.需要把多个excel表都放在同一个文件夹里面,并在这个文件夹里面新建一个excel。2.用microsoft excel打开新建的excel表,并右键单击sheet1,找到“查看代码”,单击进去。进去之后就看到了宏计算界面。3.然后把下面这些宏计算的代码复制进去,然后找到工具栏上面的“运行”下的“运行...
2018-05-21 12:24:18
11549
原创 python数据分析小练习----科赛
https://www.kesci.com/apps/home/project/5a8afe517f2d695222327e14 练习1-开始了解你的数据步骤6 数据集中有多少个列(columns):chipo.shape[1]步骤9 被下单数最多商品(item)是什么:chipo.item_name.value_counts().head(1) value_counts 默认从大到小排序步骤1...
2018-04-19 15:42:03
8429
原创 数据可视化-------excel
数据可视化(1) 常见图表类型与应用1. 散点图:散点图、气泡图、单轴散点图 2. 折线图:折线图、面积图 3. 柱形图:柱形图、直方图4. 饼图5. 漏斗图6. 雷达图 (2) 高级图表类型与应用1. 树形图2. 桑基图3. 热力图4. 关系图5. 箱线图6. 标靶图...
2018-04-19 10:50:56
607
原创 MySQL
1. as……:起别名。字段,表,子查询都可以起别名。在select中起别名之后,在当前select子句不能使用别名,在非当前select子句可以使用。2. 子查询:子查询后相当于一个新表。 ① 起别名后,在当前select子句中不能使用别名,可在外套一个select再用,子查询可命名为t。如:应用case….时,要使用别名只能在外套一个select。 ...
2018-04-19 10:41:56
209
原创 excel总结
Excel函数:(1)文本清洗类 (2)关联函数类 (3)逻辑运算类 (4)计算统计类 (5)时间序列类 (1) 文本清洗类Find() left() right() MID() &(拼接,=concatenate()) 替换(=repl...
2018-04-18 20:18:53
1193
原创 正则表达式
正则表达式常用: \d:匹配任意数字,等价于[0,9] *:匹配0个或多个的表达式 +:匹配1个或多个的表达式 ?:匹配0个或1个由前面的正则表达式定义的片断,非贪婪方式 .:出\n之外的任意字符 .*:非懒惰模式 .*?:懒惰模式 ^:匹配字符串开头 $:匹配字符串末尾 re.S:'.'匹配包括换行在内的所有字符后边多一个?表示懒惰模式...
2018-04-05 11:51:05
150
转载 草稿
python strip()函数 去空格\n\r\t>>> a = ' 123'>>> a.strip()'123'>>> a='\t\tabc''abc'>>> a = 'sdff\r\n'>>> a.strip()'sdff'import json data = {'username':'李华',
2018-04-05 11:38:54
149
原创 爬《针锋对决》
from bs4 import BeautifulSoupimport reimport requests,sysclass downloader(object): #定义一个类(包含属性和方法) def __init__(self): self.urls = [] #链接数 def get_pageone_content(self): #获得第一...
2018-04-02 21:13:24
15558
转载 爬小说
from bs4 import BeautifulSoupimport requests,sysclass downloader(object): #定义一个downloader类 def __init__(self): #当前类的实例 self.server = 'http://www.biqukan.com/' self.target = '...
2018-04-02 17:14:22
674
原创 列表
for循环和while循环里的else,是执行完for循环和while循环后,再执行else里的代码块不同于if.....else...中选择其中之一进行执行列表a=[1,2,3]a.append() a.insert() a.pop() a.remove() 等列表在执行方法后,列表id不变,但列表里变化的内容的id变了所以返回值仍用 print(a)...
2018-02-23 14:41:34
151
原创 eval函数
a = input('please enter your info:')b = eval(a)print(type(b))若不用eval()函数,则所有结果都为字符串,eval()可以去掉' '
2018-02-23 12:19:06
300
原创 name 'k' is not defined
k = float(input(k))e = 0.0041859*k没有对k设置初始值,提示name 'k' is not defined改为:k = float(input(‘plaese enter your height:’))e = 0.0041859*kinput()中若已有内容,则会相当于用print()一样先将内容print出来,而后input()发挥作用,输入值后返回的是字符串。如...
2018-02-21 12:04:57
4326
原创 美国国旗
import turtle #快速绘图turtle.speed(10)#绘图速度 turtle.penup()#隐藏画笔画出的线 def draw_bluerectangle(start_x,start_y,len_x,len_y):#画蓝色框 turtle.goto(start_x,start_y) turtle.color('black') turtle.fillcolor('blue')...
2018-02-17 11:29:21
1378
原创 第一次爬虫
from bs4 import BeautifulSoupimport requestsimport timedef get_item_info(url): #如何从详情页里面要爬取的内容 #url = 'http://zhuanzhuan.58.com/detail/958892567109058567z.shtml?fullCate=5%2C38484%2C23094&am...
2018-02-10 17:48:00
268
转载 find_all
在爬取网页中有用的信息时,通常是对存在于网页中的文本或各种不同标签的属性值进行查找,Beautiful Soup中内置了一些查找方式,最常用的是find()和find_all()函数。 同时通过soup.find_all()得到的所有符合条件的结果和soup.select()一样都是列表list,而soup.find()只返回第一个符合条件的结果,所以soup.find()后面可以直接接.text...
2018-02-08 16:56:25
808
原创 IndentationError: unindent does not match any outer indentation level
代码对齐中,混用tab 和 空格键,python不支持
2018-01-28 14:04:43
182
原创 最近的收获
1.今天准备了将近两个月的BEC出成绩了,差五分及格,最后只拿到了B2。口语成绩大大出乎我的意料,竟然这么低!虽然搭档不算太给力,但自己还没尽全力是主要方面。2.我有一个毛病,也算优点,比如看论文的时候看到一个我不懂或不了解的知识点,我就会去查资料,书上、网上、各大论坛一通找,但在这个过程中我又会碰到很多我不了解的知识点,导致整个过程消耗了我相当长的时间,而且结合找到的资料再回过头思考,我可能
2017-12-16 20:51:46
142
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人