- 博客(17)
- 收藏
- 关注
原创 matplotlib 常用技巧
matplotlib 常用技巧import matplotlib.pyplot as plt#%matplotlib inline #jupyter可用,在页面上直接展示图片,不用plt.show()from matplotlib.font_manager import FontProperties# 解决中文显示乱码问题font = FontProperties(fname=r"C:\Windows\Fonts\simhei.ttf", size=16)#plt.rcParams['font
2020-07-20 12:05:18
134
原创 ubuntu 中文显示乱码
vi /etc/environment可以看到:PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games"添加:LANG=“zh_CN.UTF-8”LANGUAGE=“zh_CN:zh:en_US:en”
2020-03-17 17:31:02
184
原创 re的一些用法总结
import restring = 'sdv-sn(zdgn)'# 将‘?.,:\-[];/*()\\、,。;:【】()?’这些字符替换为 ‘ ’空字符串re.sub('[?.,:\-\[\];/*()\\\、,。;:【】()?]',' ',string)...
2020-03-04 15:51:18
374
原创 vim 显示行号、语法高亮、自动缩进、自动补全、代码中文注释
在root文件夹下,创建 .vimrc 文件,输入下列代码保存即可 1 set number 2 filetype on 3 set history=1000 4 set nocompatible 5 set shiftwidth=4 6 syntax on 7 set autoindent 8 set smartindent 9 set tabstop=4 ...
2020-03-04 15:28:58
299
原创 xpath用法
属性包含特定属性值#选择class属性包含"expire"的div"//div[contains(@class,'expire')]"#选择class属性不包含"expire"的div"//span[not(contains(@class,'expire'))]"获取同级节点1、child 选取当前节点的所有子元素 2、parent 选取当前节点的父节点 3、descendant...
2020-03-04 15:04:06
218
原创 Html 页面信息抽取
from lxml import etree# 读取html或htm文件with open(path) as f: a = f.read()# 解析页面元素结构selector=etree.HTML(a)# 用xpath获取元素位置上的文字title = selector.xpath('//head/title/text()')[0].split()[0]...
2020-02-20 15:45:12
397
原创 常用pandas操作
pandasimport pamdas as pd# 处理列数据,并增加到新的字段。也可覆盖之前的列。df['列名2'] = df['列名1'].map(lambda x: re.sub('[a-zA-Z()()-]','',re.sub('\(.*\)','',x)) )# 筛选符合条件的数据df[df['列名1'].map(lambda x:False if x in list1...
2019-12-27 14:06:07
122
原创 常用Linux命令
cp -ef | grep python #查看有关Python的进程nvidia -smi #查看NVIDIA GPU配置信息
2019-12-27 10:19:46
84
原创 数据源
语音数据中文:英文:文本数据中文:英文:图片数据股票、期货、基金、债券、外汇、区块链数据ToShare数据 含Python,R,Matlab,HTTP接口。聚合数据 含各行业数据接口。聚宽数据JoinQuant 含各种数据接口。BaoStock数据 支持Python3.5以上...
2019-12-04 09:48:12
177
原创 文件名后跟时间后缀
import datatime# 文件名后跟时间后缀time = datetime.datetime.today()time_list = list(time.utctimetuple())[:-3]save_path = './dict/dict_'+''.join([str(i).zfill(2) for i in time_list]) +'.csv'# 读取最新时间后缀的文件...
2019-11-29 14:50:04
908
原创 身份证号可获取的信息
身份证号可获取的信息居民初次登记户籍所在地、出生日期、性别公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。身份证前6位数字表示的是户籍所在地。其中1、2位数为各省级的代码,3、4位数为地、市级的代码,5、6位数为县、区级代码。5718个归属地代码下载链接身份证倒数2至4位为同一地址...
2019-11-21 15:56:12
610
原创 有关字典的一些函数方法 python实现
有关字典的一些函数方法 python实现# 字典更新或添加键值def dict_update(dic,key,value): dic[key] = value # 字典删除键值对def dict_delete(dic,key): if dic.get(key): dic.pop(key)# 字典转csv表格,保存csvdef dict2csv...
2019-11-20 11:00:11
244
原创 LintCode 131. 大楼轮廓 python实现
题目描述(链接)水平面上有 N 座大楼,每座大楼都是矩阵的形状,可以用一个三元组表示 (start, end, height),分别代表其在x轴上的起点,终点和高度。大楼之间从远处看可能会重叠,求出 N 座大楼的外轮廓线。外轮廓线的表示方法为若干三元组,每个三元组包含三个数字 (start, end, height),代表这段轮廓的起始位置,终止位置和高度。输入:[[1, 3, 3],...
2019-08-26 16:03:26
391
原创 瞌睡 python实现
题目描述(链接)小易觉得高数课太无聊了,决定睡觉。不过他对课上的一些内容挺感兴趣,所以希望你在老师讲到有趣的部分的时候叫醒他一下。你知道了小易对一堂课每分钟知识点的感兴趣程度,并以分数量化,以及他在这堂课上每分钟是否会睡着,你可以叫醒他一次,这会使得他在接下来的k分钟内保持清醒。你需要选择一种方案最大化小易这堂课听到的知识点分值。输入描述:第一行 n, k (1 <= n, k &l...
2019-08-23 10:27:29
187
原创 Leetcode 1044.最长重复子串 python实现
题目描述(点我看原题)给出一个字符串 S,考虑其所有重复子串(S 的连续子串,出现两次或多次,可能会有重叠)。返回任何具有最长可能长度的重复子串。(如果 S 不含重复子串,那么答案为 “”。)示例 1:输入:“banana”输出:“ana”示例 2:输入:“abcd”输出:""思路: 遍历字符串s,如果字母x出现在s中多次,就查看这几个位置后面的字母是否还相同(这几个位置:字母x...
2019-08-22 16:42:23
2740
原创 斐波那契数列问题的递归和动态规划3 python实现
题目描述假设农场中成熟的母牛每年只会生 1 头小母牛,并且永远不会死。第一年农场中有一只成熟的母牛,从第二年开始,母牛开始生小母牛。每只小母牛 3 年之后成熟又可以生小母牛。给定整数 n,求出 n 年后牛的数量。原题链接输入描述: 输入一个整数 n。输出描述: 输出 n 年后牛的数量对 1e9 + 7 取模的值。示 例: 输入6 输出9斐波那契数列斐波那契数列详情可点这里斐...
2019-08-22 11:01:08
830
原创 接雨水2 python3实现
接雨水2 python3实现题目描述给出 n * m 个非负整数,代表一张X轴上每个区域为 1 * 1 的 2d 海拔图, 计算这个海拔图最多能接住多少(面积)雨水。例如,给定一个 5*4 的矩阵:输入: [[12,13,0,12],[13,4,13,12],[13,8,10,12],[12,13,12,12],[13,13,13,13]]输出: 14# 返回最小值下标def ...
2019-08-21 15:37:52
551
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人