
Python基础
cyber_1987
专注数据的数据分析师,以Python、VBA、Power query为主
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python:从文章内提取地址
前言:如何从文章内提取地址?方法有很多种,我这边提一个我的思路。1、整理一份标准地址库,至少包括以下几列:省、市、镇、街道、路。有人会说整理很难,没错,很难找到成熟的地址库(这种都是能卖Q的),通过政府官网可以获得的数据也仅仅是省、市、镇、街道/居委之类的,如果要整理成一份详尽的,难度很高。以上海为例,我主要是通过百度文库获得了一份相对来说比较全的地址库,但也仅仅是路和区的对应表,无法整理到镇或街道。所以我又在上海统计局官网中找到了居委会和区的对应表,经过多次整理获得一份相对比较准确的清单。2、原创 2020-06-22 16:49:14 · 3768 阅读 · 1 评论 -
Python:快速裁剪PDF页面
前言收到一份很大的pdf文档,想根据页数快速裁剪,但是没找到能够免费试用的软件(不是要vip就是要重置),所以就用Python的PyPDF2这个库。主要参考了https://blog.youkuaiyun.com/xingxtao/article/details/79056341自己稍微修改了一点代码from PyPDF2 import PdfFileReader, PdfFileWriterdef splitPdf(readFile, outFile, start_page, end_page):原创 2020-06-17 13:37:27 · 3132 阅读 · 1 评论 -
Python:调用百度地图和高德地图API获得信息检索结果
前言不管是百度地图还是高德地图api,在个人开发者认证完成之前的每日调用配额低得可怜,认证通过后每日可以在信息检索上,每日上限是30万,并发量可以达到50,所以必须认证!代码import requestsimport jsonimport openpyxldef get_bd_address(keyword): '''通过百度地图api获得信息''' url = 'http://api.map.baidu.com/place/v2/search?query=' + keywor原创 2020-05-25 16:49:44 · 1079 阅读 · 0 评论 -
Python:通过百度地图API快速获取路对应的行政区域
前言:最近在做地址标准化的工作,其中一项子任务就是要做地址库,根据内部数据结合前期从网上获取的地址库,计算获得一堆新的路名(未纳入地址库),接下来的工作就是要判断这个新的路名是否跨区域,如果不跨的话属于哪个区?一开始是通过百度地图一个个搜索的,但是架不住量太大(超过100个),而且后期有可能还会不断有新增。所以干脆用百度API的交叉路搜索,获取该路和其它所有路的交叉信息。以“浦东南路”为例,交叉路口就有900条记录,例如“洪山路与浦东南路交叉口”,把这些记录全部获取后筛选其中的“address”字段,也原创 2020-05-18 13:09:25 · 3177 阅读 · 0 评论 -
Python:自动检测是否双跨并断开wifi
前言双跨,也就是连接有线网的时候还连接着原创 2020-05-15 13:03:16 · 643 阅读 · 0 评论 -
Python:通过编虐娃数学题,学习多线程技术
前言:最近因大家都知道的原因,只能在家自学,之前打印的数学考卷存货不多了,所以想在电脑上编一个来代替(之前的数学考卷版本参考《Python:大班数学自动生成器》)。想了2个版本:第一个是利用pyqt5来做个GUI版本,但是苦于对GUI不熟,所以一直没成功;第二个版本则比较简单,使用了CMD的窗口,但是因为我比较虐娃,所以加了1分钟的倒计时,时间到了但还没做的话就本道题按0分处理。要加这个功能就...原创 2020-01-31 22:24:15 · 736 阅读 · 0 评论 -
Python:批量创建暗黑2的RR小号
前言:暗黑玩了17年,啥都玩过了,现在主要是休闲,平时也会编程做点小脚本,不过暗黑2的脚本从来没做过。RR的第一步是创建小号,但是重复劳动较多,所以想试试Python怎么实现。花了一个小时写了出来,相当于按键精灵,给大家分享一下(需要根据自己电脑的分辨率调整坐标)。1、需要在https://www.lfd.uci.edu/~gohlke/pythonlibs/安装pyHook,我安装的是p...原创 2020-01-23 14:08:59 · 2242 阅读 · 3 评论 -
Python:3个常用数据检验代码实现
常规库导入import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings("ignore")pd.options.display.max_columns = None #显示所有列pd.set...原创 2019-12-24 15:47:57 · 3253 阅读 · 0 评论 -
Pandas等库在Anaconda环境下打包巨大的解决方法
我的python是使用anaconda集成包的,虽然很方便,但是之前写的很多程序,因为pandas、openpyxl等库通过pyinstaller打包会出现很多奇葩问题,而且即使打包出来也会很大(有pandas的情况下大概200+M)。之前群里小伙伴有提示,通过虚拟环境可以解决这个问题,所以花了半天时间测试了各种情况,最终终于解决了这个问题。我今天总共测试了3种方法,参考了大量的博客,可能在别...原创 2019-11-18 14:17:55 · 5475 阅读 · 0 评论 -
Python:大班数学自动生成器
前言:儿子大班了,但是算数不随我,太差了,所以之前用Excel做了一个简易的20以内加减法自动生成器,但是有诸如范围不好确定、容易出现重复题目等问题,所以这次用Python遍了一个,以后还能扩展成乘法和除法,嗯,够用到小学一年级结束了~~import randomimport pandas as pd# sign_list = ['+', '-', '×', '÷']sign_list...原创 2019-10-09 21:32:23 · 724 阅读 · 1 评论 -
Python:科赛3道面试题
题目一:获得最大子数组:问题描述:给定一个整数数组,找到一个具有最大和的子数组,返回其最大和。样例:给出数组[-2,2,-3,4,-1,2,1,-5,3],符合要求的子数组为[4,-1,2,1],其最大和为6。def max_sub(arr): max_sub_list = [] for i in range(len(arr)): if i == 0: ...原创 2019-08-18 10:39:12 · 343 阅读 · 0 评论 -
Python:批量修改文件夹和文件的名称
前言:同事有个需求,需要批量修改文件夹和文件的名称,具体需求如下:1、有个母文件夹,里面有8个分局子文件夹(名字确认,不需要修改);2、每个分局子文件夹下面还有很多门店子文件夹(有些名字对,有些名字有问题需要修改),标准名称应该是“上海电信-浦东-” + “门店名称”;3、每一个门店子文件夹里还有5张图片,有些图片名字有问题,可能是“1.jpg”,需要改成标准格式应该是“1门店文件夹名称....原创 2019-05-27 14:10:31 · 1265 阅读 · 0 评论 -
Python:列出列表中所有元素的组合可能
前言:看到一个Excel案例,比如有5个不同的产品,分别为a, b, c, d, e,需要列出所有可能的组合,因为每种产品存在“有”和“没有”2种可能,所以总共就有2的5次方,也就是32种可能;Excel的方法比较复杂,运用到了很多函数和公式,我就想用Python该怎么解决呢?本来想从头设计,但发现原来内置函数itertools里有combinations这个轮子,很简单,短短10行代码就解决了...原创 2019-05-07 15:46:54 · 32630 阅读 · 4 评论 -
Python:一个可以自助翻译的小程序
前言:编程中很头疼的一个问题是不知道该怎么翻译,有中译英,也有英译中,常规手段是打开百度——搜索,或者拿出手机搜索,一劳永逸的就是下载一个翻译软件。不过一般这种翻译软件都因为功能比较强大所以占用内存也比较高,而且还有弹屏窗口广告的风险,所以自己还是做一个小程序吧,不求功能强大,只要满足日常翻译需求即可。代码不多,不过不需要选择中译英还是英译中,代码自动判断使用了百度翻译的api,百度技术文档里...原创 2019-04-30 09:37:30 · 1524 阅读 · 1 评论 -
Python:初步完成IE浏览器的查询、点击和文件下载
前言:公司内部oa和取数系统很渣,为了安全性不支持mysql链接,也不支持chrome,所以selenium不能用,必须每天手动取数。之前接触了PyMouse和PyKeyboard,想试下是否可以完成自动化取数。初步实现了,但是还存在很多问题,主要如下:1、如果要打包给别人用,需要个性化多个部分:电脑用户名、浏览器路径、文件名等;2、对于网络速度有要求,如果在等待时间内下一个网页无法弹出来(或...原创 2019-04-19 13:27:40 · 2220 阅读 · 3 评论 -
Python:关于chrome已不再支持adobe flash player自动播放的解决办法
近几个版本的chrome因为安全性问题,已不再支持自动播放adobe flash player,页面打开后,会出现以下画面:然后必须手动点击启动,出现下面画面:我试了好几个办法都不行:1、用selenium里面的alert,但窗口2虽然是弹出窗口,却不算警告窗口,无法定位;2、切换frame,可是新窗口也不算新的frame,无法切换;3、 "profile.default_co...原创 2019-02-25 10:42:16 · 28057 阅读 · 8 评论 -
Python中list的一些比较有用的案例
参加了公司内部的建模比赛,虽然因为水平太菜初赛就没通过,不过也写了将近500行代码,其中有一些代码个人感觉还是比较有用的,记录一下,以备以后使用1、计算每个元素在内容(字符串)中的个数,并根据数量把元素对应的值(这里用了指定值,也就是ywlx1和ywlx2)放入list中,如果有ywlx2就用extend,没有的话就用appenddef get_in_list(str, content, li...原创 2019-01-18 11:01:22 · 983 阅读 · 0 评论