
python
文章平均质量分 55
lys_828
up、up、down、up。wechat联系方式即为博客名称,邮箱为xianl828@163.com
展开
-
【python】个人工具箱
对个人的常用工具进行记录原创 2024-05-17 09:13:37 · 272 阅读 · 1 评论 -
【python计算机二级】python论语文本提纯-计算机二级操作题
在刷计算机二级操作题题库时候,无论是未来教育、python123以及其他平台资源,想必大家都会遇到最后一道操作题是关于论语文本提纯的问题。初次看到的这种题目的小白,眼里就是这是什么鬼呀,看不懂呀,怎么嵌套了这么多的循环???代码与论语文本资料可以在github上获得:https://github.com/Muzi828/The-Analects,接下来就开始进行实际操作。part 1...原创 2019-08-29 22:14:09 · 4162 阅读 · 3 评论 -
筛选同一表格下的多个sheet里的内容并保存在对应的sheet中
筛选同一表格下的多个sheet里的内容并保存在对应的sheet中1 目标需求2 处理步骤3 步骤详解3. 全部代码1 目标需求报表中含有多个sheet,而且几乎很多sheet表中都有相同要筛选的同种数据,因此就有需要将同一文件下多sheet表中内容进行筛选然后重新保存在文件中,数据样例如下,目标是提取每个sheet下Sample Type字段下的Unknown Sample对应的行数据,然后保存在该sheet下目标结果:2 处理步骤① 读取Excel表格内容② 提取Excel表格中所有的sh原创 2020-07-07 10:20:23 · 2915 阅读 · 2 评论 -
【python】将单元格中的多个数据拆分为多行数据(explode方法使用)
单元格多数据拆分1. 背景与需求2. 问题解决2.1 官方示例2.2 实际操作2.2.1 采坑2.2.2 问题纠错3. 问题解决4. 小结1. 背景与需求在处理数据中,往往需要做多维特征提取(一对多),如下:一个企业会有多个擅长领域,为了作多维度数据特征分析,需要将‘企业画像’中单元格的数据进行拆分成为一行一个特征的数据样式,且其他列数据保持不变,简单的demo(以随机两个公司为例)如下2. 问题解决这里需要使用pandas中的explode方法,注意此方法是在0.25.0版本之后才有,所以确原创 2020-05-23 17:19:30 · 14469 阅读 · 9 评论 -
【python】正则表达式的分组及在pandas中的实用操作
正则表达式的分组及在pandas中的实用操作1. 正则表达式分组1.1 分组的模式1.2 分组的实际操作1.2.1 邮箱号码匹配1.2.2 标签信息匹配2. pandas中的应用操作3. 小结之前的博客中已经讲解了相关的正则表达式的一些基础的内容,可见:正则1,正则2,正则3,正则4这里补充一下正则表达式分组的相关内容以及结合pandas使用时候的实际操作1. 正则表达式分组1.1 分组的模式字符功能(ab)将括号中的字符作为一个分组\num引用分组的num匹配到的字原创 2020-05-23 13:11:10 · 3004 阅读 · 4 评论 -
【python】将自定义常用的一些函数封装成可以直接调用的模块方法
将常用一些的函数封装成可以直接调用的模块方法1. 背景2. 具体步骤3. 扩展1. 背景在实际的操作过程中,经常会用到一个功能,如果每次编写代码的时候都进行重新编写或者打开已经编写好的函数进行复制粘贴,这样就显得很麻烦,有没有什么方法可以像导入python模块的那样,直接把要用的函数以模块名+方法的形式调用呢?答案当然是可以的,比如做数据分析时候经常要使用的功能是:实现某一路径下的所有xlsx的合并,文件如下直接给出合并的函数,保留数据格式筛选的接口,将合并后的数据保存在fltered_data文原创 2020-05-17 17:05:42 · 18847 阅读 · 13 评论 -
【python办公自动化】将Word文本和Pdf表格数据提取并整合到同一个Exeel下的多sheet中
数据整合1. 背景及前期准备1.1 背景介绍1.2 需要安装的库2. 数据处理2.1 数据提取2.2 具体过程2.2.1 docx数据的处理2.2.2 docx数据的处理完整代码2.2.3 pdf数据的处理及完整代码3. 最终结果1. 背景及前期准备1.1 背景介绍在参加比赛过程中,需要获取江苏省科学技术奖近十年的数据,因此需要在官网上获取相应的数据,再查找数据的过程中发现,官网中给出的数据,并不是完整的可以直接拿来用的比如:① 2018-2019年的人员及项目名单是pdf的形式给出,② 201原创 2020-05-16 17:37:29 · 1307 阅读 · 2 评论 -
【python】将python代码打包成系统可执行文件(Pyinstaller模块)
python文件打包输出可执行文件1. Pyinstaller模块下载2. Pyinstaller的使用2.1 打开命令行,指引文件路径2.2 直接生成可执行文件3. 常用指令3.1 修改图标3.2 修改名称3.3 修改路径1. Pyinstaller模块下载关于pyinstaller的介绍这里就不再复制粘贴了,可以自行百度,了解它是可以将python源代码打包成可执行文件的模块即可,打开命令...原创 2020-05-05 13:24:37 · 34679 阅读 · 24 评论 -
【python】关于while循环的正确使用方式
while和for在何时使用一定要清晰什么时候下使用while,什么情况下使用for。for循环:对于一个已知的数据量大小,如果要一次查找里面的数据,就可以使用遍历循环,比如这些数据就可是字符串,字典,列表等我们熟悉的一些用来放数据的结构;while循环:一般使用是在不明确有多少数据,或者操作的具体步骤的次数不知,又或者不知道是属于哪种数据类型就可以使用,比如之前作业里面对于输入年龄和性别的...原创 2020-01-22 21:06:49 · 5316 阅读 · 1 评论 -
【python】del删除列表元素的索引问题
下面代码是否能够正确运行,若不能请解释原因;若能,请分析其执行结果遇到程序已经给出了代码,一定要自己动手在程序里面跑一下,运行结果如下:报错类型:如果不懂英文单词什么意思的话,可以借助软件进行翻译,这里是索引错误,列表分配索引超出范围(百度翻译给出的结果),用人话说就是:x[i]里面的i值大于列表的实际长度,才出现报错调试:在del语句的前后都添加print语句①首先看一下在进行del...原创 2020-01-20 15:59:02 · 3093 阅读 · 0 评论 -
【python】关于input语句和数值大小判断的问题
关于SublimeSublime里面尽量不要运行带有input()语句的程序!Sublime里面尽量不要运行带有input()语句的程序!Sublime里面尽量不要运行带有input()语句的程序!重要的事情说三遍。input()语句age = input('请输入年龄:')print(type(age))无论输入的是什么,即便是直接按住enter键运行,最后输出的还是<c...原创 2020-01-18 21:38:01 · 4668 阅读 · 1 评论 -
【python】历史数据可视化:八行代码完成动态排序图
对于一些没有编程经验的小白来说,看到这类动态排序条形图视频比较震撼,自己也想做,但是又有看到大段的代码就头疼的症状,鉴于有学员需要,这次就选择一个最简单的方式创建这类动态的排序图。中国安全生产事故历年数据动态可视化操作前准备: 善于利用别人的经验不仅可以提高自己的工作效率而且可以少走很多弯路,这里是使用别人封装好的模块,模块的下载地址及有关代码和软件包已经打包好,网...原创 2019-12-24 10:25:16 · 3036 阅读 · 8 评论 -
【python】利用python根据路径创建多文件夹及文件夹内容
利用python根据路径创建多文件夹及文件夹内容前几天刚报的python计算机二级,今天在刷完计算机二级题库(试卷)的时候,就想把错题及一些难懂的题目整理一下,于是就像个咸鱼一样,打开h盘,创建每一套试卷的文件夹,当我创建到第三个的时候忽然想到,我自己是学python的呀,这种重复性的工作直接敲几行代码就可以搞定了呀,学了不用不等于白学吗?然后就开始了慢慢的摸索道路,最开始是过程式的编程,一步...原创 2019-07-15 00:14:10 · 3527 阅读 · 3 评论