
Python
文章平均质量分 52
Python学习
狮弟
String Profe……cessor!)
展开
-
一行代码告诉你为什么python代码中要加#coding:utf-8注释
君子动手不动口,一行代码告诉你为什么一定要加上#coding:utf-8注释原创 2022-09-28 10:00:12 · 1020 阅读 · 0 评论 -
Katalon:捕获网页元素的好助手!
分析网页源代码是个基本的途径,但需要对html语言以及javascript有比较深入的了解,熟悉xpath,这恐怕不是大部分开发Python程序的业余爱好者所能搞定的,就算能力够,可是人生苦短,学无止境,何必浪费时间在这上面,何必把有限的生命投入到无限的知识海洋中。网页弹窗有JavaScript的alert、confirm、prompt类型弹框,也有比较简单的divt弹窗以及新标签页弹窗,不管哪种,用Katalon是没跑了!您需要辅助工具,能够根据您的操作,捕获网页上目标元素的定位。......原创 2022-07-23 23:40:51 · 1497 阅读 · 0 评论 -
pyecharts应用代码实例3-3:数据地图在线生成器【基于Streamlit的纯Python网站】
如果从零开始使用pyecharts制作地图,建议您先阅读以下两篇文章:pyecharts应用代码实例3-2:中国各省新法规发布数量地图【进阶版】pyecharts应用代码实例3-1:中国各省新法规发布数量地图【入门版】本文所给出的代码示例实现的主要功能是:通过xlsx格式的excel文件,上传中国各省的数据,以及自定义的主标题以及系列名称,在线生成自定义的数据地图(中国省级)。【成品网址】网站截图如下。页面会显示一个默认地图作为示例:中国各省新法规发布数量数据地图。使用该工具,即使没有任何编原创 2022-04-18 23:00:14 · 2319 阅读 · 1 评论 -
pyecharts应用代码实例3-2:中国各省新法规发布数量地图【进阶版】
本次进阶版与上一版《pyecharts应用代码实例3-1:中国各省新法规发布数量地图》相比,增加以下功能:从excel文件中读取数据在子标题中显示汇总数据excel文件的格式如图:代码如下:from pyecharts import options as optsfrom pyecharts.charts import Mapimport openpyxlworkbook_geodata=openpyxl.load_workbook(filename='geo_data.xlsx')原创 2022-04-10 12:25:30 · 705 阅读 · 0 评论 -
pyecharts应用代码实例3-1:中国各省新法规发布数量地图【入门版】
【本文特别适合入门】主要功能:在中国地图上显示各省新发布的法规数量代码基于python 3.8.8和pyecharts 1.9.1请特别留意代码注释,将有助于快速上手各参数用法from pyecharts import options as optsfrom pyecharts.charts import Mapprovince_distribution = [('西藏',30),('新疆',39),('河南',45),('北京',22),('河北',10),('辽宁',12),('江西',6)原创 2022-04-03 23:14:38 · 702 阅读 · 0 评论 -
代码示例:应用pikepdf移除PDF文本复制权限限制
最讨厌PDF,处理它的文本是太麻烦了!下面这段代码实现的功能是遍历当前目录下所有pdf文件,如有文本权限限制则移除,重新保存后的文件可直接提取文本。#coding:utf-8import osimport pikepdfdef unlock(document): pdf = pikepdf.open(file, allow_overwriting_input=True) pdf.save(document)documents = os.listdir()#当前目录下所有文件for do原创 2021-11-25 13:42:39 · 1028 阅读 · 0 评论 -
代码示例:过滤掉文本中的标点符号和特殊字符
Python版本:3.8.8我的代码是将法规条文中的标点符号和特殊字符(例如制表符、换行符等)过滤掉,您可根据自己实际需要自行扩充符号列表。#coding:utf-8def RemoveSpecialChar(aclause): ''' :Input:str :Output:str :Function: :remove every special chars in laws or regualtions,e.g. punctuation marks, white原创 2021-11-18 22:30:33 · 1459 阅读 · 0 评论 -
使用Python AWS SDK boto3生成签名链接(signed url)
阅读外文文档时请注意,签名链接的英文名称除了signed url,有时又称作presigned url。我们常用亚马逊S3服务分享文件,使用签名链接的方式可以有效控制访问权限,因为签名链接自身包含了访问密匙以及有效时间。关于S3:Amazon Simple Storage Service (Amazon S3) 是面向互联网的存储服务。您可以使用 Amazon S3 随时在 Web 上的任何位置保存和取回任何数量的数据。您可以使用简单而直观的 Web 界面 AWS 管理控制台来完成这些任务。要充分原创 2021-07-31 19:34:12 · 2917 阅读 · 0 评论 -
代码示例:从SQLite数据库导入数据到postgreSQL数据库
postgreSQL的主键一定不能为空(null),即使为联合主键之一。这点与SQLite不同。在从SQLite导入数据到postgreSQL数据库时踩中了这个坑。【下面知识点与本文主题无关,只与上一段有点关系】另外,python语言与其他语言不同,空用none来表示,没有NULL类型。同时注意,none是有数据类型的,type为‘Nonetype’ 。python可能会把0,false,[ ]…等判断为空,故在python中判断对象是否为空时需要特别注意对象类型。正所谓 “四大皆空,可能踩坑”(~这句原创 2021-06-16 22:53:10 · 1430 阅读 · 0 评论 -
Git的科普
虽然是编程初学者,但也是知道GitHub的,哪个学编程的不知道?!不过大部分人知道也仅限于知道个皮毛,具体的使用对大部分初入门者是一头雾水,这个自然了,作为入门者,基本上极少有可能协作版本管理的需求。另外一方面,Git终端上使用各种命令十分的对新手不友好,例如:$ ssh-keygen -t ed25519 -C "your_email@example.com"令人望而生畏。我个人不敢用GitHub的另外一个原因是担心自己管理不慎,误分享出去用户名密码,之前业界报导过几次类似的影响比较大的事件,据原创 2021-05-04 15:31:54 · 199 阅读 · 0 评论 -
numpy的字符串数组的默认长度坑
Numpy【2021-04-05】numpy的字符串数组,默认长度为1比如下面这个数组,每个数组元素只能放一个字符leg_arr=np.empty(4,3),dtype=str)如果不知道这一点,即使给数组元素赋个长值也白搭,只有首字符能够保存在元素里,示例:leg_arr[1,3]='人生苦短 我用python'print(leg_arr[1,3])>>人...原创 2021-04-05 22:41:27 · 1154 阅读 · 1 评论 -
【代码示例】excel文件转csv文件
本文将给出一段简单代码,演示xlsx格式excel文件如何用python转为csv文件。在代码中顺便备注了我认为对新手比较重要的一些知识点。import csvimport openpyxlwbook=openpyxl.load_workbook(filename=xxx.xlsx,read_only=True)#设为只读模式提高读写速度wsheet=wbook.activewith open(yyy.csv,'w',newline='',encoding='utf-8') as csvfile原创 2020-11-22 20:56:11 · 650 阅读 · 0 评论 -
pyinstaller打包python程序快速上手及避坑指南
写程序个体户最后免不了遇到两个关卡,前端或者打包。相对前端来讲,打包算是简单的,特别是有了pyinstaller的帮助。但是也有不少坑等着我们,没办法,踩坑是宿命,干就完了!初试pyinstaller是失败的,打包后运行exe文件有无数报错,调了调,还是放弃了。当时写的程序也稍微复杂了点,有wxpython在里面。这回写了简单一点的,只用了openpyxl、numpy、re和datetime四个包。打开CMD,进入你所编写的python程序目录下,使用命令:pyinstaller -F xxxxx原创 2020-11-15 17:49:46 · 954 阅读 · 1 评论 -
【代码示例】使用numpy布尔索引过滤二维数组中的行
二维数组在实际工作中使用较多,所以本文直接以二维数组为例。注:所涉及背景知识我们在这里不再赘述,请自行百度。首先构建一个4行6列数组arr_0,示例如下图:目的是根据第5列的元素的值,遮盖元素为1的行,从而从中取得元素为0的行。先将第5列切片,使用逻辑运算制成布尔索引,再用布尔索引遮盖arr_1,得到我们想要的结果arr_2数组。下面是代码示例:bool_0=arr_1[:,4]#切片取出第5列,冒号代表取整列bool_1=[bool_0!=1]#通过比较运算得到布尔索引(其类型为list)原创 2020-11-14 22:34:16 · 1873 阅读 · 1 评论 -
【openpyxl操作excel】遍历工作簿中各工作表并汇集为一张工作表
最近有一项工作需要合并一个excel工作簿中的176个工作表共计8000多行的内容到一个工作表中,工具肯定是首选openpyxl了,然而如何遍历表,然后如何遍历行,网上一些攻略似乎都不大理想。反复摸索,终有所获。觉得我的python代码蛮短小精悍而且非常好用,特此分享:#coding:utf-8import openpyxlwb=openpyxl.load_workbook(filename='data.xlsx')ws=wb.active#注意!所有工作表的内容将合并到ws所代表的工作表中r原创 2020-08-26 23:19:23 · 3930 阅读 · 6 评论 -
【openpyxl操作excel】按给定条件删除行
因为工作需求,需要从一个4万多行的excel文件中筛选出一些行删掉。因为人生钱少苦短 我必须得用免费python。稍稍研究了一下,openpyxl官网内容实在潦草,而网友们的分享也是杂七杂八,参考价值不大。最后成果如下,可用好用,代码简单,分享一下是为记:#coding:utf-8import openpyxlwb=openpyxl.load_workbook(filename='xxxxxx.xlsx')ws=wb.activefor i in range(1,ws.max_row,1):原创 2020-06-07 10:28:24 · 7760 阅读 · 22 评论 -
【算法】FP-growth算法在法规清单关联规则挖掘中的应用
英文标题:The application of FP-growth algorithm on data mining of association rules from law lists从SSRN下载英文版:pdf 339KBhttps://papers.ssrn.com/sol3/papers.cfm?abstract_id=3474162写这个论文主要是为了梳理下思路和知识脉络,毕竟...原创 2019-11-02 15:55:15 · 233 阅读 · 0 评论 -
ChromeDriver安装及使用心得(坑#1)
这tm刚开始就这么坎坷撒—历经百转千回,终于知道是webdriver.chrome()应该写成webdriver.Chrome(),该大写的地方没有大写!官方下载地址:https://chromedriver.storage.googleapis.com/index.html?下载地址:https://chromedriver.chromium.org/------2022-10-17更新-----------2021-11-30更新-----------2021-04-23更新-----原创 2019-01-13 12:56:38 · 10687 阅读 · 3 评论 -
如何更新python包以及更新升级pip
更新openpyxl版本命令如下:pip install --upgrade openpyxl或者在这里插入代码片pip install -U openpyxl命令执行后,将openpyxl 2.5.12升级为2.5.14更新pip版本pip install --upgrade pippip install -U pip或者用Python命令参数-m选项来安装也...原创 2019-01-31 22:38:58 · 1013 阅读 · 1 评论 -
【python】SQLite学习笔记06:从excel文件批量导入数据到SQLite数据库
尽管SQLite应用广泛,但是网上可参考资料却不太多,现有的菜鸟教程(www.runoob.com)、SQLite官网和Python的SQLite子站信息略嫌粗糙而且比较基础,故此分享一些跳出坑的经验供大家参考。以下代码基于Python 3.7.1使用了openpyxl模块、sqlite3模块,应用了迭代器来逐行读取excel数据,可以较好地控制内存开销(对较大的excel文件才有实际价值)。...原创 2019-02-09 17:18:39 · 6024 阅读 · 11 评论 -
【SQLite】向数据库现有表中添加新列
环境:python 3.7.1sqlite3 2.6.0SQLite 3.21import sqlite3 lists=sqlite3.connect('tree.db') fptree=lists.cursor()try: #添加新列到数据库 add_column='''ALTER TABLE summary ADD COLUMN freq''' fptre...原创 2019-03-03 22:02:24 · 6349 阅读 · 0 评论 -
中文分词
本来想用哈工大的pyltp,奈何门槛有点高,最终从善如流还是选择使用jiebapip install jieba,得Collecting jieba Downloading https://files.pythonhosted.org/packages/71/46/c6f9179f73b818d5827202ad1c4a94e371a29473b7f043b736b4dab6b8cd/ji...原创 2019-03-09 16:16:54 · 131 阅读 · 0 评论 -
python彩蛋:python的禅
运行:import this你将看到 Tim Peters写的著名的The Zen of Python。译文我就不放了,网上随便一搜大把。Python之禅也适用于其它产品设计,你觉得呢?The Zen of Python, by Tim PetersBeautiful is better than ugly.Explicit is better than implicit.Sim...原创 2019-05-11 17:18:00 · 272 阅读 · 0 评论 -
【python】SQLite学习笔记05:增加新列的坑(+复制数据库的坑)
今天又踩了个SQLite坑!driver.execute('''ALTER TABLE ar ADD COLUMN lx_signature TEXT,lx_title TEXT,ly_signature TEXT,ly_title TEXT;''')在执行上面语句的时候,报错:Traceback (most recent call last): File "c:/Users/VC/O...原创 2019-06-28 00:36:27 · 1954 阅读 · 0 评论 -
【Python】Anaconda、vs code和kivy
之前一直用微软vs code做python编程,到后期便需求做GUI来更好的展示程序作品,经过调研,据决定用kivy来作为GUI开发工具。来一段维基百科:Kivy是开源Python库,用于开发移动应用程序和其它采用自然用户界面的多点触控应用软件。它可以在Android,iOS,Linux,OS X和Windows运行。采用MIT授权条款,Kivy是自由并且开源的软件。在2012年,Kivy从...原创 2019-09-08 11:36:43 · 2935 阅读 · 0 评论 -
python安装wordcloud的visual c++问题
python安装wordcloud的visual c++问题python 3.7下安装流行词云工具wordcloud,使用命令pip install wordcloud。但是遇到了大家都会遇到的问题,报错:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": ...原创 2018-12-22 10:47:21 · 1096 阅读 · 0 评论