
python编程
文章平均质量分 88
python编程
寰宇001
来自火星的地球人。
展开
-
pip相关介绍
普通安装pip install requests指定版本安装pip install robotframework==2.8.7卸载已安装的库pip uninstall requests列出已经安装的库pip list将已经安装的库列表保存到文本文件中pip freeze > D:\桌面\install.txt...原创 2021-05-10 11:37:30 · 6825 阅读 · 2 评论 -
Python库
库名称简介Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。colorama主要用来给文本添加各种颜色,并且非常简单易用。Prettytable主要用于在终端或浏览器端构建格式化的输出。difflib,[Python]标准库,计算文本差异Levenshtein,快速计算字符串相似度。fuzzywuzzy,字符串模糊匹配。esmre,正则表达式的加速器。shortuuid,一组简洁URL/UUID函数库。ftfy,Unicode文本工具7unidecode,ascii和U转载 2021-03-31 10:01:15 · 203 阅读 · 0 评论 -
Linux下安装Python3.6(可用)
一、安装python3.6.11、安装依赖环境#yum install readline-devel ##必须安装否则会出现python3编译器中不能使用退格键和方向键2、下载安装包并解压[root@bogon ~]# wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz ##下载安装包[root@bogon ~]# tar zvxf Python-3.6.1.tgz ##解压安装包3、 编译并安装[root@bogon转载 2020-12-29 15:24:35 · 8230 阅读 · 0 评论 -
6 款 超好用的 Python 时间库
开源最前线(ID:OpenSourceTop)链接:https://opensource.com/article/18/4/python-datetime-libraries写过Python程序的人都知道,Python日期和时间的处理非常繁琐和麻烦。除了将字符串转换为更有用的 Python 对象之外,还有许多库具有一些有用的方法和工具,可以让你更轻松地进行时间测试、将时间转换为不同的时区、以人类可读的格式输出时间信息,本文将介绍以下六个Python的时间日期库:● Dateutil● Arro.转载 2020-12-07 10:15:02 · 598 阅读 · 0 评论 -
Python 下载的 11 种姿势
1、使用requests你可以使用requests模块从一个URL下载文件。考虑以下代码:你只需使用requests模块的get方法获取URL,并将结果存储到一个名为“myfile”的变量中。然后,将这个变量的内容写入文件。2、使用wget你还可以使用Python的wget模块从一个URL下载文件。你可以使用pip按以下命令安装wget模块:考虑以下代码,我们将使用它下载Python的logo图像。在这段代码中,URL和路径(图像将存储在其中)被传递给wget模块的download方法。转载 2020-11-17 10:51:38 · 201 阅读 · 0 评论 -
用Python自动生成Excel报表
在日常工作中,可能会有一些重复无聊的任务,比如说,从 Excel 或数据库中收集一些数据,设置相应的数据格式并做成报表。类似这种重复无聊的任务,我们完全可以交给 Python 去自动完成,只要第一次把 Python 代码写好,以后就可以一键完成,省时省力,还不容易出错,这是提升工作质量和工作效率的利器,让我们能够腾出时间和精力,去做更有价值的事情。1. 安装和导入模块以 Python 中的 openpyxl 模块为例,它能够读取和修改 Excel 文件,如果你还没有安装,可以通过以下命令进行安装:p转载 2020-11-06 10:04:25 · 5572 阅读 · 0 评论 -
Python系列
1、Python3的安装一、下载Python3.7二、安装程序,勾选添加到路径三、安装完成四、首次运行,无法启动,出现下面的提示五、把C:\Windows\SysWOW64的api-ms-win-crt-runtime-l1-1-0.dll删除掉六、安装下面的补丁2、Python3安装requests第三方库一、安装PIP运行cmd,打开命令窗口执行命令 python -m ensurepip --default-pip二、升级PIP运行命令 python -m pip原创 2020-11-02 13:51:07 · 1052 阅读 · 0 评论 -
用 Python 将音频内容转换为文本格式
当对一个或多个人的谈话进行记录时,采用一种高度准确和自动化的方式将口语提取为文本非常有用。转换成文字后,便可以将其用于进一步分析或用作其他功能。在本教程中,我们将使用称为AssemblyAI(https://www.assemblyai.com/)的高精度语音转文本Web API从MP3录音中提取文本(也支持许多其他格式)。在本教程中,音频文件示例下载地址请扫描本文下方二维码添加Python小助手获取,下面是音频输出如下所示的高精度文本转录内容:An object relational mapper原创 2020-10-10 17:43:34 · 2027 阅读 · 0 评论 -
Python操作MySQL
一. python操作数据库介绍Python 标准数据库接口为 Python DB-API,Python DB-API为开发人员提供了数据库应用编程接口。Python 数据库接口支持非常多的数据库,你可以选择适合你项目的数据库:GadFlymSQLMySQLPostgreSQLMicrosoft SQL Server 2000InformixInterbaseOracleSybase …你可以访问Python数据库接口及API查看详细的支持数据库列表。不同的数据库你需要下载不同的转载 2020-09-30 18:08:56 · 649 阅读 · 0 评论 -
Python+os+openpyxl 批量获取Excel的文件名和最大行数
1. 提出需求这已经不知道是粉丝问我的第几个办公自动化的问题了,并且这些问题都是大家在学习和工作中碰到过的真实问题场景。其实从下图中已经可以很明确的看出别人的需求了,我这里就不用在赘述了,下面直接上思路吧!2. 解题思路为了让大家能够快速学会,我这里会将问题拆解为各个小部分,也希望能够帮助到大家。1)导入相关库import pandas as pdfrom openpyxl import load_workbookfrom openpyxl import Workbookimport os转载 2020-09-01 09:41:53 · 3531 阅读 · 0 评论 -
Python常见面试题
1.如何用一行代码生成[1,3,5,7,9,11,13,15,17,19]2 .写一个等差数列产生一个首项为8,公差为12,末项不大于100的列表3.一行代码求1到1000内的整数和4.字典按Value排序并返回新字典简单的一个字典排序问题,字典是Python最重要的三大基础数据结构5. 打乱一个列表使用random模块可以轻松搞定,不得不说这个random库其实很有用,里面有很多重要的函数值得大家熟练掌握6.如何删除list里面的重复的元素并保证顺序并不变化很多人第一时间会想到转载 2020-08-31 11:30:40 · 6953 阅读 · 3 评论 -
Python3 中打的迭代器与生成器
迭代器迭代是Python最强大的功能之一,是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter()和 next()。字符串,列表或元组对象都可用于创建迭代器:实例(Python 3.0+)>>>list=[1,2,3,4]>>> it = iter(list) # 创建迭代器对象>>> print (n转载 2020-08-27 09:34:04 · 186 阅读 · 0 评论 -
11 种方法教你用 Python 高效下载资源
1、使用requests你可以使用requests模块从一个URL下载文件。考虑以下代码:你只需使用requests模块的get方法获取URL,并将结果存储到一个名为“myfile”的变量中。然后,将这个变量的内容写入文件。2、使用wget你还可以使用Python的wget模块从一个URL下载文件。你可以使用pip按以下命令安装wget模块:考虑以下代码,我们将使用它下载Python的logo图像。在这段代码中,URL和路径(图像将存储在其中)被传递给wget模块的download方法。转载 2020-08-18 16:30:09 · 1303 阅读 · 0 评论 -
6 款 超好用的 Python 时间库
六个Python的时间日期库:● Dateutil● Arrow● Moment● Maya● Delorean● Freezegun内建的 datetime 模块在介绍其他库之前,让我们回顾以下如何使用datetime模块将日期字符串转换为Python日期时间对象。假设我们从API接收到这个日期字符串,并且需要它作为Python datetime对象存在:2018-04-29T17:45:25Z该字符串包括:● YYYY-MM-DD格式的日期● 字母“T”表示即将到来的时间●转载 2020-08-18 10:21:31 · 637 阅读 · 0 评论 -
Winodws 10中pyCharm 2017安装
pyCharm 2017安装(可用)PyCharm2017(32/64位)软件下载地址链接:https://pan.baidu.com/s/1mz9Lo2ptNGmWVimIU9Y_Lg 密码:kwil1、鼠标右击软件压缩包,选择“解压到 pycharm 2017(64位)”2、打开“pycharm 2017(64位)”文件夹,鼠标右击“pycharm-professional-171.3780.47”,选择“以管理员身份运行”3、击“Next”4、选择安装目录,默认安装在 C:\Prog原创 2020-08-22 14:22:46 · 1013 阅读 · 0 评论 -
30个Python极简代码
Python 是机器学习最广泛采用的编程语言,它最重要的优势在于编程的易用性。如果读者对基本的 Python 语法已经有一些了解,那么这篇文章可能会给你一些启发。作者简单概览了 30 段代码,它们都是平常非常实用的技巧,我们只要花几分钟就能从头到尾浏览一遍。1.重复元素判定以下方法可以检查给定列表是不是存在重复元素,它会使用 set() 函数来移除所有重复元素。def all_unique(lst):return len(lst)== len(set(lst))x = [1,1,2,2,3,2,3转载 2020-08-17 16:36:39 · 1773 阅读 · 0 评论 -
用Python读取CSV文件的5种方式
典型的数据集stocks.csv:一个股票的数据集,其实就是常见的表格数据。有股票代码,价格,日期,时间,价格变动和成交量。这个数据集其实就是一个表格数据,有自己的头部和身体。第一招:简单的读取我们先来看一种简单读取方法,先用csv.reader()函数读取文件的句柄f生成一个csv的句柄,其实就是一个迭代器,我们看一下这个reader的源码:喂给reader一个可迭代对象或者是文件的object,然后返回一个可迭代对象。首先读取csv 文件,然后用csv.reader生成一个csv迭代器转载 2020-08-17 13:39:10 · 117440 阅读 · 4 评论 -
Python自动化(十二):一分钟搞定几百个Excel中查找的数据
一、需求说明首先我们来看下今天的需求,有一份档案记录总表的Excel工作簿, 每天会根据当天日期建立新表,每天的表格内包含所有档案信息,同时也有可能会添加新的档案名。同个年度的总表在年末可能会有两、三百个工作表,同时每个表中可能也存在千余份档案信息。表格形式如下(为了直观呈现本例以7个工作表和十余份档案的形式呈现)需要完成的操作:为了方便审查特定档案信息,需要给出档案名后生成一份新表,该表包含指定档案在所有日期(即所有工作表)中的记录。最终结果如下(以档案x003为例):也就是老板说:给我把这几百转载 2020-08-14 10:28:12 · 1825 阅读 · 1 评论 -
Python办公自动化(八)|使用Python转换PDF,Word/Excel/PPT/md/HTML都能转
Word转PDFWord转PDF应该是最常见的需求了,毕竟使用PDF格式可以更方便展示文档,虽然在Word中可以直接导出为PDF格式,但是使用Python可以批量转换,更加高效。目前在Python中针对Word转换为PDF的库有很多,比如win32就可以调用word底层vba,将word转成pdf,或者comtypes等,但是这些常用的库仅能在Windows机器上运行,所以为了照顾mac用户本文使用一个比较小众的库docx2pdf,看名字就能知道这是专门用于word转pdf,安装很简单pip inst转载 2020-08-13 17:34:38 · 1336 阅读 · 0 评论 -
Python办公自动化(六)|自动更新表格,
参考链接 ;Python办公自动化(六)|自动更新表格 :转载 2020-08-13 14:52:28 · 1068 阅读 · 0 评论 -
Python办公自动化(七)|自动更新不对称表格
需求分析现在我们有类似如下一份记录了口袋妖怪名字的分组名单:(未全部展示,实际有A-U组+1个"未分组")现在有一份更新的名单(仅含名字)需要根据这份新名单对原来的总表进行更新,即对新名单中的名字按照总表的分组进行更新,剔除不在新名单中的名字,并将新名单中新出现的名字划分到“未分组”中,如上图中的“早小起”这位读者的需求是一个需要长期重复的任务,每隔一段时间就会拿到一个新名单,需要对总名单进行调整。如果用Excel操作,可能需要反复查找新名单的名字在哪个分组,如果不存在则手动添加到“未分组”,存转载 2020-08-13 14:51:25 · 219 阅读 · 0 评论 -
Python办公自动化(四) | 批量处理文件
用同样的方式处理一堆文件夹中文件,这并不难,但就是繁。所以在遇到机械式的操作时一定要记得使用Python来合理偷懒!今天我将以处理微博热搜数据来示例如何使用Python批量处理文件夹中的文件,主要将涉及:Python批量读取不同文件夹(⭐⭐⭐)Pandas数据处理(⭐⭐)Python操作Markdown文件(⭐)需求分析首先来说明一下需要完成的任务,下面是我们的文件夹结构因为微博历史热搜是没有办法去爬的,所以只能写一个爬虫每天定时爬取热搜并保存,所以在我当时分析数据时使用的就是上图展示的数转载 2020-08-13 14:34:10 · 902 阅读 · 1 评论 -
Python办公自动化(三)|批量合并PDF
分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个完整的PDF如果换成你操作的话,是不是打开百度搜索:PDF合并,然后去第三方网站操作,可能会收费不说还担心文件泄漏,现在有请Python出场,简单快速,光速合并,拿走就用!首先导入需要的库和路径设置import osfrom PyPDF2 import PdfFileReader, PdfFileWriterif __name__ == '__main__': # 设置存放多个pdf文转载 2020-08-13 14:29:30 · 641 阅读 · 0 评论 -
Python办公自动化(二)|从Excel到Word
前言在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容docx读写Word文件那我们开始吧!需求确认首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用转载 2020-08-13 14:25:04 · 971 阅读 · 0 评论 -
Python办公自动化(一):从Word到Excel
有这样一份Word(由于涉及文件私密所以文中的具体内容已做修改)一共有近2600条类似格式的表格细栏,每个栏目包括的信息有:日期发文单位文号标题签收栏需要提取其中加粗的这三项内容到Excel表格中存储,表格样式如下:也就是需要将收文时间、文件标题、文号填到指定位置,同时需要将时间修改为标准格式,如果是完全手动复制和修改时间,依照一个条目10s的时间计算,一分钟可以完成6条,那么最快也需要:而这类格式规整的文件整理非常适合用Python来执行,好的那么接下来请Python出场,必要的转载 2020-08-13 14:16:18 · 415 阅读 · 0 评论 -
Python3 迭代器与生成器
迭代器迭代是Python最强大的功能之一,是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter()和 next()。字符串,列表或元组对象都可用于创建迭代器:实例(Python 3.0+)>>>list=[1,2,3,4]>>> it = iter(list) # 创建迭代器对象>>> print转载 2020-08-12 17:33:35 · 130 阅读 · 0 评论 -
python操作Oracle数据库
1. 准备工作① 首先,你必须安装好Oracle数据库。Oracle数据库的安装并不是那么容易,大家可以去找一个安装教程,慢慢研究。② 其次,你既然用Python操作Oracle,你必须要安装Python吧。Python的安装过程较为简单。但是有一点需要注意:一定要安装64位的Python,不要使用32位的。③ 最后,也是最复杂的一步。我们需要进行instantclient的下载安装和环境配置,它是oracle数据库的客户端,这个最好也是下载64位的。2. instantclient的安装与配置1转载 2020-08-10 10:14:12 · 9289 阅读 · 0 评论 -
90 条 Python 程序建议
1. 首先建议1、理解 Pythonic 概念—-详见 Python 中的《Python之禅》建议2、编写 Pythonic 代码(1)避免不规范代码,比如只用大小写区分变量、使用容易混淆的变量名、害怕过长变量名等。有时候长的变量名会使代码更加具有可读性。(2)深入学习 Python 相关知识,比如语言特性、库特性等,比如Python演变过程等。深入学习一两个业内公认的 Pythonic 的代码库,比如Flask等。建议3:理解 Python 与 C 的不同之处,比如缩进与 {},单引号双引号,三转载 2020-08-04 11:43:49 · 139 阅读 · 0 评论 -
Python中的下划线(_)的五种用法
前言在Python中,下划线(_)是特殊的。如果您是python程序员,对于for _ in range(10),以及__init__(self)的语法可能比较熟悉。这篇文章将解释什么时候以及如何使用下划线(_),并帮助你理解它。在Python中有5种使用下划线的情况:1、用于在解释器中存储最后一个表达式的值。2、忽略特定的值。3、给变量名或函数名赋予特殊的意义和功能。4、用作“国际化(i18n)”或“本地化(l10n)”。5、将数字的值分开。在解释器中使用时python解释器将最后一个转载 2020-08-04 11:42:52 · 11038 阅读 · 0 评论 -
6个高级Python技巧
前言Python是一种面向对象的语言,它与英语非常相似,因此对于初学者来说是一种非常好的语言。它的高级特性和受支持的库包甚至可以用几行代码来编写复杂的任务。在本文中,我们将介绍python的一些高级特性,掌握这些特性可以让你的编程更加顺畅。1、列表解析列表解析为无处不在的for循环提供了一种更简短、更好的替代方法。它用于我们需要对列表中的每个元素执行操作的迭代上下文中。语法:[some_operation(element) for element in sequence]- returns li原创 2020-08-05 07:53:11 · 503 阅读 · 0 评论 -
49个Python的常见操作/技巧/例子
很多读者都知道 Python 是一种高级编程语言,其设计的核心理念是代码的易读性,以及允许编程者通过若干行代码轻松表达想法创意。实际上,很多人选择学习 Python 的首要原因是其编程的优美性,用它编码和表达想法非常自然。此外,Python 的编写使用方式有多种,数据科学、网页开发、机器学习皆可使用 Python。Quora、Pinterest 和 Spotify 都使用 Python 作为其后端开发语言。1 交换变量值2 将列表中的所有元素组合成字符串3 查找列表中频率最高的值4 检查两个原创 2020-08-04 11:43:03 · 650 阅读 · 0 评论 -
python基础—正则表达式即re模块
正则表达式(regular expression),就是字符匹配模式,而这个匹配规则在我们写爬虫进行数据提取,或者进行数据可视化进行数据清洗时经常用到,多样化的匹配规则在复杂的字符的情况提取数据时助我们一臂之力;在Perl、java、C/C++等编程语言都支持;python是以re模块的形式支持的;正则表达式的常见用途:在模式字符串中根据需求提取子字符串;字符串内某些字符或者指定字符串进行替换或者删除或者分离;在用户输入用户名时判断输入字符串格式是否正确;一,基础re模块匹配经常用到的元字符和语转载 2020-08-04 11:43:34 · 594 阅读 · 0 评论 -
38个Pandas实用技巧
1.计算变量缺失率df=pd.read_csv('titanic_train.csv')def missing_cal(df): """ df :数据集 return:每个变量的缺失率 """ missing_series = df.isnull().sum()/df.shape[0] missing_df = pd.DataFrame(missing_series).reset_index() missing_df = missing_df.r转载 2020-08-03 13:48:59 · 494 阅读 · 0 评论 -
python数据处理——pandas的基本使用
python数据处理——pandas的基本使用(一)1.1 文本读取,pd.read_csv(),pd.read_table();pandas 读取文本(txt、excel)中会常用到两个函数:read_csv() 和 read_table() ;两个函数出去读取文本不一样之外,读取文本时前者是以,(逗号)为分隔符读取,后者以 tab(空格)为 分隔符进行读取的,把读取到的文本转化成二维 Dataframe 数据格式,直观整洁以便后续处理,以 pd.read_table()为例:pd.read_ta转载 2020-08-03 13:37:49 · 4585 阅读 · 1 评论 -
100道练习题,玩转Numpy模块!(上)
100道练习题,玩转Numpy模块!(上)Numpy 介绍Numpy 是 Python 做数据分析所必须要掌握的基础库之一。以下为入门 Numpy 的100题小练习,原为 github 上的开源项目,由和鲸社区的小科翻译并整理(保留了部分原文作为参考)。受限于篇幅这里只提供了部分题目的运行结果。友情提示:代码虽好,自己动手才算学到。1.导入numpy库并简写为 np (★☆☆)(提示: import … as …)import numpy as np2. 打印numpy的版本和配置说明 (★☆转载 2020-08-03 11:47:58 · 3916 阅读 · 0 评论 -
玩转 Numpy 的精选习题
玩转 Numpy 的精选习题 (一)1,打印 numpy 版本import numpy as npprint(np.__version__)>1.16.52、创建 10 个元素空向量Z = np.zeros(10)print(Z)>[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]3, 返回数组的元素的内存大小Z = np.zeros((10,10))print(Z.itemsize)print("%d bytes"%(Z.size*Z.itemsiz转载 2020-08-03 11:15:20 · 5500 阅读 · 0 评论 -
8个流行的Python可视化工具包。
喜欢用 Python 做项目的小伙伴不免会遇到这种情况:做图表时,用哪种好看又实用的可视化工具包呢?之前文章里出现过漂亮的图表时,也总有读者在后台留言问该图表时用什么工具做的。下面,作者介绍了八种在 Python 中实现的可视化工具包,其中有些包还能用在其它语言中。快来试试你喜欢哪个?用 Python 创建图形的方法有很多,但是哪种方法是最好的呢?当我们做可视化之前,要先明确一些关于图像目标的问题:你是想初步了解数据的分布情况?想展示时给人们留下深刻印象?也许你想给某人展示一个内在的形象,一个中庸的形象?转载 2020-08-03 10:58:00 · 978 阅读 · 0 评论 -
30 个 Python 的最佳实践、小贴士和技巧
以下为译文:想借本文为大家献上 Python 语言的30个最佳实践、小贴士和技巧,希望能对各位勤劳的程序员有所帮助,并希望大家工作顺利!1. Python 版本在此想提醒各位:自2020年1月1日起,Python 官方不再支持 Python 2。本文中的很多示例只能在 Python 3 中运行。如果你仍在使用 Python 2.7,请立即升级。2. 检查 Python 的最低版本你可以在代码中检查 Python 的版本,以确保你的用户没有在不兼容的版本中运行脚本。检查方式如下:if not sy转载 2020-08-03 10:48:01 · 251 阅读 · 0 评论 -
10个Python进行数据分析的小技巧
Pandas中数据框数据的Profiling过程Profiling(分析器)是一个帮助我们理解数据的过程,而Pandas Profiling是一个Python包,它可以简单快速地对Pandas 的数据框数据进行探索性数据分析。Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。而Pandas中的Profiling功能简单通过一行代码就能显示大量信息,且在交互式HTML报告中也是如此。对于给定的数据转载 2020-08-03 10:29:37 · 363 阅读 · 0 评论 -
23个Python爬虫开源项目代码:爬取微信、淘宝、豆瓣、知乎、微博等
今天为大家整理了32个Python爬虫项目。整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心,所有链接指向GitHub。1、WechatSogou – 微信公众号爬虫基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。github地址:https://github.com/Chyroc/WechatSogou2、DouBanSpider – 豆瓣读书爬虫可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到E转载 2020-08-03 10:08:15 · 1810 阅读 · 0 评论