
PythonNotes
小孟Tec
为什么我的眼里常含泪水?
因为我对这土地爱得深沉……
展开
-
python flask暂存上传的excel表格文件
通过flask服务上传文件原创 2022-04-14 22:25:55 · 1449 阅读 · 0 评论 -
python定时脚本 & linux 中文乱码问题
apscheduler 模块from apscheduler.schedulers.blocking import BlockingSchedulerfrom datetime import datetime# def job():# print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))# # 定义BlockingScheduler# sched = BlockingScheduler()# sched.add_job(job, .原创 2021-05-26 11:03:48 · 279 阅读 · 0 评论 -
Python 训练模型前数据预处理:shuffle - 打乱数据
文章目录AbstractMethodsklearn方法numpy 方法 - 不建议Referencedf.to_csvAbstract除了划分train 、test、dev前shuffle之外,数据在训练前也需要shuffle一下在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。Method实现方法:最简单的方法就是采用pandas中自带的 sample这个方法。假设df是这个Data原创 2021-02-05 00:28:16 · 2757 阅读 · 0 评论 -
python正则表达式提取/过滤字符串中的数字
文章目录背景思路code背景训练文本分类模型 需要对文本中的数字、特殊符号预处理思路1 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数;2 所以一般是形如:----.-----;3 根据上述正则表达式的含义,可写出如下的表达式:"\d+.?\d*";4 \d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;.?这个是匹配小数点的,可能有,也可能没有;\d*这个是匹配小数点之后的数字的,所以是0个或者多个code# -*- coding:原创 2021-02-05 00:18:22 · 3258 阅读 · 1 评论 -
判断字符串相似度-python
python 判断字符串相似度方法一方法二方法一import difflibdef get_equal_rate(str1, str2): return difflib.SequenceMatcher(None, str1, str2).quick_ratio()方法二import Levenshteindef get_equal_rate(str1, str2): return Levenshtein.ratio(str1, str2)计算两个字符串的相似度得分均位于[0,原创 2021-01-27 10:30:30 · 364 阅读 · 0 评论 -
Python3自定义sorted()中key排序函数
文章目录Introduction举个栗子对每个元素中包含多个项,定义不同的排序规则一个字符串排序,排序规则:小写<大写<奇数<偶数ReferenceIntroductionpython3 sorted取消了对cmp的支持。python3 帮助文档:sorted(iterable, key=None, reverse=False)reverse是一个布尔值。如果设置为True,列表元素将被倒序排列,默认为Falsekey接受一个函数,这个函数只接受一个元素,默认为None原创 2020-11-09 17:45:21 · 837 阅读 · 0 评论 -
xlrd 和 xlsxwriter 操作excel表格
文章目录Introduction 前言xlrd 用法xlsxwriter 用法trick 1:使用python将excel单元格中指定文字加粗标红写文件逐行写挨个单元格写Introduction 前言结合自己平时用到的例子读excel 用 xlrd 模块设置单元格样式 以及 写 excel文件用 xlsxwriter 就够了!xlrd 用法import xlrdbook = xlrd.open_workbook('data.xlsx')sheet1 = book.sheets()原创 2020-11-04 09:15:25 · 646 阅读 · 0 评论 -
Python内置函数
文章目录和数字相关1. 数据类型2. 进制转换3. 数学运算和数据结构相关1. 序列列表和元组相关内置函数字符串2. 数据集合3. 相关内置函数和作用域相关和迭代器生成器相关字符串类型代码的执行输入输出内存相关文件操作相关模块相关帮 助调用相关查看内置属性内置函数就是Python提供的, 拿来直接用的函数,比如print(),input()等截止到python版本3.6.2 ,一共提供了68个内置函数,具体如下分成12大类和数字相关1. 数据类型bool : 布尔型(True,F原创 2020-10-15 22:55:12 · 130 阅读 · 0 评论 -
python数据分析里axis=0/1 行列定义
axis含义python中的axis究竟是如何定义的呢?Referencepython中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列?考虑以下代码:>>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], \ columns=["col1", "col2", "col3", "col4"])>>> df # 输出 col1原创 2020-08-03 17:43:54 · 610 阅读 · 0 评论 -
正则表达式 - \1\2和\\1的理解
文章目录\1\2和\\1的理解Regular Expression 之 反向引用Reference\1\2和\1的理解正则表达式中‘\1’ 匹配的是 字符 ‘\1’ 。 (因为 ‘\’ 匹配字符 ‘\’ )‘\2’ 匹配的是 字符 ‘\2’单独斜杠的 \1 , \2 就是反向引用了。‘\1’ 匹配的是 所获取的第1个()匹配的引用。例如,’(\d)\1’ 匹配两个连续数字字符。如33aa 中的33‘\2’ 匹配的是 所获取的第2个()匹配的引用。例如,’(\d)(a)\原创 2020-07-07 01:23:26 · 3585 阅读 · 0 评论 -
如何在Jupyter notebook中安装Python包
文章目录pip vs. condacanda 通用安装方式pip 通用安装方式Referencepip vs. conda对很多使用者来说,选择pip还是conda是非常令人困惑的问题。这二者的本质区别可以这样概括:pip 可以在所有环境下安装python包。conda可以在conda环境下安装所有包。canda 通用安装方式# 以安装numpy为例import sys!co...原创 2020-02-04 13:01:54 · 5305 阅读 · 0 评论 -
Python super() 函数
文章目录Abstract用法one caseAbstractsuper() 函数是用于调用父类(超类)的一个方法。super 是用来解决多重继承问题的,直接用类名调用父类方法在使用单继承的时候没问题,但是如果使用多继承,会涉及到查找顺序(MRO)、重复调用(钻石继承)等种种问题。MRO 就是类的方法解析顺序表, 其实也就是继承父类方法时的顺序表。上述表述可能有些抽象,下面看一个具体的栗子...原创 2020-01-16 14:58:37 · 185 阅读 · 0 评论 -
python脚本传参的3种方式 及 argparse模块用法总结
argparse module 用法总结一个例子引入sys.argv 方式argparse 方式1. argparse介绍2. 基本用法3. positional arguments4. optional arguments5. action='store_true'6. 类型 type7. 可选值choices=[]8. 自定义帮助信息help9. 程序用法帮助10. 互斥参数11.参数默认值R...原创 2019-11-27 22:11:41 · 2126 阅读 · 0 评论 -
Python文件读写 、 csv模块、pandas操作文件、json模块、xlrd模块--操作Excel
python文件读写:读文件:文件内容如右图:file.read()方法返回的是整个文件的内容,type是str类型file.readline()方法返回的是文件一行的内容(首行),type也是str类型file.readlines()返回的是list类型, 并且文件的每一行是list中元素,每行最后都有一个'\n'换行符。list类型可遍历(Iterator)逐行读...原创 2018-07-08 23:27:23 · 3825 阅读 · 0 评论 -
Python 小技巧
join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串,序列可以使 列表,也可以是 元祖。并且内部元素必须是以字符串的形式存储的。#!/usr/bin/python# -*- coding: UTF-8 -*-str = "-"seq = ("a", "b", "c") # 字符串序列print(str.join(seq))输出结果为(字符串):a-b-c...原创 2018-07-06 21:07:34 · 173 阅读 · 0 评论 -
python 获取当前时间
取得时间相关的信息的话,要用到python time模块,python time模块里面有很多非常好用的功能,你可以去官方文档了解下,要取的当前时间的话,要取得当前时间的时间戳,时间戳好像是1970年到现在时间相隔的时间。你可以试下下面的方式来取得当前时间的时间戳:import timeprint time.time()输出的结果是:1279578704.6725271但是这样是一连...原创 2018-08-15 00:47:09 · 194 阅读 · 0 评论 -
python函数参数前面单星号(*)和双星号(**)的区别
在python的函数中经常能看到输入的参数前面有一个或者两个星号:例如def foo(param1, *param2):def bar(param1, **param2):这两种用法其实都是用来将任意个数的参数导入到python函数中。单星号(*):*agrs将所以参数以元组(tuple)的形式导入:例如:>>> def foo(param1, *par...转载 2018-09-21 15:17:56 · 2025 阅读 · 0 评论 -
python 迭代器Iterator & 生成器generator 以及 yield 关键词
1. 可迭代对象 IterablePython中任意的对象,只要它定义了可以返回一个迭代器的__iter__方法,或者定义了可以支持下标索引的__getitem__方法(这些双下划线方法会在其他章节中全面解释),那么它就是一个可迭代对象。简单说,可迭代对象就是能提供迭代器的任意对象。那迭代器又是什么呢? 2. 迭代器 Iterator -- 迭代器只能迭代一次任意对象,只...转载 2019-01-18 23:11:40 · 453 阅读 · 0 评论 -
【Python】set与frozenset的区别
同多数语言一样,set表示集合,最重要的特性就是无序,所以Python中的set不支持indexing,但支持len(set),x in set 等操作。set有两种类型,set和frozenset。set是可变的,有add(),remove()等方法。既然是可变的,所以它不存在哈希值。frozenset是冻结的集合,它是不可变的,存在哈希值,好处是它可以作为字典的key,也可以作为其...转载 2019-01-09 23:50:04 · 658 阅读 · 0 评论 -
ImportError: No module named 'encodings' 错误 的解决办法
easy_install --upgrade pip # 更新pip安装virtualenvwrapper 的配置在 /Users/Mac_name/.bash_profile 最后增加如下信息:export WORKON_HOME=~/.virtualenvssource /Users/fuli/anaconda3/bin/virtualenvwrapper.sh...原创 2019-03-11 22:15:42 · 57904 阅读 · 0 评论 -
Python中的sorted函数以及operator.itemgetter函数(转--略加修改:添加2.x和3.x版本下dict排序)
operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值>>> b(a) 2 >>> b=...转载 2018-05-19 22:00:02 · 375 阅读 · 0 评论