
python笔记
chnhbhndchngn
这个作者很懒,什么都没留下…
展开
-
Python发送邮件日报
通过Python发送邮件原创 2022-08-04 17:24:48 · 388 阅读 · 0 评论 -
python小整数常量池
python的小整数常量池的范围是[-5, 256], 下面我们就要来验证一下# 验证方法for i, j in zip(range(-9, 260), range(-9, 260)): if id(i) != id(j): print(i)运行的结果就是:-9-8-7-6257258259由此可见当 i 和 j 都是-5~256的时候, 他们的地址是相同的...原创 2021-08-18 14:41:37 · 344 阅读 · 0 评论 -
python几个技巧
参考 https://mp.weixin.qq.com/s/gGT8EzPH0_CyhNSciVoxKg来源于Python大数据分析 ,作者朱卫军合并两个字典通过**符号解压字典,并将多个字典传入{}中,实现合并, 如果有重复的键, 以后面的为准, 例如这里的’b’d1 = {"a": 97, "b":98}d2 = {"A": 65, "B": 66, 'b': 666}print({**d1, **d2})print({**d2, **d1}){'a': 97, 'b': 666,原创 2021-08-05 14:55:50 · 173 阅读 · 0 评论 -
jupyter代码自动换行
在jupyter的页面写代码的时候有时候代码比较长, 尤其是代码中包含一些字符串的时候, 如果没有自动换行的出现, 会在下面出现滚动条, 如下图这样非常不方便我们查看后面的代码或字符串的内容, 下面我们通过配置参数来实现代码的自动换行首先找到jupyter的配置的路径, 如下图打开notebook.json文件后, 在里面添加(记得在必要的位置添加逗号) "MarkdownCell": { "cm_config": { "lineWrapping": ..原创 2021-08-02 18:58:09 · 6052 阅读 · 0 评论 -
python中time模块的简单使用
工作中很多地方都需要获取实时的时间, 这就需要用到time模块来获取时间戳和特殊格式的时间表达式import time# 表示单位为秒的时间戳print(time.time())time.sleep(3)print(time.time())结果为:1627872395.27089141627872398.2839825下面是获取当地的时间, 各个单位的数值# 当地时间print(time.localtime())结果中包括了年月日时分秒等单位的具体数值ti原创 2021-08-02 10:52:22 · 295 阅读 · 0 评论 -
使用python爬取百度中的关于某个关键字的图片
百度图片的结果是滑动加载的, 并不是静态的页面, 需要不断下滑, 才能不断更新import requestsimport osfrom bs4 import BeautifulSoupbase_url = "https://image.baidu.com/search/acjson?"people = "奥运会"params = {'tn': 'resultjson_com', 'logid': '7293709351117530629', 'i原创 2021-07-28 14:53:25 · 482 阅读 · 0 评论 -
Python中的random模块中的随机数问题
1.random.random()随机生成[0, 1)均匀分布的一个数import randomimport seaborn as snsdata = [random.random() for i in range(1000)]sns.distplot(data)2. random.uniform(a, b)生成[a,b]均匀分布的一个随机数data = [random.uniform(1, 5) for i in range(1000)]sns.distplot(d.原创 2021-07-25 15:54:48 · 1855 阅读 · 0 评论 -
seaborn无法下载数据的问题
当我们使用seaborn下载数据的时候会出现这样的问题import seaborn as snsdf = sns.load_dataset('flights')这主要是因为国内的网无法直接连接他们的服务器, 造成的, 我们可以直接从github上下载数据到本地, 然后直接从本地读取数据下载数据的地址:https://github.com/mwaskom/seaborn-data然后存到本地电脑的某个位置, 再读取文件, 这是需要加上 data_home 这个参数就行了df...原创 2021-07-22 11:17:06 · 2362 阅读 · 1 评论 -
python所有的关键字
import keywordprint(keyword.kwlist)原创 2021-07-07 22:49:16 · 135 阅读 · 0 评论 -
jupyter单元格代码折叠
在使用jupyter的时候如果一个单元格当中的代码比较多, 而且我们写完后不想让显示, 像在pycharm中折叠代码。原创 2021-06-10 17:58:24 · 12280 阅读 · 1 评论 -
修改jupyter网页字体的设置
找到 xxxx\Anaconda3\Lib\site-packages\notebook\static\custom\custom.css 文件修改配置, 如果没有信息就是添加配置信息.CodeMirror pre {font-family: Consolas, "Microsoft YaHei Mono", "Microsoft YaHei"; font-size: 10pt;}* {font-family: Consolas, "Microsoft YaHei Mono", "Micro.原创 2021-04-23 17:50:13 · 1218 阅读 · 0 评论 -
itertools模块的product函数
python 中快速遍历多个变量相互交叉的情况, 就像是进行笛卡尔积遍历的情况from itertools import productli1 = [1, 2]li2 = ['a', 'b', 'c']for i, j in product(li1, li2): print(i, j)结果:1 a1 b1 c2 a2 b2 c原创 2021-04-12 16:55:59 · 287 阅读 · 0 评论 -
python打乱列表的顺序
使用random中的shufle()函数打乱原始列表的顺序, 这种方法并不改变列表的地址原创 2021-04-06 22:08:41 · 6588 阅读 · 0 评论 -
并不是所有的异常都可以捕获到之 SyntaxError: invalid syntax
有些语法错误是捕获不到异常的try:# num = int(input('请输入数字:')) num = 3 if num % 2 == 0 and num % 3 == 0: print('2,3的倍数') # 待捕获处 elif num %2 = 0: print('2的倍数') elif num % 3 == 0: print('3的倍数') else: print('其他'原创 2021-03-01 18:36:00 · 362 阅读 · 0 评论 -
df.fillna函数
import pandas as pdimport numpy as npdf = pd.DataFrame([[1, 2, 3], [np.nan, np.nan, 2], [np.nan, np.nan, np.nan], [8, 8, np.nan]])dfdf.fillna({0:10, 1:11, 2:22})有人问, 列中以为有了nan, 所以...原创 2021-02-18 14:49:10 · 1732 阅读 · 0 评论 -
python安装的docx出错 No module named ‘exceptions‘
有时为了需要我们要通过python操作word可以通过安装docx进行操作但是如果是通过以下命令安装的, 可能会出现一些问题pip install docx出现的问题是:这是安装的包不对, 先卸载pip uninstall docx然后重新合适的工具包pip install python-docx然后再运行就不报错了...原创 2020-10-19 10:33:11 · 17334 阅读 · 4 评论 -
jupyter notebook启动后无法自动打开Chrome浏览器
如果重新安装, 重新生成配置文件还是无法解决的话, 可能是防火墙惹的祸我们需要将python.exe jupyter.exe设置成防火墙允许的应用程序确定添加最后在查找确认一下如果还是不行的话, 请参考https://blog.youkuaiyun.com/xc555/article/details/81944979和https://blog.youkuaiyun.com/weixin_41813895/article/details/81739502...原创 2020-09-16 12:57:31 · 1599 阅读 · 0 评论 -
给pip配置多个国内镜像源
当我们使用 pip install *****进行安装各种工具包的时候, 有时会很慢甚至是安装中间中断, 因此我们最好安装国内的镜像源win 安装步骤:1 进入 C:\Users\Administrator\AppData\Roaming 路径, 注意: AppData是隐藏的文件夹2 创建文件夹 pip3 在pip文件夹内创建文本文件, 名称随意, 输入以下内容[global]index-url=http://mirrors.aliyun.com/pypi/simpl...原创 2020-09-16 12:20:35 · 1626 阅读 · 0 评论 -
python new init魔法方法
class Myclass(object): def __new__(cls, num): # 至少要有一个参数cls,代表当前类, 此参数(cls)在实例化时 # 由Python解释器自动识别 # 第二个参数num虽然不用, 但是必须有 print("__new__method") return super(Myclass, cls).__new__(cls) # __ne...原创 2020-08-21 23:08:51 · 185 阅读 · 0 评论 -
numpy矩阵太大无法完全显示
当矩阵太大而无法完全显示的时候, 添加下面的第二行代码import numpy as npnp.set_printoptions(threshold=np.inf)即可完全显示原创 2020-08-17 00:11:08 · 1961 阅读 · 0 评论 -
python 不显示warnings部分的设置
python忽略一些警告import warningswarnings.filterwarnings('ignore')原创 2020-08-08 09:36:17 · 1339 阅读 · 0 评论 -
全角文本变半角文本
在做自然语言处理的时候发现国内的好多语料库都是采用的全角编码的, 这会有些麻烦, 需要将其改编成半角编码import osdef Q2B(uchar): """全角转半角""" inside_code = ord(uchar) if inside_code == 0x3000: inside_code = 0x0020 else: inside_code -= 0xfee0 # 转完之后不是半角字符返回原来的原创 2020-07-26 10:24:06 · 262 阅读 · 0 评论 -
python获取 英文标点符号
英文中的所有标点符号from string import punctuationpunctuation结果:'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'删除中文文本中的所有标点符号import repun = ",。……——“”‘’!;"punList = list(set(list(pun)))pattern = re.compile("|".join(punList))res = re.sub(patter..原创 2020-07-22 19:19:24 · 4348 阅读 · 0 评论 -
python中字典和json串的关系
字典是一个数据结构json在python中就是一个字符串实例其中data.json文件的内容为:原创 2020-07-12 23:09:38 · 225 阅读 · 0 评论 -
python 多线程
import threadingdef job(n): for i in range(n): i += 2 print(i) print("job end")if __name__ == '__main__': t1 = threading.Thread(target=job, args=(5,)) t1.start() print("main end")结果是:E:\software\anaconda19...原创 2020-07-12 22:34:52 · 130 阅读 · 0 评论 -
python中关于字典和Counter()的一点区别
可见字典的update 并不会累加键的值Counter()在进行update时候会累加键的值, 这样可以方便统计, 例如统计文件中出现最多的单词原创 2020-07-11 22:08:10 · 1767 阅读 · 0 评论 -
anaconda 的notebook无法shutdown
找到notebook的相关文件将其中的改成四个parent(), 改之前是三个parent()原创 2020-07-06 19:09:18 · 255 阅读 · 0 评论 -
collections.Counter 的比较
Counter的most_common()方法返回的是列表, 如果某个元素的个数相同, 那么就可能顺序不同, 所以是False原创 2020-06-30 18:24:23 · 785 阅读 · 0 评论 -
python 字典到底是有序还是无序?
原创 2020-06-30 18:18:12 · 7109 阅读 · 0 评论 -
numpy 的reshape
import numpy as npa = np.random.randn(2, 3)print(a)b = a.reshape(3, 2)print(b)# a本身形状不变print(a)# 但此时, a, b指向的内存是相同的, 但是id又不一致a[0, 0] = 999 # a改变的时候 b也会改变print(a)print(b)...原创 2020-06-29 15:47:01 · 192 阅读 · 0 评论 -
结巴 分词及词性
import jiebaimport jieba.posseg as psegwords = pseg.cut("我爱毛主席北京天安门.!")for word, flag in words: print('%s: %s' % (word, flag))打印结果:通过查看jieba的GitHub上, 可以得到词性的简写都代表什么意思原创 2020-06-29 10:05:43 · 1733 阅读 · 0 评论 -
类的各种方法和属性
原创 2020-06-25 21:44:17 · 426 阅读 · 0 评论 -
进制和ASCII 各种转换
原创 2020-06-25 20:55:55 · 856 阅读 · 0 评论 -
列表的地址, 大小和内容
原创 2020-06-25 20:44:49 · 383 阅读 · 0 评论 -
python zip的用法 既可以合并列表, 也可以拆分成列表
原创 2020-06-22 15:38:26 · 2589 阅读 · 0 评论 -
列表是引用类型
a和b指向的是同一块地址原创 2020-06-22 11:45:20 · 206 阅读 · 0 评论 -
join列表的要求
再次强调, 当使用join进行拼接列表时, 列表中的元素必须都得是字符串类型的原创 2020-06-16 22:38:10 · 543 阅读 · 0 评论 -
python3 中 global nonlocal关键字
global当在函数内部想要修改全局变量的时候, 需要使用指明global, 这样 内部的变量和全局的变量是指向相同的地址的, 所以修改的时候就是修改全局的变量nonlocalnonlocal 与global类似, 但是他是修饰外部非全局的变量的另外如果在嵌套内部使用global则会使这样的原始全局变量中是没有a的所以会报错, 在嵌套的内部创造了全局的变量, 并赋值, 但是外部函数的a仍是250, 并不会改变...原创 2020-06-16 22:31:37 · 345 阅读 · 0 评论 -
jieba分词及词性判断
import jieba.posseg as possegres = posseg.cut("我是中国人")print(type(res))for word, flag in res: print(word, flag)原创 2020-06-16 18:17:28 · 2731 阅读 · 0 评论 -
生成器, 迭代器, 可迭代对象的关系
可迭代对象能使用 for 循环for i in obj: xxxx的都是可迭代对象生成器生成器不但可以作用于for循环,还可以通过next()函数不断返回下一个值生成器有两种形生成器不但可以作用于for循环,还可以通过next()函数不断返回下一个值式, 一种是将列表生成式的两侧的方括号换成圆括号; 第二种就是在函数中增加yield关键字迭代器生成器都是迭代器调用一个生成器函数,返回的是一个迭代器对象。list、tuple、dict等对象虽然是可迭.原创 2020-06-16 13:22:03 · 290 阅读 · 0 评论