
python
ws_nlp_
这个作者很懒,什么都没留下…
展开
-
python打印出一个类的所有属性
python打印类所有属性原创 2022-11-16 11:52:33 · 1895 阅读 · 0 评论 -
CRF和HMM简易区别
CRF是无向图,HMM有向图CRF是判别模型,HMM是生成模型CRF所有极大团,求势函数,就是除了转移概率(x->y),还有极大团的状态特征HMM只依赖前一个时刻状态,与转移(x->y)无关原创 2021-07-01 17:07:41 · 487 阅读 · 0 评论 -
python判断字符或者字符串是否为数字或字母
s.isdigit()s.isalpha()s.isalnum()大小写可以用s.lower()原创 2021-06-16 10:48:20 · 241 阅读 · 0 评论 -
python判断中文字符
中文字符的编码为u’\u4e00’ <= ch <= u’\u9fff’其中包括了中文简体和中文繁体字def check_contain_chinese(check_str): for ch in check_str: if u'\u4e00' <= ch <= u'\u9fff': return True return Falsefor x in l: print(check_contain_chinese原创 2021-03-12 18:25:46 · 607 阅读 · 0 评论 -
python输出格式转换,可以转换多个类型嘛
使用关键字参数(简写)输出可以转换多个类型嘛先上代码m = 0.23521print(f'{m:.2%}')# 23.52%n = 23print(f'{n:.2f}')# 23.00print(f'{n:.2%}')# 2300.00%print(f'{n:.2f%}')# errorprint(f'{n:.2%f}')# error结论是不能,一个整数,可以转换为百分数,也可以转换为浮点数虽然转换百分数隐藏含义是先转换为浮点数但是当合并两个转换类型时,都会报错原创 2021-01-23 10:30:35 · 149 阅读 · 1 评论 -
python格式化百分比输出,如何将浮点数输出为百分数,不需要额外代码的简便方法
m = 0.23521print(f’{m:.2%}’)# 23.52%原创 2021-01-23 10:14:07 · 1938 阅读 · 0 评论 -
python实际中遇到的问题,合并字典中的tuple
一个字典包含了一些key为tuple类型,value为int类型的记数,例如:dic = {(a, b):10, (b, a):15}现在这些tuple如果属于一个集合,合并数量并输出,属于同一个集合只保留一个tupledic = {(a, b):25}代码: remove_list = [] for k, v in self.overlap_count_dic.items(): turn_k = (k[1], k[0])原创 2021-01-16 14:16:37 · 383 阅读 · 0 评论 -
python中使用时间戳timestamp
python中的time.time()就是时间戳代码:import timetime_stamp = time.time()print(time_stamp)time_array = time.localtime(time_stamp)other_way_time = time.strftime("%Y-%m-%d %H:%M:%S", time_array)print(other_way_time)结果:1610608539.83105022021-01-14 15:15:39当原创 2021-01-14 15:21:13 · 10791 阅读 · 0 评论 -
python找到一个列表中的最大长度字符串以及其索引
我们都知道如果在一个列表中,如果找到一个最大数用max即可,但如何迅速找到最大长度字符串的索引呢最暴力的方法就是自己写一个遍历了,但是max函数其实是支持很多方法的,比如将key设置成len就可以解决这个问题具体代码如下:L1 = [‘中国’, ‘大学城’, ‘北大清华’]print(L1.index(max(L1, key=len))输出:2...原创 2020-12-11 16:24:11 · 3379 阅读 · 0 评论 -
爬虫时带有中文url如何处理
爬虫过程中需要构建url,有的url不可避免的 出现中文字符例如:https://baike.baidu.com/item/泰山石膏(湖北)有限公司直接输入带有中文字符的url有可能会出现编码错误,原因是url里面不允许带有中文这时候上网上搜索可能会查看需要使用 from urllib.parse import quote来对中文进行转换,然而整个转换url之后,显示不存在这个页面解决方法是只把中文字符进行quote转换,然后与之前的前缀合并下面是代码:url = ‘https:/原创 2020-12-10 11:34:51 · 1496 阅读 · 0 评论 -
python如何使用全局变量
通常在函数中,可以直接访问全局变量,但当函数中的局部变量与全局变量同名时,就不能直接访问了,可以使用global函数例如:全局变量 x = 1函数中访问x可以使用globals()[‘x’]原创 2020-11-09 16:19:55 · 634 阅读 · 0 评论 -
python中的del为什么不能删除值
x = 1y = xdel x结果y仍然等于1,那么为什么del不能删除值呢原来python中是没有办法删除值的,x和y都指向了一个值1,del删除只是删除了一个指向。那么如何删除值呢,实际上当你把所有指向删除时,机智无比的python自动会把无指向的值删除。...原创 2020-11-09 15:01:53 · 740 阅读 · 0 评论 -
python中的for循环和while循环哪个好
只要能够使用for循环,就不要使用while循环原创 2020-11-09 14:47:18 · 378 阅读 · 0 评论 -
python中的is运算符
双等号是判定值是否相等,而is判断是否相同,即指向了一个东西原创 2020-11-09 14:38:05 · 260 阅读 · 0 评论 -
python代码规范—— 规范参考
python的代码规范参考规范为Google python风格指南https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/contents/原创 2020-10-15 12:13:51 · 122 阅读 · 0 评论 -
python易忽略的代码规范
异常永远不要使用 except: 语句来捕获所有异常, 也不要捕获 Exception 或者 StandardError原创 2020-08-17 10:32:14 · 160 阅读 · 0 评论 -
python中打开文件
f=open(‘notfound.txt’, ‘r’)原创 2020-07-24 10:09:43 · 212 阅读 · 0 评论 -
python中assert的用法,多使用assert用来报错
assert n != 0, ‘n is zero!’原创 2020-07-24 09:38:32 · 351 阅读 · 0 评论 -
pickle引起的错误AttributeError: Can‘t get attribute ‘XXX‘处理方法
AttributeError: Can’t get attribute ‘XXX’有的时候python会报这样的错误,明明检查起来没什么错误,这其实是pickle引起的一个bug我遇到的问题,一共有三个文件以及类,假设分别为A.py,B.py,C.py其中C里有一个类C_,用pickle储存,B引用C的时候,需要from C import C_,然后再用pickle加载,在B中没什么问题但我创建了一个新文件A,A里面使用B的时候就报错AttributeError: Can’t get attribu原创 2020-07-21 19:50:32 · 13070 阅读 · 3 评论 -
python3中的import
绝对导入:import A.B或者from A import B相对导入:from . import B或者from …A import B原创 2020-07-13 09:41:38 · 153 阅读 · 0 评论 -
未来会更新的文章
1.关于注释,‘’‘ 和 # 的规范,观察很多git大神上两者混合使用,而且有一定的规律2.关于import中的…, …3.关于@property,以及@其他4.关于logging中的logger__name__5.关于命名 全大写6.关于__init__整个包以及main...原创 2020-07-09 09:58:41 · 254 阅读 · 0 评论 -
python中的迭代器iter的两种方法
迭代器即实现__iter__方法的对象,例如下面的DataLoader方法1的__iter__方法使用yield完成了迭代其中方法2的__iter__方法直接返回对象本身,而对象本身包括__next__方法,调用时自动使用实例化之后,可以it.__next__()或者next(it),得到结果都相同另外内置函数第一种方法,在__iter__方法中迭代class DataLoader: def __init__(self): self.a = 0 #def __原创 2020-06-30 16:52:14 · 525 阅读 · 0 评论 -
python中print输出浮点数保留几位小数
print("%.2f"%x)原创 2020-06-24 19:24:21 · 9859 阅读 · 0 评论 -
numpy使用的一些记录
一般来说要import numpy as np来减少代码量目前用到两个操作np.mean(list, axis = 0)按列取平均,10*128->128np.dot(matrix, float)是矩阵中每个数与float相乘10128 -> 10128如果之后用到更多都会顺便记录的...原创 2020-05-29 18:01:58 · 175 阅读 · 0 评论 -
python中将一个列表中所有元素的类型转换
a = [str(i) for i in a]很简单的所有转换,一行代码搞定原创 2020-06-20 17:17:35 · 4899 阅读 · 3 评论 -
phthon类中的方法使用默认参数
class A:def __init__(self):passdef print_name(self, age, name = ‘bob’):print(age)print(name)但好像不能将默认放在前,而接受放在后,但不给默认的情况原创 2020-06-18 11:07:41 · 148 阅读 · 0 评论 -
python中的eval将str转成你所存储的形式
有些python数据结构存储到pkl中不易修改存成一行又不易读取可以存成一行,作为ini读取时直接使用eval函数将str转成你所存储的形式原创 2020-06-17 15:35:44 · 224 阅读 · 0 评论 -
python中的正则表达式应用探究
pattern = re.compile(‘你的规则’)pattern.search和pattern.match都只是匹配了一遍即有一个结果就停掉,其中多个字段指的是你匹配到的多个字段pattern.findall是返回所有结果的list,没有字段位置所以最后选择了for res in pattern.finditer(self.sent):if res:res_list.append(res.group())因为每次匹配的东西没有多分组,所以就直接默认0组了迭代器很有用...原创 2020-06-17 14:57:41 · 118 阅读 · 0 评论 -
ConfigParser使用中出现的问题
ini是这样[1]name = 上涨数字options = (上涨|涨超|涨|涨逾|涨幅|涨幅达|涨约涨近|涨幅扩大至|急升)\d+.?\d*%?events = 股价上涨label = \d+.?\d*在使用compile的时候出现了一些问题pattern = re.compile(self.config[‘1’][‘options’])ConfigParser.InterpolationSyntaxError: ‘%’ must be followed by ‘%’ or ‘(’, fo原创 2020-06-17 14:13:29 · 530 阅读 · 0 评论 -
python将类传入另一个其他类中做处理并返回
文件1:import configparserfrom logging_learn import ConfigLearndef read_config():config = configparser.ConfigParser()config.read(‘conf_test.ini’)return configa = ConfigLearn()a.print_name(read_config())文件2 logging_learn:import logginglogging.basicC原创 2020-06-16 15:40:10 · 853 阅读 · 0 评论 -
python中的配置文件读取以及使用
配置文件后缀为.ini 方便区分例如[test_conf1]dog_name = Babolatest_list = [‘a’,‘b’,‘c’]cn_name = ‘美丽的霸王花’[test_conf2]dog_name = Babolatest_list = [‘a’,‘b’,‘c’]加载使用import configparserdef read_config():config = configparser.ConfigParser()config.read(‘conf_test原创 2020-06-16 12:22:54 · 297 阅读 · 0 评论 -
python中的正则表达式的测试,match,search
import repattern = re.compile(r’hello’)self.PATTERN = re.compile(r’hello’)res = re.match(pattern,string)其中match只从0位置匹配res = re.search(pattern,string)search可以从多个位置匹配另一种用法res = pattern.search(string)少写了一个re,而且感觉更清晰了...原创 2020-06-16 11:31:57 · 173 阅读 · 0 评论 -
如何查看python自带库的源码
import reprint(re.__file__)原创 2020-06-16 10:05:03 · 3452 阅读 · 0 评论 -
python代码过长换行
python代码过长时,需要换行这样显得美观,整洁,也容易阅读只要在后面加个\ 就可以换行写代码了原创 2020-06-15 19:57:51 · 681 阅读 · 2 评论 -
python中的not判断
not判断是一种bool判断在python中None, False, 空字符串"", 0, 空列表[], 空字典{}, 空元组()都相当于False即:not None == not False == not ‘’ == not 0 == not [] == not {} == not ()原创 2020-06-15 14:24:59 · 934 阅读 · 0 评论 -
关于python中的import,如何查看是否已经import了一个工具包
使用python经常会用到import有的时候不想预先加载,当设置触发器触发时再加载那么直接打印dir()就好了其中dir()出来的东西时一个list,包括你已经加载出来的东西原创 2020-06-05 12:11:11 · 2796 阅读 · 0 评论