
数据处理
chnhbhndchngn
这个作者很懒,什么都没留下…
展开
-
numpy求和np.sum()
numpy求和import numpy as npa = np.array([[1, 2, 1], [3, 4, 5]])# axis=0代表将行进行求和, # 也就是将各个列的不同行进行求和print("axis=0:", np.sum(a, axis=0))# axis=1代表将列进行求和, # 也就是将各个行的不同列进行求和print("axis=1:", np.sum(a, axis=1))# 所有元素求和print(np.sum(a))原创 2020-08-05 13:06:33 · 9581 阅读 · 1 评论 -
评估方法
from sklearn import metrics# 这些指标是scoring可选择的参数, # cross_val_score, GridSearchCV中的scoreing参数sorted(metrics.SCORERS.keys())结果:['accuracy', 'adjusted_mutual_info_score', 'adjusted_rand_score', 'average_precision', 'balanced_accuracy', 'comp...原创 2020-08-04 19:03:07 · 303 阅读 · 0 评论 -
全角文本变半角文本
在做自然语言处理的时候发现国内的好多语料库都是采用的全角编码的, 这会有些麻烦, 需要将其改编成半角编码import osdef Q2B(uchar): """全角转半角""" inside_code = ord(uchar) if inside_code == 0x3000: inside_code = 0x0020 else: inside_code -= 0xfee0 # 转完之后不是半角字符返回原来的原创 2020-07-26 10:24:06 · 262 阅读 · 0 评论 -
numpy 操作
向上, 向下取整import numpy as np# 向上取整, 但不是整数, 需要转换类型np.ceil(2.6)3.0np.ceil(2.6).astype(np.int)3# 向下取整, 但不是整数, 需要转换类型np.floor(2.6)2.0np.floor(2.6).astype(np.int)2...原创 2020-07-22 22:37:56 · 243 阅读 · 0 评论 -
python获取 英文标点符号
英文中的所有标点符号from string import punctuationpunctuation结果:'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'删除中文文本中的所有标点符号import repun = ",。……——“”‘’!;"punList = list(set(list(pun)))pattern = re.compile("|".join(punList))res = re.sub(patter..原创 2020-07-22 19:19:24 · 4348 阅读 · 0 评论 -
修改 matplotlib 的默认配置添加雅黑字体
永久解决jupyter中文显示问题原创 2019-12-08 20:27:44 · 1884 阅读 · 0 评论 -
文本数据的全角转半角
搜狗实验室http://www.sogou.com/labs/resource/ca.php提供了很多用于测试和练习的文本数据,不过这里面的数据好多都是使用的全角编码,这里进行修改一下,将全角改变为半角def Q2B(uchar): """全角转半角""" inside_code = ord(uchar) if inside_code == 0x3000: ...原创 2019-11-28 23:17:41 · 534 阅读 · 0 评论