
python库
文章平均质量分 70
IRON POTATO
这个作者很懒,什么都没留下…
展开
-
wordcloud生成词云图(含形状、颜色设置)
一、导入和主要方法1、导入wordcloud包一班生成词云图之后还要显示出来,所以还会用到matplotlib如果要设置mask蒙版,还需要从imageio导入imread()函数如果需要设置词云中字体的颜色,还会用到matplotlib中的colorsimport wordcloudimport matplotlib.pyplot as pltfrom imageio import imreadfrom matplotlib import colors2、主要方法wc = wordc原创 2021-06-02 14:50:53 · 51355 阅读 · 5 评论 -
jieba分词
一、jieba简介jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引擎模式,下面是三种模式的特点。精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析。全模式:将语句中所有可能是词的词语都切分出来,速度很快,但是存在冗余数据。搜索引擎模式:在精确模式的基础上,对长词再次进行切分,提高召回率,适合用于搜索引擎分词。#精确模式jieba.lcut(text, cut_all=False)#全模式jieba.lcut原创 2021-06-01 09:35:00 · 31600 阅读 · 3 评论 -
Numpy的其他常用方法
1、np.eye(shape)形成单位阵。2、np.tile(n,shape)将数组n作为一个大的“元素”,按照shape形式进行复制。原创 2021-05-18 09:24:58 · 155 阅读 · 0 评论 -
Matplotlib基础知识
Matplotlib是数据可视化的基础,可以用来绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、甚至是图形动画等 matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。 导入方式import matplotlib.pyplot as plt 英文释义英文汉语plotn情节;v绘制表格,密谋grid网格tick标记,刻度axis轴axes轴的复数形式几个对象的关系figure相当于画板,axis就原创 2021-05-17 13:36:37 · 2460 阅读 · 0 评论 -
Numpy简单方法
1、Numpy简介1.1、使用Numpy,主要是因为它能够方便快速的进行矩阵运算,涵盖线性代数运算、傅里叶变换和随机数生成等功能。1.2、Numpy中的ndarray是一个多维数组,该对象由描述数据的元数据和数据本身组成,一般的修改只是针对元数据,而不会修改实际数据。1.3、Numpy中的数据元素一般都是用来存储一样类型的。2、ndarray对象的属性2.1、属性名2.2、属性的几种理解(1)ndim,秩,也是维数,同时等于len(n.shape)(2)shape,形状元组元素个数代表维数原创 2021-04-27 09:54:23 · 283 阅读 · 0 评论 -
python--pprint库
pprint库,漂亮打印,相比于print()直接打印在同一行,pprint能够将可迭代类型每一项都另起一行打印,起到美化的效果。pprint库有两个常用函数pprint()和pformat(),前者是直接打印,后者返回一个字符串(同样是美化之后的,打印出来也是美化的)pprint()pprint(indent = 1,width = 80,depth = None,stream = None)indent 缩进width 宽度,默认是80depth 打印深度,就是打印深入到几层可迭代类型s原创 2021-03-21 09:33:23 · 497 阅读 · 0 评论 -
python----正则表达式re库
正则表达式是干什么的使用正则表达式就是为了从一大串子字符串中获取你想要的那部分,如果你明确的知道你想要的就是字符串"wjg946"那么就不需要使用一些高级的匹配用法,其实如果你知道了你想要的字符串就是"wjg946"那还匹配什么,所一般都是只知道所需字符串的部分特征,要做的就是根据这些特征把想要的字符串从大量文本中揪出来。python中使用正则表达式一般都是使用re库,所以写这个。基本知识1、匹配规则d w s.匹配任意1个字符(除了换行符\n)[ ]匹配 [ ] 中原创 2021-03-19 14:12:52 · 273 阅读 · 0 评论 -
Python下的json使用
概念介绍1、JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。2、在python中的json应用就是实现一些数据结构(列表、元组、字典)到字符串之间的转换,当数据结构变为字符串之后就很容易在程序之间传递。3、Python中序列化指的是将Python中的数据结构(列表、元组、字典)编码转换为JSON格式的字符串;而反序列化指的是将JSON格式的字符串编码转换为Python中的数据结构(列表、元组、字典);4、元组经过序列化处理后,再通过反序列化处理后,数据类原创 2021-03-16 20:53:18 · 426 阅读 · 0 评论 -
python库----random
简介计算机中通过采用梅森旋转算法生成的(伪)随机序列元素。random库包含两类函数,常用的共8个: 基本随机函数: seed(), random() 扩展随机函数:randint(), getrandbits(), uniform(), randrange(), choice(), shuffle()内部函数介绍random.seed()初始化给定的随机数种子,默认为当前系统时间。使用随机数种子的好处是可以复现有随机数的程序。random.seed(2)#产生种原创 2021-02-21 11:31:16 · 122 阅读 · 0 评论