
Python数据分析、挖掘与可视化
文章平均质量分 72
记录Python数据分析、挖掘与可视化学习
数据攻城小狮子
获取完整代码之类的直接私信。
展开
-
Tableau招聘信息数据可视化
Tableau招聘信息数据可视化,主要有学历与经验分布柱状图,公司行业分布与平均薪资折柱混合图,公司类型分布与平均薪资折柱混合图,平均薪资分布折线图,城市平均薪资词云图,学历与经验平均薪资折线图,公司规模分布与平均薪资折线图,城市岗位数量散点图原创 2023-06-07 05:28:52 · 1575 阅读 · 0 评论 -
文本分析实战:利用 Python 剖析用户评论数据(jieba,snownlp,gensim)
本文聚焦电商用户评论数据,展示如何用 Python 进行全面文本分析。在技术选型上,选用 pandas、numpy 处理数据,jieba、re、snownlp 进行文本处理,基于 gensim 构建 LDA 模型做主题建模,利用 matplotlib 和 wordcloud 可视化。代码实现涵盖数据预处理,包括缺失值处理、文本清洗、分词等;通过自定义情感词典结合 SnowNLP 进行情感分析;用 LDA 模型完成主题建模;还实现生成报告和可视化,生成包含统计、情感、主题信息的报告及多种可视化图表。原创 2025-02-24 12:07:51 · 1038 阅读 · 0 评论 -
Flask+pyecharts实现电影数据分析可视化
之前有写过pyecharts实现电影数据分析可视化和Django+pyecharts实现电影数据分析可视化,但是综合起来感觉还是有缺陷,所以我使用Flask+pyecharts重新整合一下电影数据可视化。原创 2023-06-11 07:25:32 · 1673 阅读 · 0 评论 -
Django+pyecharts实现电影数据分析可视化
文章主要实现Django结合pyecharts做一个电影数据可视化的小网站/系统。原创 2023-04-04 22:16:39 · 2214 阅读 · 0 评论 -
pyecharts实现电影数据分析可视化
根据豆瓣电影TOP250排行榜数据,使用pyecharts进行可视化分析。原创 2023-04-03 23:19:40 · 3740 阅读 · 4 评论 -
使用ECharts制作可视化图表
文章目录下载echarts.js绘制一个简单的图表下载echarts.js推荐博客Echarts.js下载及简易Demo绘制一个简单的图表<!DOCTYPE html><html><head> <meta charset="utf-8"> <title>ECharts</title> <!-- 引入echarts.js --> <script src="echarts.js"></s原创 2021-11-03 20:30:41 · 991 阅读 · 0 评论 -
Python文本分析(NLTK,jieba,snownlp)
自然语言处理(NLP)是研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,也是人工智能领域中一个最重要、最艰难的方向。说其重要,因为它的理论与实践与探索人类自身的思维、认知、意识等精神机制密切相关:说其艰难,因为每一项大的突 破都历经十年乃至几十年以上,要耗费几代人的心血。近些年,NLP在中文分词、词性标注、词汇语义、句法解析方面均获得了很大的突破。大量的技术都应用于商业实践,并在商业领域获得了良好的市场和经济效益。文本方面主要有:基于自然语言理解的智能搜索引擎和智能检索、智能机器翻译...原创 2022-03-15 11:43:30 · 8331 阅读 · 4 评论 -
Python jieba库的使用
jieba 是 Python 中一个重要的第三方中文分词函数库文章目录jieba 库概述jieba 库解析jieba 库概述对于一段英文文本,例如,“I like python and big data”,如果希望提取其中的单词,只要使用字符串处理的split()方法即可。例如str="I like python and big data"print(str.split())['I', 'like', 'python', 'and', 'big', 'data']对于一段中文文本,如"我原创 2021-03-13 17:24:37 · 458 阅读 · 1 评论 -
头歌Python数据框、序列定义及数据处理应用实验闯关
头歌Python数据框、序列定义及数据处理应用实验闯关原创 2022-04-06 12:12:10 · 33773 阅读 · 22 评论 -
Numpy+Pandas+Matplotlib学习
参考的教程是哔哩哔哩孙兴华UP主的视频,边学边做原创 2022-09-18 17:24:46 · 1512 阅读 · 2 评论 -
Python_matplotlib库绘制03(雷达图,三维图)
文章目录雷达图绘制空白极地图绘制一个极坐标点绘制多个极坐标点极坐标连线闭合颜色填充三维图根据数据绘制三维曲线三维柱状图雷达图绘制空白极地图import matplotlib.pyplot as pltplt.polar()plt.show()绘制一个极坐标点import numpy as npimport matplotlib.pyplot as pltplt.polar(0....原创 2020-04-25 11:58:28 · 1579 阅读 · 0 评论 -
Python_matplotlib库绘制02(柱状图,饼状图)
文章目录柱状图一个简单柱状图改变其颜色设置标签堆叠柱状图横向条形图并列柱状图饼状图简单饼状图一块饼图到中心距离设置颜色显示百分比柱状图一个简单柱状图import matplotlib.pyplot as pltnum_list=[1,5,6.5,8,11]plt.bar(range(len(num_list)),num_list)plt.title("zztu")plt.xlabel...原创 2020-04-22 21:38:18 · 770 阅读 · 1 评论 -
Python_matplotlib库绘制01(折线图,散点图)
运用matplotlib绘制简单图表安装matplotlib在Linux系统中安装matplotlib在Windows系统中安装matplotlib测试matlpotlib绘制简单的折线图绘制简单的散点图不足之处安装matplotlib在Linux系统中安装matplotlibpip install --user matplotlib在Windows系统中安装matplotlib在ht...原创 2020-03-17 21:51:39 · 940 阅读 · 0 评论 -
数据可视化包Matplotlib
文章目录Matplotlib绘图基础Matplotlib绘图基本流程中文字符显示坐标轴字符刻度标注Matplotlib常用图形绘制散点图线性图柱状图Matplotlib绘图基础Matplotlib绘图基本流程import matplotlib.pyplot as pltimport numpy as npplt.figure(1)#创建画布x=np.linspace(0,1,1000)plt.subplot(2,1,1)#分为2x1图形阵,选择第一张图片绘图plt.title('y=x^2&原创 2021-11-29 23:02:16 · 4189 阅读 · 4 评论 -
pandas数据分析(三)
DataFrame数据处理与分析处理超市交易数据中的异常值处理超市交易数据中的缺失值处理超市交易数据中的重复值使用数据差分查看员工业绩波动情况使用透视表与交叉表查看业绩汇总数据使用重采样技术按时间段查看员工业绩原创 2023-03-16 20:13:56 · 2202 阅读 · 1 评论 -
pandas数据分析(二)
DataFrame数据处理与分析读取Excel文件中的数据筛选符合特定条件的数据查看数据特征和统计信息按不同标准对数据排序使用分组与聚合对员工业绩进行汇总原创 2023-03-08 14:37:59 · 2195 阅读 · 0 评论 -
pandas数据分析(一)
一般而言,数据分析工作的目标非常明确,即从特定的角度对数据进行分析,提取有用信息,分析的结果可作为后期决策的参考。扩展库pandas是基于扩展库numpy和matplotlib的数据分析模块,是一个开源项目,提供了大量标准数据模型,具有高效操作大型数据集所需要的功能,可以说pandas是使Python能够成为高效且强大的数据分析行业首选语言的重要因素之一。在各领域都存在数据分析需求,我们在实际应用和开发时经常会发现,很少有数据能够直接输入到模型和算法中使用,基本上都需要进行一定的预处理,例如处理原创 2023-03-06 23:06:16 · 808 阅读 · 0 评论 -
Pandas学习01
文章目录一维数组与常用操作时间序列与常用操作一维数组与常用操作import pandas as pdimport matplotlib.pyplot as plt# 设置输出结果列对齐pd.set_option('display.unicode.ambiguous_as_wide',True)pd.set_option('display.unicode.east_asian_width',True)# 自动创建从0开始非负整数索引s1=pd.Series(range(1,20,5))#原创 2021-07-01 22:08:40 · 277 阅读 · 2 评论 -
numpy数组与矩阵运算(二)
矩阵生成与常用操作矩阵生成矩阵转置查看矩阵特性矩阵乘法计算相关系数矩阵计算方差、协方差、标准差计算特征值与特征向量计算逆矩阵求解线性方程组奇异值分解函数向量化原创 2023-03-05 14:07:00 · 770 阅读 · 0 评论 -
numpy数组与矩阵运算(一)
numpy数组及其运算创建数组测试两个数组的对应元素是否足够接近修改数组中的元素值数组与标量的运算数组与数组的运算数组排序数组的内积运算访问数组中的元素数组对函数运算的支持改变数组形状数组布尔运算分段函数数组堆叠与合并原创 2023-03-04 15:42:51 · 687 阅读 · 0 评论 -
Numpy索引、切片与迭代
文章目录副本与视图索引与切片整数索引副本与视图在Numpy中,尤其是在做数组运算或数组操作时,返回结果不是数组的副本就是视图。在Numpy中,所有赋值运算不会为数组和数组中的任何元素创建副本。numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。【例】import numpy as npx=np.array([1,2,3,4,5,6,7,8])y=xy[0]=-1print(x) # [-1 2 3 4原创 2021-03-24 15:42:41 · 238 阅读 · 0 评论 -
Numpy 数组及其运算 02
书接上回Numpy 数组及其运算 01文章目录1.访问数组中的元素2.数组对函数运算的支持3.改变数组的形状4.数组布尔运算5.分段函数6.数组堆叠与合并1.访问数组中的元素import numpy as npb=np.array([[1,2,3],[4,5,6],[7,8,9]])print(b)print(b[0]) # 第一行所有元素print(b[0][0]) # 第一行第一列的元素print(b[0,2]) # 第一行第三列元素,等价与b[0][2]print(b[[0,1]原创 2021-04-22 23:50:12 · 375 阅读 · 1 评论 -
Numpy 数组及其运算 01
文章目录1.创建数组2.测试两个数组的对应元素是否足够接近3.修改数组中的元素值4.数组与标量的运算1.创建数组我前面写的几篇关于numpy数组创建的文章Numpy数据类型及数组创建01Numpy数据类型及数组创建022.测试两个数组的对应元素是否足够接近import numpy as npx=np.array([1,2,3,4.001,5])y=np.array([1,1.999,3,4.01,5.1])print(np.allclose(x,y))print(np.allclose(原创 2021-04-21 18:58:21 · 336 阅读 · 0 评论 -
Numpy 数组操作01
文章目录更改形状数组转置更改维度更改形状在对数组进行操作时,为了满足格式和计算的要求通常会改变其形状。numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。【例】通过修改 shape 属性来改变数组的形状。import numpy as npx=np.array([1,2,3,4,5,6,7,8])print(x.shape) # (8,)x.shape=[2,4]print(x)'''[[1 2 3 4] [5原创 2021-03-24 16:55:24 · 414 阅读 · 7 评论 -
Numpy练习-数组的创建
文章目录什么是numpy?如何安装numpy?什么是n维数组对象?如何区分一维、二维、多维?以下表达式运行的结果分别是什么?0 * np.nannp.nan == np.nannp.inf > np.nannp.nan - np.nan0.3 == 3 * 0.1将numpy的datetime64对象转换为datetime的datetime对象。dt64 = np.datetime64('2020-02-25 22:10:10')如何将numpy的datetime64对象转换为datetime的dat原创 2021-03-09 23:38:50 · 4706 阅读 · 3 评论 -
Numpy数据类型及数组创建02
文章目录数组的创建1.依据现有数据来创建 ndarray1.1通过array()函数进行创建。1.2通过asarray()函数进行创建1.3通过fromfunction()函数进行创建2.依据 ones 和 zeros 填充方式2.1零数组2.2 1数组2.3空数组2.4单位数组2.5对角数组2.6常数数组3.利用数值范围来创建ndarray数组的创建导入 numpyimport numpy as npnumpy 提供的最重要的数据结构是 ndarray, 它是 python 中 list 的扩展原创 2021-03-09 22:33:59 · 731 阅读 · 6 评论 -
Numpy数据类型及数组创建01
文章目录1.常量numpy.nannumpy.infnumpy.pinumpy.e2.数据类型3.时间日期和时间增量4.数组的创建1.常量numpy.nan1.表示空值。2.nan = NaN = NAN【例】两个numpy.nan是不相等的。import numpy as npprint(np.nan == np.nan) # Falseprint(np.nan != np.nan) # True在IDLE里执行失败,在Jupyter Notebook里执行成功numpy.is原创 2021-03-08 22:51:22 · 1625 阅读 · 7 评论 -
Numpy基础(数组和矢量计算)02
文章目录数组转置和轴对换dot()函数通用函数常用函数表meshgrid()将条件逻辑表述为数组运算数学和统计⽅法数组转置和轴对换import numpy as nparr=np.arange(18).reshape((3,6))arr-------------------array([[ 0, 1, 2, 3, 4, 5], [ 6, 7, 8, 9, ...原创 2020-05-01 15:37:33 · 457 阅读 · 1 评论 -
Numpy基础(数组和矢量计算)01
NumPy(Numerical Python的简称)是Python数值计算最重要 的基础包。⼤多数提供科学计算的包都是⽤NumPy的数组作为 构建基础。文章目录ndarray生成一个数组数组类型自定义数组数组的运算新建特殊数组数据类型索引和切片ndarray生成一个数组这是一个一维数组,包含5个随机数import numpy as npdata=np.random.randn(5)d...原创 2020-04-30 14:55:06 · 252 阅读 · 0 评论