- 博客(20)
- 收藏
- 关注
原创 【python数据分析12】——Pandas统计分析(创建透视表与交叉表)
数据透视表是数据分析中常见的工具之一,根据一个或多个键值对数据进行聚合,根据行或列的分组键将数据划分到各个区域。在pandas中,除了可以使用groupby对数据分组聚合实现透视功能外,还提供了更为简单的方法——透视表与交叉表。
2024-08-21 10:25:21
1202
原创 【python数据分析11】——Pandas统计分析(分组聚合进行组内计算)
依据某个或者几个字段对数据集进行分组,并对各组应用一个函数,无论是聚合还是转换,都是数据分析的常用操作。pandas提供了一个灵活高效的groupby方法,配合agg或apply方法,能够实现分组聚合的操作。
2024-08-20 22:19:11
1705
原创 【python数据分析10】——Pandas统计分析(转换与处理时间序列数据)
常用的数据类型还有时间类型,通过时间类型数据能够获取到对应的年月日和星期等信息。但时间类型数据在读入python后常常以字符串形式出现,无法实现大部分与时间相关的分析。pandas库继承了numpy库的datetime64以及timedelta64模块,能快速实现时间字符串的转换、信息提取和时间运算。
2024-08-19 09:00:00
975
原创 【python数据分析09】——Pandas统计分析(DataFrame常用操作)
DataFrame是最常用的pandas对象。完成数据读取后,数据就以DataFrame数据结构存储在内存中,但此时并不能直接开始统计分析工作,需要使用DataFrame的属性与方法对数据的分布、大小等基本的数据状况有一个了解。只有对数据基本状况有了一个深度的了解,才能够依据数据的状况,进行量身定制的统计分析。
2024-08-18 20:08:34
3281
原创 【python数据分析08】——Pandas统计分析(读/写不同数据源的数据)
统计分析除了包含单一数值型特征的数据集中趋势、离散趋势和峰度与偏度等统计知识外,还包含了多个特征比较计算等知识。数据读取是进行数据预处理、建模与分析的前提。不同的数据源,需要使用不同的函数读取。pandas内置了10多种数据源读取函数和对应的数据写入函数。常见的数据源有3种。分别是数据库数据、文本文件(一般文本文件和csv文件)和Excel文件。例如,数据存在于3个系统中,3个系统中的数据源并不相同,所以需要使用多种数据读取方式读取相应数据。
2024-08-18 11:29:29
1199
原创 【python数据分析07】——matplotlib绘图(直方图、饼图、箱线图)
另外3种数据分析常用的图形是,主要用于分析数据内部的分布状态和分散状态。
2024-08-16 17:01:44
3137
3
原创 【python数据分析06】——matplotlib绘图(散点图、折线图)
数据分析中最常用的两种图形是散点图和折线图,这两种图形都能够分析不同数值型特征间的关系。其中,散点图主要用于分析特征间的相关关系,折线图用于分析自变量特征和因变量特征之间的趋势关系。
2024-08-15 09:00:00
2977
原创 【python数据分析05】——matplotlib绘图基础语法
matplotlib中应用最广的是matplotlib.pyplot模块,这个模块是一个命令风格函数的集合。
2024-08-14 20:45:17
935
原创 【python数据分析04】——Numpy统计分析
该函数和loadtxt函数相似,不过它面向的是结构化数组和缺失数据,它通常使用的参数有3个,即存放数据的文件名参数“fname”,分隔符“delimiter”和是否含有列标题参数“names”该函数是最常用的排序方法,无返回值。输出的结果是一组结构化的数据,结构化数组可以用dtype选项指定一系列用逗号隔开的说明符,指明构成结构体的元素以及他们的数据类型和顺序。使用argsort函数和lexsort函数,可以在给定一个或多个键时,得到一个由整数构成的索引数组,索引值表示数据在新的序列中为位置。
2024-08-14 17:28:43
1518
原创 【python数据分析02】——Numpy数值计算基础02
在对数组进行操作时,经常要变换数组的形态,所以这篇文章,我们讲几个常用的改变数组形态的函数。
2024-07-17 18:56:21
968
原创 【Python数据分析01】——Numpy数值计算基础
首先需要安装【软件安装】手把手教你在Windows上安装anaconda和jupyter-优快云博客NumPy 是一个用于科学计算的Python库。它的全称是。简单来说,NumPy 不仅提供了一种非常方便和高效的方式来存储和处理大规模的数组和矩阵运算。NumPy的数据容易能够保存任意类型的数据,使得NumPy可以无缝并快速的整合各种数据。
2024-07-15 10:16:47
1061
原创 【自然语言处理01】——语音识别(LAS模型的原理详解)
随着ChatGPT的兴起,自然语言处理NLP(Natural Language Processing)也是相当的火,所以在这里详细讲解NLP的相关理论基础以及他的应用。
2024-07-10 14:45:45
2195
2
原创 【机器学习基础详解01】——支持向量机(SVM)算法原理与实践
那么的形式是怎么样的呢?这一小节研究的形式。对任意两个向量和,有,那么仍然能够通过一些技巧获得测试样本X的类别信息,从而完成对测试样本类别的预测。定义为核函数,是实数。下面举例说明核函数K以及低维到高维的映射的关系。例子1:已知求假设是一个将二维向量映射到三维向量映射,如下所示:我们来看下核函数的形式,假设有两个二维向量:,根据前边得:,那么有如下式子:上述就是一个已知求的例子。例子2:已知求假设X是一个二维向量,。有如下式子:(为什么这么表示呢,这是一种。
2024-07-08 17:32:03
1649
3
原创 【软件安装】手把手教你在linux上安装pycharm
选择是否在/usr/local/bin/charm下创建charm命令,便于使用(直接在命令行执行。linux和windows系统不一样,需要下载tar.gz后缀的,而windows是.exe后缀。保存到本地磁盘即可(这里以pycharm-community-2020.2.5为例)出现以下界面,即安装成功,可以使用pycharm了。点击Download下载自己所需的版本即可。首先在终端进入pycharm的bin文件夹。,即可打开pycharm工具)然后启动pycharm等待即可。输入密码进行身份认证。
2023-06-24 16:22:22
2034
1
原创 【软件安装】手把手教你在ubuntu 上安装Anaconda
6. 输入conda list验证,可以看到anaconda的安装的包。可以先下载到自己桌面上,然后用Xftp传输到虚拟机中。2. 在文件所在的文件夹下,进行安装。conda命令可能会找不到。下载地址(清华镜像)
2023-06-19 10:40:56
309
原创 使用Anaconda创建虚拟环境并安装相关的包
Anaconda 是一个打包的集合,里面预装好了conda、某个版本的python、各种packages等。固定包的版本:conda install package_name=x.xx。成功了成功了,一开始还是红红的,又安装了一遍居然成功了。当前Python版本为刚才创建的版本,即创建成功。问题更多,红色看的都头疼,找啊找,找到了解决方法。又有错,换了个镜像居然成功了,真的莫名其妙。检验是否安装及当前conda的版本。(2)查看存在哪些虚拟环境。(1)常看安装哪些包。不管了,今天任务完成。
2023-05-29 20:45:22
9738
1
原创 智能计算—模糊计算总结
模糊计算是计算智能的一个重要领域,是以模糊集理论为基础的。它可以模拟人脑非精确、非线性的信息处理能力,在许多应用领域内都有用途。人们通常可以用“模糊计算”笼统地代表诸如模糊推理(FIS,Fuzzy Inference System)、模糊逻辑(Fuzzy Logic)、模糊系统等模糊应用领域中所用到的计算方法及理论。
2022-04-21 21:26:20
8710
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人