
数据分析
文章平均质量分 51
Tomorrowave
人工智能专业学生,中国人工智能协会学生会员,拥有多个发明专利和软著、核心期刊论文,荣获国家级竞赛奖项(1个国一、1个国二、1个国三)以及省级,市校级奖项若干。
展开
-
pandas之axis=1 axis=0莎莎分不清?
axis 是个啥子简单来说:他就是坐标轴的方向 如何不搞混淆?表示横轴,方向从左到右,原创 2022-09-04 13:18:54 · 519 阅读 · 0 评论 -
pandas之离散化数据处理get_dummies以及填补缺失值的方法
用途在数据预处理的过程中我们经常遇到一些问题,比如说,多个离散型的数据在进行分析的过程,我们需要把离散型的数据变成一个具体的数据方便我们进行处理,很容易想到的就是整数,如果是两个对立事件我们可以很轻松的用0和1 来进行表示,这样的思考过程有利于我们的接下来的过程,当然很多机器学习学者很喜欢的独热编码也是一个道理,简单来说就是离散化数据的特征工程。当我们遇到一些差异性较为明显(人工操作一眼便能原创 2022-09-03 19:37:01 · 903 阅读 · 0 评论 -
线性回归、最小二乘、正态分布代码合集
给你一系列的有着联系的数据,有自变量和因变量这样内在联系的,然后通过对这些数据进行处理,利用数学方法进行线性方程建模,然后最终通过你建立的模型,对未提供给的自变量预测所谓预测,就是利用一个训练完毕的模型 ,根据输入的自变量 获得对应的输出。在预测任务中,如果模型 可以准确地提供预测,那么 是什么形式并不重要,而如果 的形式非常复杂且难以解释,我们可以将之称为黑盒模型(Black Box)。原创 2022-07-21 23:52:10 · 182 阅读 · 0 评论 -
pandas之基本操作
Series 一般由四个部分组成,分别是序列的值 data 、索引 index 、存储类型 dtype 、序列的名字 name 。其中,索引也可以指定它的名字,默认为空。DataFrameDataFrame 在 Series 的基础上增加了列索引,一个数据框可以由二维的 data 与行列索引来构造:基本函数head, tail 函数分别表示返回表或者序列的前 n 行和后 n 行,其中 n 默认为 5:info, describe 分别返回表的 信息概况和表中 数值列对应的主要统计量更全面的数据汇原创 2022-07-13 23:52:37 · 307 阅读 · 0 评论 -
Pandas之apply()函数 语法详解
Pandas 的 apply() 方法原创 2022-07-08 19:54:55 · 443 阅读 · 0 评论