自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

捡垃圾的朵

统计学日常学习总结

  • 博客(30)
  • 收藏
  • 关注

原创 Python中的json文件操作

【代码】Python中的json文件操作。

2025-02-12 14:20:37 319

原创 Python的读写文件(open(),read(),write())

⑤推荐使用with,避免资源泄露,提高代码的安全性和可读性。总之,with是Python资源管理的最佳实践,应尽可能的使用。with open()是可以自动关闭文件的,即使发生异常也不会造成资源的泄露。③with主要用于自动管理资源,避免手动close()、release();④with常用于文件操作、数据库连接、线程锁、网络请求等确保资源释放的场景。with语句可以可以自动关闭文件,避免资源泄露。①代码更简洁,不需要手动close();例1:采用open读取txt文件。例2:采用open读取txt文件。

2025-02-11 16:47:17 429

原创 Excel文件的读取

如果要读取excel(.xlsx)文件,应该使用pandas库或openpyxl库。而不是open。

2025-02-11 14:30:32 460

原创 全局变量和局部变量

局部变量是在函数内部定义的变量,其作用域仅限于该函数,函数执行结束后,局部变量被销毁,无法在函数的外部进行访问。例1:(局部变量的例子)全局变量是函数外部定义的变量,作用域是整个程序。所有函数都可以访问该变量,但如果函数内部想要直接修改全局变量,则需要采用global关键字。例2:全局变量的学习在函数内部想要修改全局变量,必须使用global关键字声明,否则Python会认为则是一个新的局部变量。

2025-02-11 09:40:52 249

原创 Python 条件判断语句学习手册(if、else)

elif语句可以将多个条件逻辑嵌套在一起。

2025-02-10 14:14:21 143

原创 Python基础-元组tuple的学习

元组的内存优化:由于元组是不可变的,它们比列表更节省内存,且访问速度通常比列表快。因此,元组适用于不需要修改的、相对较小的元素集合。元组在 Python 中是一个非常有用的数据结构,提供了高效且不可变的元素存储方式。其主要特点是不可变性,使得它比列表更加安全和高效,特别适用于数据不会改变的场景。

2025-02-09 19:58:05 323

原创 Python函数的定义和调用

def 函数名(参数1, 参数2, ...):"""文档字符串(可选)"""函数体return 返回值(可选)def :关键字用于定义函数。函数名: 需要符合 Python 变量命名规则。参数 :是可选的,用于传递数据。return :语句用于返回值,若没有 return,默认返回 None。

2025-02-08 17:13:12 315

原创 如何matplotlib.pyplot(plt)不能显示中文的问题

解决 matplotlib 中中文显示问题的关键是找出 matplotlib 内置支持的字体。从图形中可以发现,我想画的堆积条形图的横坐标标签、纵坐标标签、标题的文字都没有显示出来,而且变成了一堆方框。针对这个问题,我们的处理方法如下。在绘制图形时,如果标题、标签、图例等包含中文,matplotlib 可能无法正确显示中文字符,通常会显示为小方框或者乱码。可以发现是有很多中的,我们选择python有的一种中文字体即可。可以发现,标题、横坐标标题、纵坐标标题,就已经显示为中文了。

2025-02-08 12:13:14 714

原创 利用python绘制统计控制过程(SPC)中的X-bar图

X-bar 控制图是统计过程控制(SPC)中一种常用的控制图,它用于监控一个过程的均值(即样本平均值)是否稳定、是否处于控制状态。X-bar 控制图特别适用于当过程的输出是连续数据时,且数据可以分组为多个样本时。比如,我的原始数据是100个零件的尺寸,我可以计算1、2、3样本的均值,再计算2、3、4样本的均值,再计算3、4、5样本的均值,…,再计算98、99、100样本的均值。样本均值(X-bar):每次抽取一组样本,计算样本的均值,X-bar 就是这些样本均值的图示。

2025-02-08 09:47:52 328

原创 正交矩阵的特征值一定为1或者-1。

为什么正交矩阵的特征值一定为1或者-1?

2024-11-25 22:36:15 542

原创 数据收集—自动化采集脚本(爬虫)

1、什么叫自动化采集脚本:自动去采集网站上我们需要的数据。2、批量采集数据:谷歌浏览器—百度—东方财富网。①安装(pip install)和导入模块(import);②本次操作需要的模块requests、pandas、re;re不用安装,是python自带的。③模块说明:requests—用来请求网站的数据;pandas—用来操作表格;re—用来筛选数据的。3、爬虫:请求某一个网站的数据。①确定目标:请求哪一个网址;②以什么样的身份去请求?③请求。

2024-08-15 02:43:19 4744

原创 针对pycharm无法导入模块的问题解决

3、会得到两个路径,复制第一个路径:C:\Users\jenny\AppData\Local\Programs\Python\Python37\python.exe。4、回到pycharm的界面:文件—设置—项目—python解释器—添加解释器—添加本地解释器。5、选择现有—点击后面的三个点,将复制好的路径粘贴进去,然后一直点确定。可以看出,经过以上的操作,模块已经成功导入,并可以利用其相应的功能等。2、在pycharm中import的时候,发现会报错。1、打开终端:组合键windows+R,输入cmd。

2024-08-14 15:55:18 1228

原创 如何解决pycharm中的‘pip’不是内部和外部命令

1、打开控制面板的卸载程序,将python3.7.8和python launcher进行卸载(不同人的版本可能不一样,有的人可能是python3.8或3.9,不用管),反正将这两个卸载了就是。2、重新安装python的解释器,解释器的下载地址我放百度网盘了:链接:https://pan.baidu.com/s/1rGqWkzcLsT7tEatpm0dJ8A。2、弹出 “编辑环境变量” 窗口,点击 “新建”,将 Scripts 的绝对路径粘贴进去,点击确定即可。3、在安装的时候,画红线的地方一定要勾选。

2024-08-14 14:17:24 1541

原创 Python实现一元线性回归

Python实现一元线性回归

2024-08-13 22:25:51 469

原创 6种常见的数据预处理方法

属性具有多种类型,包括效益型、成本型、区间型、中间型等。这四种属性,效益型属性越大越好,成本型属性越小越好,区间型属性是在某个区间最佳,中间型是越接近某个数越好。(3)归一化:属性值表中不同指标的属性值的数值大小差别很大,为了直观,需要把属性值表中的数值归一化,即把表中数值均变换到[0,1]区间上。(1)指标正向化处理:属性值有多种类型,为了便于处理,可以进行极大化处理,使得表中任一属性下性能越优的方案变换后的属性值越大。(2)无量纲化:每一列数值具有不同的单位(量纲),可以对每个指标进行无量纲化。

2024-05-25 00:12:06 993

原创 评价模型-灰色关联分析

关联度:关联度是因素(指标)之间关联性大小的度量,它定量地描述了因素之间相对变化的情况。从思路上看,关联度分析属于几何处理范畴。基本思想是根据序列曲线集合形状的相似程度来判断其联系是否紧密,即认为几何形状越接近,关联程度越大。因此,利用灰色关联度可对评价对象的优劣进行比较分析。理解关联度的例子:在以上的例子中,如果把总收入看作参考序列,把招商引资和农业收入就是被比较的对象。①招商引资和总收入(参考序列)变化趋势很相似;②农业收入和总收入(参考序列)变化趋势不太相似;

2024-05-13 13:30:19 2443 1

原创 线性规划问题——基于Python

【代码】线性规划问题——基于Python。

2023-05-31 14:50:05 239

原创 线性代数相关知识(矩阵)——基于Python

【代码】线性代数相关知识(矩阵)——基于Python。

2023-05-30 23:11:27 310

原创 Python入门——程序的组织结构

@爱学习的朵目录1 顺序结构2 对象的布尔值3 选择结构(if)3.1 单分支结构(if)3.2 双分支结构(if...else...)(2选1执行)3.3 多分支结构(多选1执行)3.4 分支的嵌套4 循环结构(while、for in)1 顺序结构2 对象的布尔值Python一切皆对象,所有对象都有一个布尔值。以下对象的布尔值为False。(1)False(2)数值0(3)None(4)空字符串(5)空列表(6)空元组(7)空字典(8)空集合其他对象的布尔值均为True。

2022-05-03 10:43:29 338

原创 python入门——input函数、运算符

@爱学习的朵目录1 input函数2 运算符2.1 算数运算符2.1.1 标准算数运算符2.1.2 取余运算符2.1.3 幂运算符2.2 赋值运算符(顺序:从右到左)2.2.2 链式赋值2.2.2 参数赋值2.2.3 系列解包赋值2.3 比较运算符(结果为布尔类型)2.3.1 > 和<和 >= 和<= 和!=2.3.2 对象value的比较2.3.4 对象id的比较2.4 布尔运算符2.4.1 and2.4.2 or2.4.3 not(对布尔类型取反)2.4.4 in和not i

2022-05-02 22:01:00 1704

原创 Python入门——print函数、转义字符、数据类型介绍

@ 爱学习的DUO目录1 print()函数1.1 输出到控制台1.1.1 输出数字1.1.2 输出字符串1.1.3 输出表达式1.2 输出到文件中2 转义字符2.1 换行字符 \n2.2 tab字符 \t3 查看python的key words4 常见数据类型4.1 整数型 int4.2 浮点型 float4.3 布尔型(True、False)4.4 字符串型 str1 print()函数1.1 输出到控制台1.1.1 输出数字print(520) #5201.1.2 输出字符串prin

2022-05-02 19:42:58 1211

原创 【Python】——筛选存在空值的行or非空值的行

@ 爱学习的阿朵1 数据说明import pandas as pdtest = pd.read_excel('D:/pp/test_null.xlsx','Sheet1');testnote:① NaN:not a number② NaT:not a time2 筛选【有空值】的行2.1 任意列有空值的行test[test.isnull().T.any()] #无论哪列,有空值的被选出来2.2 指定列有空值的行例1:只筛选【生日】列存在空值的行。test[test[['生日

2022-04-30 09:50:09 12280

原创 【Python】——concat函数

@爱学习的DUO目录1 数据说明2 纵向拼接(默认)3 横向拼接4 总结语法:result = pd.concat([df1, df2], axis= ‘ ')①axis=0,纵向拼接(默认)②axis=1,横向拼接1 数据说明import pandas as pddf1 = pd.DataFrame({'Name':['张三','李四','王五'], 'Age':[25,26,27]})df2 = pd.DataFrame({'Name':['大六'],'Age':[30]})df

2022-04-29 21:20:31 46808

原创 【python】———merge函数

@爱学习的DUO目录1 数据读取(A、B表)2 当右表无重复项3 当右表有重复项3.1 数据读取(C表)3.2 不对右表去重3.3 对右表去重处理3.4 总结merge()表示将【左表】和【右表】,按某个均有的字段,进行横向匹配。1 数据读取(A、B表)import pandas as pdA = pd.read_excel('D:/pp/test.xlsx','Sheet1');AB = pd.read_excel('D:/pp/test.xlsx','Sheet2');BA表(左)

2022-04-29 19:05:57 19371 2

原创 trunc()

@爱学习的阿朵目录1、trunc()截断函数1.1 trunc()截断数字1.2 trunc()截断日期2、to_char()函数3、to_date1、trunc()截断函数含义:① trunc(number)表示截断数字② trunc(date)表示截断日期1.1 trunc()截断数字select TRUNC(15.79,1) from dual; --15.7,保留小数点后一位select TRUNC(15.123456789,2) from dual; --15.12,保留小数点

2022-04-26 14:38:42 2046

原创 SQL的join和left join

@爱学习的阿朵目录1、数据说明1.1 websites表(5行)1.2 access_log表(9行)2、join...on 的用法3、left join的用法3.1 当左表为websites(5行),右表为access_log(9行)3.2 当左表为access_log(9行),右表为websites(5行)4、group by回顾1、数据说明用到了菜鸟教程里的2个表:websites和access_log。两表信息如下图所示。表的创建:drop table websitescreate

2022-04-26 11:38:42 3228

原创 2、SQL学习:排序查询and分组查询

@爱学习的DUO目录第三章 查询语言3.3 排序查询3.3.1 排序查询案例3.3.2 排序查询总结3.4 常见函数3.4.1 单行函数3.4.1.1 字符函数3.4.1.2 数学函数3.4.1.3 日期函数3.4.1.4 流程控制函数3.4.2 聚合函数/分组函数3.4.2.1 sum函数3.4.2.2 avg函数3.4.2.3 count函数3.4.3 分组函数和distinct使用3.5 分组查询(group by)3.5.1 分组前查询(单个字段)3.5.2 分组后查询3.5.3 按表达式或函数

2022-04-23 23:26:28 1211

原创 1、SQL学习:基础查询and条件查询

@爱学习的DUO目录第一章:数据库查看第二章 :常用的命令第三章:查询语言3.1 基础查询3.1.1 查询表中的单个字段3.1.2 查询表中的多个字段3.1.3 查询表中的所有字段3.1.4 查询常量值3.1.5 查询表达式3.1.6 查询函数3.1.7 起别名3.1.8 去重3.1.9 CONCAT()连接符3.1.10 ifnull()3.2 条件查询3.2.1 按条件表达式3.2.2 按逻辑表达式筛选(连接条件表达式)3.2.3 模糊查询总结第一章:数据库查看note:采用myemployee库

2022-04-23 10:11:58 1610

原创 Python机器学习——1 监督学习(1.1-1.3 数据的预处理and编码)

Python机器学习——1 监督学习1.1 简介监督学习:监督学习是值在有标记的样本(labeled sample)上建立机器学习的模型。无监督学习:面对的是没有标记的数据,假设需要把一些数据分成不同的组别,但是对分组条件毫不知情。1.2 数据预处理计数在实际中,原始数据通常是计算机无法理解的,所以要对原始数据进行预处理.1.2.1 准备工作导入程序包and数组:imp...

2020-04-07 21:55:15 307

原创 R语言的三大绘图系统

title: “R的三大绘图系统”author: “DUO”date: “2020/3/19”output:html_document:toc: yes<>三大绘图系统简介基本绘图系统–2DLattice绘图系统——使用一次函数调用(一次成图)ggplot2绘图系统–数据映射到几何客体1.1基本绘图系统绘图函数(graphics包)——plot/hist/...

2020-03-19 14:04:15 798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除