- 博客(26)
- 资源 (2)
- 收藏
- 关注
原创 【学习笔记】Python进行数据清洗
在b站上看到了很不错的清洗基础教程,在这里记一下自己的学习笔记。除此之外,up主的缺失值处理是直接用均值进行替代,个人觉得不是很严谨,所以替换成了随机森林算法填补缺失值。在最后做了一张思维导图作为总结。
2023-03-15 23:39:58
3089
原创 SPSS安装问题
问题描述提是找不到 IBM SPSS Statistics 25.msi 文件,然后找不到网络位置,所以无法安装。这个问题困扰我太久了!!然后非常偶然的,看到了IBM的官方回答,终于解决了这个问题~Extracting the Microsoft Installer (*.msi) File for IBM SPSS Statisticshttps://www.ibm.com/support/pages/extracting-microsoft-installer-msi-file-ibm-sp
2022-05-31 09:01:50
8106
5
原创 R-第七章|因子分析
因子分析基础思想、因子分析步骤、以及相关R代码和结果解释。目录1. 因子分析理论基础(1)因子分析和主成分分析的区别与联系(2)因子分析模型(3)因子载荷的意义(4)因子旋转的目的(5)因子得分(6)最后画出因子信息图2. 因子分析的基本步骤(1)确认数据是否适合作因子分析(2)构造因子变量(3)按照方差贡献确定因子数(4)旋转因子使其更具有可解释性(5)计算因子得...
2022-04-10 18:15:39
1533
原创 机器学习|代价函数绘制
最近在学习Andrew NG的机器学习课程,上到定义函数的时候,就想着能否把代价函数画出来。首先在编辑器定义一个函数文件,保存到工作路径中function J = costFunctionJ(X,y,theta) m = size(X,1); %样本量 predictions = X*theta sqrErrors = (predictions-y).^2; J = 1/(2*m)*sum(sqrErrors);这是一个简单的一元函数,表达式为我的思路就是写一个循环,
2022-03-24 14:09:50
2107
原创 R语言安装包问题
问题:想要安装nnet,但是提示打不开URLinstall.packages(nnet)搜索优快云解决了,解决方法是install.packages("nnet",repo="https://mirrors.ustc.edu.cn/CRAN/")repo后面的是镜像网站,可以在CRAN - Mirrors中找到自己所在国家的镜像网址,修改repo即可。...
2022-03-21 17:39:36
267
原创 R语言报错
> setwd("C:/...")> dat<-read.table("eg2.txt", header = T)运行这个代码的时候,出现了如下报错:Error in make.names(col.names, unique = TRUE) : '<ff><fe><79>'多字节字符串有错此外: Warning messages:1: In read.table("eg2.txt", header = T) : line 1 a...
2022-03-20 09:42:32
2446
原创 hive-table insclause -0 has 10 columns, but query has 11 columns
很好的思路是,分别desc创的表和要插入的数据表。然后我发现之前创的表没有drop掉,所以发生了这个问题。
2021-09-30 10:32:27
1487
原创 SQL|where & and
今天搞懂了on where 和 on and的区别,mark一下。SELECT *FROM table_a a LEFT JOIN table_b bon a.id = b.idwhere a.name = 'Lucy'SELECT *FROM table_a a LEFT JOIN table_b bon a.id = b.idand a.name = 'Lucy'where是指,ab表合并之后,筛选出a.name = "Lucy"的行。and则是,先用name = 'Lu
2021-08-26 23:03:43
2250
原创 Python_Import pandas:AttributeError: module ‘pandas‘ has no attribute ‘core‘解决方案
今天在jupyter执行import pandas的时候报错了,重启jupyter之后就好了。不过在重启之前猜测是版本不兼容,所以搜索了一下如何检索版本与第三方库,在这里记录一下。打开命令提示符# 获得jupyter安装路径where jupyter# 获得路径后,cd进入# 获得已经安装的第三方库pip list#获得已经落伍的第三方库pip list --outmoded...
2021-08-13 14:15:18
754
原创 python把脚本变成exe的问题
今天想要安装pyinstaller,结果失败了。报错显示“SSL module is not available”,经过搜索最后解决了问题。1、将Anaconda的安装路径(具体添加方式见这里)加入path环境设置中,具体做法见这里。2、安装完之后 Win+R / cmd/ pip install pyinstaller完美解决!...
2021-07-23 14:43:09
203
2
原创 实习生日记|0722
时隔多日,终于能够独立写代码来实现自动化了!这次比较难搞的两个需求:(1)涉及到三张表之间的勾稽关系,比如已知表1和2有A\B特征,表2和表3有共同C特征,现在要比较比较表1和表3的D特征,所以需要将表1和表2进行匹配后通过表2间接比较1和3;(2)涉及到同一个单号下金额的匹配问题,问题是,在有多条金额数据的单号下,有可能是部分金额之和对应另一张表的金额,也可能是单行金额的一一对应,不过现在这个问题我也没有解决好。过程中有四点收获。第一,代码需要反复修改。具体为在jupyter中新建一个代码块,将有
2021-07-22 18:02:59
90
原创 实习生日记0712
1、去掉nan和NaT输出的部份表格如图:nan是np模块的数据空缺;NaT是pd模块的数据空缺,是时间缺失值。想要在数据缺失部分显示空白,但是 fillna('')没有用,后来找到了如下代码:import numpy as np# 遍历列,去掉nanfor i in df.columns: df[i] = dnp.where(df[i] == 'nan', np.nan, df[i]) #强制转换df.fillna('')# 去掉NaT## 如果日期列是str,先转换成.
2021-07-12 14:34:14
101
原创 办公自动化|第一周
记录一下实习过程中第一周碰到的一些小问题。1. 报错“No engine for filetype”网上说是pd.to_excel()的问题,应该改成pd.to_csv,但我试了还是不行。后来发现是我输出文档的路径path_out = 'test' 没加文件后缀。2. 运行报错 "No such file or dictionary"非常神奇,我也不知道啥原因,路径什么的都没问题。后来重开了spyder,把Shift+Enter快捷键换成点击开始,看见它 cell(...)...变成 run
2021-07-09 21:15:24
2433
原创 [210701] Data type & Missing Data
5 DataType & Missing Data5.1 DataType(1)查看数据类型df.被引数.dtype(2)更改数据类型df.被引数.astype('float64')5.2 Missing Data(1)isnull()的用法df[pd.isnull(df.Route)] #展示Route显示NaN的数据pd.isnull(df.Route).sum() #Route显示NaN的个数(2)填补空白值df.Route.fillna('Unknown'
2021-07-01 11:21:46
144
原创 kaggle入门教程笔记| 3
前言:summary Functions and Maps,还有一些题目记载1.summary Functions这次用到的是作业的数据,记数据集为data(1) 描述性统计data.realgdp.describe()(2) 均值gdp_mean = data.realgdp.mean() #求realgdp的均值(3) 求出对象数量和详情比如在整理文献数据的时候,有些作者写了不止一篇,现在要得到文档中有多少个作者。#法一name_list = set(list(df['作者']
2021-06-28 23:40:17
161
原创 kggale入门教程笔记|1&2
前言:初学python,在这里做一下笔记,方便自己复习回看。以下示例源自kaggle的新手教程。在之前先输入几行代码让引入的np和pd可以多次使用from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" import numpy as npimport pandas as pd pd.options.display.max_rows = 8
2021-06-28 20:34:23
129
CH10 重复博弈课后题解析
2022-07-13
博弈论导论|第九章多阶段博弈|课后题解析
2022-07-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人