自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 xlsx文件导入数据库后日期格式改变

具体举例如下:表格内自定义该列的单元格格式为‘2025-01-01 00:00:00.000’ ,导入到数据库后自动转为'2025-01-01'(该列的数据类型是varchar2(50))。猜想是由于“数据导入时的隐式转换”,某些数据库在导入数据时,如果目标列是VARCHAR,但数据看起来像日期,可能会尝试转换为日期类型,导致时间部分丢失,尤其是在没有明确指定数据类型的情况下。记录一个工作中遇到的问题:直接用xlsx文件向数据库中导入数据,日期格式自动改变。CSV UTF-8 (逗号分隔)(*.csv)

2025-02-27 10:22:41 194

原创 数据预处理插补缺失值及比较不同方法的优劣

不难知道,这里缺失值的类型是完全随机缺失(MCAR),所以处理缺失值的方法可以是删除行、和对缺失值进行插补,MCAR可以用的插补方法有很多,这里主要练习比较最近邻插补,均值插补,单变量插补(这里用常数0进行插补),多重插补。注:add_indicator:boolean,(默认)False,True则会在数据后面加入n列由0和1构成的同样大小的数据,0表示所在位置非缺失值,1表示所在位置为缺失值。因为datasets的数据一般都没有空值,所以这里我们人为删除一些数据(随机)(2)最近邻插补(KNN插补)

2023-05-07 18:08:39 1072 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除