- 博客(2)
- 收藏
- 关注
原创 xlsx文件导入数据库后日期格式改变
具体举例如下:表格内自定义该列的单元格格式为‘2025-01-01 00:00:00.000’ ,导入到数据库后自动转为'2025-01-01'(该列的数据类型是varchar2(50))。猜想是由于“数据导入时的隐式转换”,某些数据库在导入数据时,如果目标列是VARCHAR,但数据看起来像日期,可能会尝试转换为日期类型,导致时间部分丢失,尤其是在没有明确指定数据类型的情况下。记录一个工作中遇到的问题:直接用xlsx文件向数据库中导入数据,日期格式自动改变。CSV UTF-8 (逗号分隔)(*.csv)
2025-02-27 10:22:41
194
原创 数据预处理插补缺失值及比较不同方法的优劣
不难知道,这里缺失值的类型是完全随机缺失(MCAR),所以处理缺失值的方法可以是删除行、和对缺失值进行插补,MCAR可以用的插补方法有很多,这里主要练习比较最近邻插补,均值插补,单变量插补(这里用常数0进行插补),多重插补。注:add_indicator:boolean,(默认)False,True则会在数据后面加入n列由0和1构成的同样大小的数据,0表示所在位置非缺失值,1表示所在位置为缺失值。因为datasets的数据一般都没有空值,所以这里我们人为删除一些数据(随机)(2)最近邻插补(KNN插补)
2023-05-07 18:08:39
1072
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人