最近处理一批数据,把excel导入pandas中后,发现默认导入为object,需要转化成日期后计算时间用药时间和发病时间的间隔。
使用time,将其转化为时间格式:
# date是字符串格式,换算成time64[d]格式
import time
copies.date = copies.date.values.astype('datetime64[D]')
计算连个时间点的间隔,直接用“➖”即可:
# 计算采样时为用药和发病的第几天,注意用values.astype("datetime64[D]")转换成“天”格式后计算
data_total["drug_days"] = data_total.date.values.astype("datetime64[D]") - data_total.DURG_DATE.values.astype("datetime64[D]")
data_total["onset_days"] = data_total.date.values.astype("datetime64[D]") - data_total.ONSET_DATE.values.astype("datetime64[D]")