SAS 日期格式处理1 (CDISC)

RAW.CM中有字符型格式CMSTDTC,如下图。
日期CMSTDTC是字符型,非yymmdd10.格式
注:日期CMSTDTC已是字符型,非yymmdd10.等格式。

现想将:
1.缺失月和日的,只保留年。
if count(cmstdtc,’-UNK’)=2 then _cmstdtc=compress(cmstdtc,’-UNK’);

2.或者只缺失日的,保留年和月。
else if find(cmstdtc,‘UNK’,‘i’,5)=9 then _cmstdtc=substr(cmstdtc,1,7);

3.或者只缺失月的,保留年和日。
else if find(cmstdtc,‘UNK’,‘i’,5)=6 then _cmstdtc=tranwrd(cmstdtc,‘UNK’,’-’);

{FIND 函数的用法}
【功能】字符串中的某段字符在字符中的位置

【语法】
在这里插入图片描述

从字符串中第“数字”开始查找字符串的位置,取i表示不区分大小写。

【注意】不管起始位置是多少,返回的位置数值始终是在源字符串中的位置。

【本例】在CMSTDTC中从第5个字符,不区分大小写地查找字符串‘UNK’的位置,当返回的位置值为6(即月缺失,此时‘UNK’的U的位置为6)时,将‘UNK’这个字符串变为‘-’。

4.否则定义的新变量_CMSTDTC等于原日期。
else _cmstdtc=cmstdtc;

得到处理好的新变量_CMSTDTC的结果如下图第2列。
可对比处理结果

### CDISC E8601 日期格式使用规范与示例 CDISC(Clinical Data Interchange Standards Consortium)定义了E8601日期格式,这是一种标准化的日期表示方法,广泛应用于临床研究数据交换中。此格式基于ISO 8601标准,确保日期和时间信息在全球范围内的统一性和可读性。 #### 格式定义 E8601日期格式通常采用以下几种形式: - **日期**:`YYYY-MM-DD`[^1],其中`YYYY`表示四位数的年份,`MM`表示两位数的月份,`DD`表示两位数的日期。 - **日期+时间**:`YYYY-MM-DDTHH:MM:SS`[^2],其中`T`是日期和时间之间的分隔符,`HH`表示小时(24小时制),`MM`表示分钟,`SS`表示秒。 - **带时区的日期+时间**:`YYYY-MM-DDTHH:MM:SS±HH:MM`[^3],其中`±HH:MM`表示时区偏移量。 #### 示例代码 以下是Python中生成和解析E8601日期格式的示例: ```python from datetime import datetime # 当前日期时间按照E8601格式输 current_datetime = datetime.now().strftime("%Y-%m-%dT%H:%M:%S") print("当前日期时间:", current_datetime) # 带时区的日期时间 current_datetime_with_timezone = datetime.now().astimezone().strftime("%Y-%m-%dT%H:%M:%S%z") print("带时区的日期时间:", current_datetime_with_timezone.replace("+0000", "+00:00")) # 解析E8601格式的字符串 date_string = "2023-10-05T14:30:00" parsed_date = datetime.strptime(date_string, "%Y-%m-%dT%H:%M:%S") print("解析后的日期时间对象:", parsed_date) ``` #### 使用注意事项 - 在临床数据交换中,建议始终使用UTC时间或明确指定时区偏移量,以避免因时区差异导致的数据不一致问题[^4]。 - 如果需要存储日期而不包含时间部分,应仅使用`YYYY-MM-DD`格式,而不要省略零填充[^5]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值