如何签署 韩国的PhysioNet 的 Data Use Agreement(DUA,数据使用协议)并成为认证用户,如何成为VitalDB认证用户,加州大学MOVER 数据集认证用户

PhysioNet认证

一、核心前提:完成 CITI 伦理培训(必须步骤)​

PhysioNet 要求所有认证用户先通过 “人类受试者保护” 相关培训,核心是完成 CITI Program 的「Data or Specimens Only Research」课程(带 HIPAA 模块),具体步骤:​

1. 注册 CITI 账号​

  • 点击 “Register”,填写基本信息(姓名、邮箱等),关键选择:​

✅ 关联机构(Affiliation):搜索并选择 “Massachusetts Institute of Technology Affiliates”(非 MIT 人员也可关联,避免选 “Independent Learner”,否则可能收费)​

✅ 培训领域:选择 “Human Subjects Research”​

✅ 必选课程:勾选 “Data or Specimens Only Research”(强制),“Conflicts of Interest”(可选,建议勾选提高通过率)​

2. 完成课程学习与考试​

  • 课程支持 中文界面(在页面底部切换语言),模块共 13-15 个,内容为数据隐私、伦理合规等基础知识点​
  • 每个模块后有测验(可重复答题,答错可重新选择,无需担心)​
  • 重点:必须完成 HIPAA 相关子模块(部分数据集强制要求,避免后续补修)​

3. 下载关键材料(重中之重)​

  • 课程全部完成后,进入 CITI 官网顶部「Records」→「Completion Record」​
  • 下载 “Completion Report”(完成报告)(PDF 格式),注意:​

❌ 不要上传 “Completion Certificate”(证书无效),仅 “Report” 包含模块完成详情,PhysioNet 审核唯一认可文件​

✅ 报告需显示:姓名、课程名称、完成日期、所有模块通过率(示例:https://www.citiprogram.org/verify/xxx)​

二、第二步:申请 PhysioNet 认证账户(Credentialed User)​

1. 注册 PhysioNet 基础账号​

  • 点击右上角 “Sign Up”,用机构邮箱(推荐.edu/.org,无则用个人邮箱)注册,验证邮箱后设置密码登录​

2. 提交认证申请(核心环节)​

  • 填写申请表单(所有带 * 为必填项):​

✅ 个人信息:姓名、职称、所属机构(如实填写,需与 CITI 报告一致)​

✅ 研究主题:简要描述你的研究方向(例:“急诊手术围手术期并发症预测,需使用 MIMIC-IV 的血液指标和结局数据”)​

✅ 推荐人信息:​

  • 学生 / 博士后:必须填写导师姓名、邮箱(需为学术邮箱,最好是有 PhysioNet 使用经历的导师)​
  • 在职研究人员:填写同事或主管联系方式(避免自填为推荐人)​

✅ 上传材料:附件选择第一步下载的 CITI Completion Report(仅支持 PDF,大小不超过 5MB)​

3. 等待审核结果​

  • 审核由 MIT 团队处理,时间通常 1-4 周(快则 3 个工作日,慢则 1 个月,取决于申请量)​
  • 结果将通过邮箱通知:​

✅ 审核通过:邮件提示 “Your PhysioNet account is now credentialed”​

❌ 审核驳回:按邮件要求补充材料(常见原因:未关联 MIT 机构、漏传 Completion Report、推荐人信息无效)​

三、第三步:签署具体数据集的 DUA(最终访问权限)​

当你的 PhysioNet 账户成为 “Credentialed User” 后,需为每个要访问的数据集单独签署 DUA:​

1. 找到 DUA 签署入口​

2. 签署电子协议​

  • 点击 “Sign DUA”,系统会显示协议条款(核心内容:数据仅用于学术研究、不得共享给第三方、不得用于 LLM 训练、研究结束后 30 日内删除数据等,需仔细阅读)​
  • 勾选 “I agree to the terms of this DUA”,输入 PhysioNet 账号密码确认,提交后系统自动记录签署状态​

3. 验证访问权限​

  • 签署成功后,刷新数据集页面,底部「Files」区域会显示所有可下载文件(如 CSV、HDF5 格式)​
  • 部分数据集支持 云访问(如 Google Cloud、AWS),也可直接下载本地(大型数据集建议用迅雷等工具加速)​

三、关键注意事项(避坑指南)​

  1. 邮箱一致性:CITI 注册邮箱、PhysioNet 注册邮箱、推荐人邮箱尽量统一(或可证明关联),避免审核质疑身份​
  1. 数据使用限制:DUA 明确禁止将数据用于商业目的、第三方共享、在线 LLM 训练(如 ChatGPT),仅允许本地分析(https://physionet.org/about/restricted-data-llms/)​
  1. 推荐人跟进:提交申请后,提醒推荐人查收 PhysioNet 邮件(可能需要回复确认你的研究合法性)​
  1. 二次申请:部分数据集(如 eICU-CRD)需单独签署专属 DUA,流程同上(账户认证通过后,重复第三步即可)​
  1. 审核超时处理:超过 4 周未收到通知,可发送邮件至 physionet-support@mit.edu,主题注明 “Credentialed Access Application Follow-Up”,附申请时的姓名和邮箱​

四、常见问题快速解决​

问题场景​

解决方案​

无法找到 MIT 关联机构​

CITI 官网搜索框直接输入 “Massachusetts Institute of Technology Affiliates”,不要简写​

上传 Report 后被驳回​

检查 Report 是否包含所有模块完成记录,是否有 HIPAA 模块,重新下载完整版本上传​

推荐人未收到邮件​

让推荐人检查垃圾邮件,或更换推荐人邮箱(必须为学术 / 机构邮箱)​

签署 DUA 后仍无法下载​

清除浏览器缓存,退出账号重新登录,或联系数据集管理员(页面底部有联系方式)​

VitalDB认证

一、第一步:注册 VitalDB 基础会员(必选前置步骤)​

VitalDB 所有数据访问均需先注册会员,无需 CITI 培训(区别于 PhysioNet),直接通过官网完成:​

  1. 打开会员注册协议页面:https://vitaldb.net/registration-agreement
  1. 阅读《会员服务条款》(核心内容:数据仅用于学术研究、禁止商业使用、保护数据匿名性),勾选底部「我同意条款」​
  1. 点击「前往注册」,填写基本信息:​

✅ 用户名(建议用学术邮箱前缀)​

✅ 密码(8 位以上,含字母 + 数字)​

✅ 邮箱(必须为机构 / 学术邮箱,如.edu/.org/.ac.cn,个人邮箱可能被驳回)​

✅ 所属机构(如实填写大学 / 医院 / 科研院所名称)​

  1. 验证邮箱:点击收到的激活链接(垃圾邮件箱需检查),完成基础会员注册​

二、第二步:提交数据访问申请(核心认证环节)​

基础会员仅能浏览数据集概况,需提交申请获取完整数据访问权限:​

  1. 访问数据请求专属页面:https://www.vitalstudy.org/Investigators.html
  1. 下载并填写 2 个核心表单(均为英文模板,需按要求填写):​
  • 📋 《Analysis and Data Request Form》(数据请求表):​

需填写研究主题(如 “急诊手术围手术期并发症预测”)、所需数据类型(如波形数据 / 实验室指标 / 临床结局)、数据使用周期、分析工具(如 Python/R)​

  • 📋 《Memorandum of Understanding》(谅解备忘录,类似 DUA):​

需填写申请人信息、机构信息、研究团队成员,明确数据使用限制(禁止二次分发、禁止 LLM 训练等)​

  1. 补充辅助材料(可选但推荐,提高审批效率):​
  • 研究计划摘要(1 页内,说明研究目的、方法、预期成果)​
  • 所属机构 IRB 批准函(若研究已通过伦理审查,无则可注明 “研究正在伦理审批中”)​
  1. 提交方式:将填写完整的表单(PDF 格式)发送至 VitalDB 官方邮箱:vitaldb@snu.ac.kr

邮件主题格式:「Data Request - 申请人姓名 - 所属机构 - 研究主题」​

示例:Data Request - Zhang San - Peking University - Emergency Surgery Complication Prediction​

三、第三步:签署正式数据使用协议(DUA)​

  1. 审核周期:官方通常在 5-10 个工作日内回复邮件(比 PhysioNet 快)​
  1. 协议签署:若申请通过,会收到含《Data Use Agreement》(DUA)的邮件,通过以下方式完成签署:​
  • 电子签署:点击邮件中的 DocuSign 链接,在线填写签名、日期(无需打印)​
  • 机构盖章(如需):部分高校 / 医院要求协议盖公章,扫描后回复邮件即可​
  1. 关键协议条款(不可协商,需确认):​

❌ 禁止将数据用于商业产品开发或临床决策支持​

❌ 禁止向第三方共享原始数据(可共享分析结果 / 图表)​

✅ 允许学术论文发表(需引用 VitalDB 数据集:DOI: 10.1038/s41597-022-01893-4)​

四、第四步:获取认证权限并访问数据​

  1. 权限激活:签署 DUA 后 1-3 个工作日,官方会发送「认证用户激活通知」邮件,告知以下信息:​
  • 用户名 / 密码(沿用基础会员账号,自动升级为认证权限)​
  • API 访问令牌(access token,用于批量下载数据)​
  • 专属数据下载链接(含 CSV/Gzip 格式原始数据、Python 库使用指南)​
  1. 数据访问方式(两种可选):​
  • 📥 直接下载:通过邮件提供的链接,下载完整数据集(含 6388 例患者的波形数据、实验室指标、并发症记录),支持分批次下载(避免单次文件过大)​
  • 🔌 API 调用:使用 Python 库(需安装vitaldb包),通过 access token 调用数据,示例代码:​

python取消自动换行复制

import vitaldb​

token = "你的认证token"​

cases = vitaldb.get_cases(token=token) # 获取所有病例列表​

df = vitaldb.load_case(100, ['SBP', 'DBP', 'WBC', 'CRP'], token=token) # 下载特定病例的指标数据​

三、关键注意事项(避坑指南)​

  1. 邮箱要求:必须用学术 / 机构邮箱,gmail/yahoo 等个人邮箱申请成功率 < 30%​
  1. 表单填写:研究主题需与 VitalDB 数据集匹配(如围手术期监测、手术并发症、生命体征分析等),避免填写无关主题(如纯基础医学研究)​
  1. 数据范围:认证用户可访问全部数据(557,622 条数据轨道、196 项术中监测参数、34 项实验室指标),含你需要的术前 / 术后白细胞、肝肾功能、并发症等所有指标​
  1. 审批驳回处理:若申请被驳回,按邮件提示补充材料(常见原因:机构信息不完整、研究目的不明确),可直接回复邮件沟通修改​
  1. 更新通知:数据集每年更新(最新版本含 2022 年前数据),认证用户会收到更新提醒,无需重复申请​

四、常见问题快速解决​

问题场景​

解决方案​

未收到激活邮件​

检查垃圾邮件箱,或发送邮件至 vitaldb@snu.ac.kr,主题注明 “Account Activation Follow-Up”​

表单下载失败​

访问备用链接:https://vitaldb.net/docs/?documentId=1jLTcF4JYbRTuSM2mZeTMmvzxMmrqUjEEp6p02cFEs_Q,联系技术支持获取​

API 调用失败​

检查 token 是否过期(有效期 1 小时,需重新获取),或确认网络是否可访问 AWS 服务器​

需特定格式数据​

邮件中说明需求(如 Excel 格式 / 特定病例筛选),官方可提供定制化数据提取支持​

MOVER 数据集

一、核心前提:明确数据访问资格与用途​

MOVER 数据集面向全球学术研究者开放,需满足以下基础条件:​

  1. 所属机构:高校、医院、科研院所等非营利性机构​
  1. 使用目的:仅用于学术研究(禁止商业开发、临床决策、LLM 训练等)​
  1. 合规承诺:同意数据去标识化保护要求,不尝试识别个体患者​

二、第一步:访问 MOVER 官方申请入口​

  1. 打开 MOVER 官网首页:https://mover.ics.uci.edu/index.html
  1. 点击顶部导航栏「Download」(或直接访问下载页面:https://mover.ics.uci.edu/download.html),此页面包含数据使用协议(DUA)和申请入口​
  1. 下滑至「Data Access Request」板块,确认申请前需阅读的核心规则:​
  • 数据已通过第三方去标识化验证,符合 HIPAA 隐私标准​
  • 禁止二次分发原始数据,仅可共享分析结果(需引用数据集来源)​
  • 数据集包含 58,799 名患者、83,468 例手术的完整 EMR 记录、波形数据及术后并发症信息​

三、第二步:填写并提交数据访问申请​

MOVER 采用「在线申请 + 协议签署」一体化流程,无需单独下载表单,具体步骤:​

  1. 在「Download」页面找到「Request Access」按钮,点击进入申请表单页面(需用浏览器直接打开,建议使用 Chrome/Firefox)​
  1. 填写申请表单核心信息(所有带 * 为必填项):​

✅ 个人信息:姓名、职称、所属机构、部门(如 “外科教研室”“数据科学实验室”)​

✅ 联系方式:学术 / 机构邮箱(必须,个人邮箱如 gmail/yahoo 可能被驳回)、电话​

✅ 研究信息:​

  • 研究主题(需明确与手术相关,如 “急诊手术围手术期肾功能变化与并发症关联研究”)​
  • 所需数据类型(可多选:EMR 记录、波形数据、药物使用、术后并发症、实验室指标等)​
  • 分析工具(如 Python/R/Matlab)、预期研究周期​

✅ 合规声明:勾选「我承诺遵守数据使用协议条款」「仅用于学术研究」等声明项​

三、第三步:签署数据使用协议(DUA)​

  1. 申请表单提交后,系统会自动跳转至《Data Use Agreement》(DUA)签署页面(或通过邮件发送 DUA 链接),协议核心条款:​
  • 禁止将数据用于商业目的或向第三方共享原始数据​
  • 研究结束后 30 日内删除原始数据,仅保留分析结果​
  1. 签署方式:​
  • 电子签署:在线填写姓名、日期,提交后系统自动记录签署状态​
  • 机构盖章(如需):若所属机构要求协议备案,可下载 DUA 打印盖章后扫描,通过表单附件上传(或回复后续通知邮件)​

四、第四步:等待审核并激活访问权限​

  1. 审核周期:UCI 团队通常在 7-14 个工作日内完成审核(比 PhysioNet 快,比 VitalDB 稍久)​
  1. 审核结果通知:通过申请时填写的学术邮箱发送,包含以下关键信息:​
  • 权限激活确认:告知账号已升级为「认证用户」​
  • 数据下载链接:按所需数据类型分类(SIS 数据集 2015-2017、EPIC 数据集 2017-2022),支持分批次下载(避免单次文件过大)​
  • 访问凭证(如有):部分数据需用临时令牌(Token)登录下载,有效期 1 个月,可申请续期​
  1. 数据格式说明:下载文件为 CSV/Gzip 格式,包含完整的术前 / 术后实验室指标(如白细胞、肌酐、胱抑素 C)、并发症记录(心血管事件、切口感染等),可直接用 Python/R 读取分析​

五、关键注意事项(避坑指南)​

  1. 邮箱一致性:申请表单填写的邮箱需与后续接收通知、签署协议的邮箱一致,避免审核延误​
  1. 研究主题匹配:需明确提及 “手术相关研究”,避免填写无关主题(如纯基础医学、非临床数据分析),否则可能被驳回​
  1. 数据范围确认:MOVER 包含 2015-2022 年数据(分 SIS/EPIC 两个电子病历系统模块),申请时可注明所需时间范围,减少下载量​
  1. 二次访问:认证用户权限长期有效,后续数据集更新(按季度更新)会收到邮件通知,无需重复申请​

六、常见问题快速解决​

问题场景​

解决方案​

找不到「Request Access」按钮​

清除浏览器缓存,直接访问下载页面:https://mover.ics.uci.edu/download.html,或更换 Chrome 浏览器​

未收到审核通知​

检查垃圾邮件箱,若超过 14 个工作日未回复,发送邮件至 UCI 数据支持团队:mover-support@ics.uci.edu(主题注明 “Data Access Request Follow-Up - 姓名 - 所属机构”)​

下载链接失效​

回复权限激活邮件,说明 “链接过期”,申请重新生成下载令牌​

需特定格式数据(如 Excel)​

申请时在 “备注” 栏说明需求,UCI 团队可提供格式转换支持(需额外 1-2 个工作日)​

七、数据集引用要求(必看)​

发表论文或公开研究成果时,需按以下格式引用 MOVER 数据集,避免侵权:​

UC Irvine Medical Center. MOVER (Medical Informatics Operating Room Vitals and Events Repository). https://mover.ics.uci.edu, 2015-2022.​

同时在致谢部分注明:“The authors acknowledge the MOVER dataset for providing access to surgical and perioperative clinical data.”

### 如何注册使用PhysioNet访问数据集或资源 #### 注册流程 为了能够访问PhysioNet上的数据集和其他资源,用户需要先完成注册过程。以下是关于如何注册成为Physionet用户的说明: PhysioNet提供了一个在线平台,允许研究人员下载和分析各种生理信号数据。要获得这些资源的访问权限,用户需通过其官方网站创建账户[^1]。这通常涉及填写一份表单,其中包括姓名、电子邮件地址以及其他必要的个人信息。 #### 使用指南 一旦成功注册登录到个人账户之后,就可以浏览以及申请特定的数据集合了。某些高敏感度或者受版权保护的内容可能还需要额外签署数据使用协议(Data Use Agreement)[^1]。 对于想要获取WFDB软件包或者其他工具的情况,则可以参照官方文档指示进行操作;比如提到过的ECG波形提取程序ecgpuwave就需要按照指导安装相应的依赖环境,在此过程中如果遇到压缩文件无法正常打开的问题,可参考技术文章中的解决办法来处理错误提示如`unzip: cannot find zipfile directory...`等问题[^3]。 另外需要注意的是,部分高级功能或是特殊类型的资料可能会限定仅限于经过验证的研究人员才能查看,因此建议仔细阅读每项服务的具体条款条件后再做决定是否提交请求审批。 ```bash # 示例命令:尝试修复ZIP文件解压问题 $ unzip -tq yourfile.zip && echo 'File is valid' || echo 'File seems corrupted' ``` 以上脚本可以帮助初步判断目标档案是否存在结构损坏状况。 #### 安装相关工具 当准备就绪后,可以根据项目需求选取合适的开发套件版本号,依照指引链接至指定位置取得最新发行版次。例如先前所提及之Cygwin兼容性组件即位于专门设立的FTP区域下可供自由取用[^2]。 ---
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值