PhysioNet认证
一、核心前提:完成 CITI 伦理培训(必须步骤)
PhysioNet 要求所有认证用户先通过 “人类受试者保护” 相关培训,核心是完成 CITI Program 的「Data or Specimens Only Research」课程(带 HIPAA 模块),具体步骤:
1. 注册 CITI 账号
- 打开 CITI 官网:https://about.citiprogram.org/
- 点击 “Register”,填写基本信息(姓名、邮箱等),关键选择:
✅ 关联机构(Affiliation):搜索并选择 “Massachusetts Institute of Technology Affiliates”(非 MIT 人员也可关联,避免选 “Independent Learner”,否则可能收费)
✅ 培训领域:选择 “Human Subjects Research”
✅ 必选课程:勾选 “Data or Specimens Only Research”(强制),“Conflicts of Interest”(可选,建议勾选提高通过率)
2. 完成课程学习与考试
- 课程支持 中文界面(在页面底部切换语言),模块共 13-15 个,内容为数据隐私、伦理合规等基础知识点
- 每个模块后有测验(可重复答题,答错可重新选择,无需担心)
- 重点:必须完成 HIPAA 相关子模块(部分数据集强制要求,避免后续补修)
3. 下载关键材料(重中之重)
- 课程全部完成后,进入 CITI 官网顶部「Records」→「Completion Record」
- 下载 “Completion Report”(完成报告)(PDF 格式),注意:
❌ 不要上传 “Completion Certificate”(证书无效),仅 “Report” 包含模块完成详情,PhysioNet 审核唯一认可文件
✅ 报告需显示:姓名、课程名称、完成日期、所有模块通过率(示例:https://www.citiprogram.org/verify/xxx)
二、第二步:申请 PhysioNet 认证账户(Credentialed User)
1. 注册 PhysioNet 基础账号
- 打开 PhysioNet 官网:https://physionet.org/
- 点击右上角 “Sign Up”,用机构邮箱(推荐.edu/.org,无则用个人邮箱)注册,验证邮箱后设置密码登录
2. 提交认证申请(核心环节)
- 登录后,访问任意受限数据集页面(如 MIMIC-IV:https://physionet.org/content/mimiciv/),拉到页面底部点击 “Apply for credentialed access”
- 填写申请表单(所有带 * 为必填项):
✅ 个人信息:姓名、职称、所属机构(如实填写,需与 CITI 报告一致)
✅ 研究主题:简要描述你的研究方向(例:“急诊手术围手术期并发症预测,需使用 MIMIC-IV 的血液指标和结局数据”)
✅ 推荐人信息:
- 学生 / 博士后:必须填写导师姓名、邮箱(需为学术邮箱,最好是有 PhysioNet 使用经历的导师)
- 在职研究人员:填写同事或主管联系方式(避免自填为推荐人)
✅ 上传材料:附件选择第一步下载的 CITI Completion Report(仅支持 PDF,大小不超过 5MB)
3. 等待审核结果
- 审核由 MIT 团队处理,时间通常 1-4 周(快则 3 个工作日,慢则 1 个月,取决于申请量)
- 结果将通过邮箱通知:
✅ 审核通过:邮件提示 “Your PhysioNet account is now credentialed”
❌ 审核驳回:按邮件要求补充材料(常见原因:未关联 MIT 机构、漏传 Completion Report、推荐人信息无效)
三、第三步:签署具体数据集的 DUA(最终访问权限)
当你的 PhysioNet 账户成为 “Credentialed User” 后,需为每个要访问的数据集单独签署 DUA:
1. 找到 DUA 签署入口
- 访问目标数据集页面(如 INSPIRE:https://physionet.org/content/inspire/),拉到页面底部→「Files」→点击 “Data Use Agreement (DUA)”
2. 签署电子协议
- 点击 “Sign DUA”,系统会显示协议条款(核心内容:数据仅用于学术研究、不得共享给第三方、不得用于 LLM 训练、研究结束后 30 日内删除数据等,需仔细阅读)
- 勾选 “I agree to the terms of this DUA”,输入 PhysioNet 账号密码确认,提交后系统自动记录签署状态
3. 验证访问权限
- 签署成功后,刷新数据集页面,底部「Files」区域会显示所有可下载文件(如 CSV、HDF5 格式)
- 部分数据集支持 云访问(如 Google Cloud、AWS),也可直接下载本地(大型数据集建议用迅雷等工具加速)
三、关键注意事项(避坑指南)
- 邮箱一致性:CITI 注册邮箱、PhysioNet 注册邮箱、推荐人邮箱尽量统一(或可证明关联),避免审核质疑身份
- 数据使用限制:DUA 明确禁止将数据用于商业目的、第三方共享、在线 LLM 训练(如 ChatGPT),仅允许本地分析(https://physionet.org/about/restricted-data-llms/)
- 推荐人跟进:提交申请后,提醒推荐人查收 PhysioNet 邮件(可能需要回复确认你的研究合法性)
- 二次申请:部分数据集(如 eICU-CRD)需单独签署专属 DUA,流程同上(账户认证通过后,重复第三步即可)
- 审核超时处理:超过 4 周未收到通知,可发送邮件至 physionet-support@mit.edu,主题注明 “Credentialed Access Application Follow-Up”,附申请时的姓名和邮箱
四、常见问题快速解决
| 问题场景 | 解决方案 |
| 无法找到 MIT 关联机构 | CITI 官网搜索框直接输入 “Massachusetts Institute of Technology Affiliates”,不要简写 |
| 上传 Report 后被驳回 | 检查 Report 是否包含所有模块完成记录,是否有 HIPAA 模块,重新下载完整版本上传 |
| 推荐人未收到邮件 | 让推荐人检查垃圾邮件,或更换推荐人邮箱(必须为学术 / 机构邮箱) |
| 签署 DUA 后仍无法下载 | 清除浏览器缓存,退出账号重新登录,或联系数据集管理员(页面底部有联系方式) |
VitalDB认证
一、第一步:注册 VitalDB 基础会员(必选前置步骤)
VitalDB 所有数据访问均需先注册会员,无需 CITI 培训(区别于 PhysioNet),直接通过官网完成:
- 打开会员注册协议页面:https://vitaldb.net/registration-agreement
- 阅读《会员服务条款》(核心内容:数据仅用于学术研究、禁止商业使用、保护数据匿名性),勾选底部「我同意条款」
- 点击「前往注册」,填写基本信息:
✅ 用户名(建议用学术邮箱前缀)
✅ 密码(8 位以上,含字母 + 数字)
✅ 邮箱(必须为机构 / 学术邮箱,如.edu/.org/.ac.cn,个人邮箱可能被驳回)
✅ 所属机构(如实填写大学 / 医院 / 科研院所名称)
- 验证邮箱:点击收到的激活链接(垃圾邮件箱需检查),完成基础会员注册
二、第二步:提交数据访问申请(核心认证环节)
基础会员仅能浏览数据集概况,需提交申请获取完整数据访问权限:
- 下载并填写 2 个核心表单(均为英文模板,需按要求填写):
- 📋 《Analysis and Data Request Form》(数据请求表):
需填写研究主题(如 “急诊手术围手术期并发症预测”)、所需数据类型(如波形数据 / 实验室指标 / 临床结局)、数据使用周期、分析工具(如 Python/R)
- 📋 《Memorandum of Understanding》(谅解备忘录,类似 DUA):
需填写申请人信息、机构信息、研究团队成员,明确数据使用限制(禁止二次分发、禁止 LLM 训练等)
- 补充辅助材料(可选但推荐,提高审批效率):
- 研究计划摘要(1 页内,说明研究目的、方法、预期成果)
- 所属机构 IRB 批准函(若研究已通过伦理审查,无则可注明 “研究正在伦理审批中”)
- 提交方式:将填写完整的表单(PDF 格式)发送至 VitalDB 官方邮箱:vitaldb@snu.ac.kr
邮件主题格式:「Data Request - 申请人姓名 - 所属机构 - 研究主题」
示例:Data Request - Zhang San - Peking University - Emergency Surgery Complication Prediction
三、第三步:签署正式数据使用协议(DUA)
- 审核周期:官方通常在 5-10 个工作日内回复邮件(比 PhysioNet 快)
- 协议签署:若申请通过,会收到含《Data Use Agreement》(DUA)的邮件,通过以下方式完成签署:
- 电子签署:点击邮件中的 DocuSign 链接,在线填写签名、日期(无需打印)
- 机构盖章(如需):部分高校 / 医院要求协议盖公章,扫描后回复邮件即可
- 关键协议条款(不可协商,需确认):
❌ 禁止将数据用于商业产品开发或临床决策支持
❌ 禁止向第三方共享原始数据(可共享分析结果 / 图表)
✅ 允许学术论文发表(需引用 VitalDB 数据集:DOI: 10.1038/s41597-022-01893-4)
四、第四步:获取认证权限并访问数据
- 权限激活:签署 DUA 后 1-3 个工作日,官方会发送「认证用户激活通知」邮件,告知以下信息:
- 用户名 / 密码(沿用基础会员账号,自动升级为认证权限)
- API 访问令牌(access token,用于批量下载数据)
- 专属数据下载链接(含 CSV/Gzip 格式原始数据、Python 库使用指南)
- 数据访问方式(两种可选):
- 📥 直接下载:通过邮件提供的链接,下载完整数据集(含 6388 例患者的波形数据、实验室指标、并发症记录),支持分批次下载(避免单次文件过大)
- 🔌 API 调用:使用 Python 库(需安装vitaldb包),通过 access token 调用数据,示例代码:
python取消自动换行复制
import vitaldb
token = "你的认证token"
cases = vitaldb.get_cases(token=token) # 获取所有病例列表
df = vitaldb.load_case(100, ['SBP', 'DBP', 'WBC', 'CRP'], token=token) # 下载特定病例的指标数据
- 云访问:通过 AWS Open Data 平台直接访问(无需额外认证,适合大文件快速下载):https://registry.opendata.aws/vitaldb/
三、关键注意事项(避坑指南)
- 邮箱要求:必须用学术 / 机构邮箱,gmail/yahoo 等个人邮箱申请成功率 < 30%
- 表单填写:研究主题需与 VitalDB 数据集匹配(如围手术期监测、手术并发症、生命体征分析等),避免填写无关主题(如纯基础医学研究)
- 数据范围:认证用户可访问全部数据(557,622 条数据轨道、196 项术中监测参数、34 项实验室指标),含你需要的术前 / 术后白细胞、肝肾功能、并发症等所有指标
- 审批驳回处理:若申请被驳回,按邮件提示补充材料(常见原因:机构信息不完整、研究目的不明确),可直接回复邮件沟通修改
- 更新通知:数据集每年更新(最新版本含 2022 年前数据),认证用户会收到更新提醒,无需重复申请
四、常见问题快速解决
| 问题场景 | 解决方案 |
| 未收到激活邮件 | 检查垃圾邮件箱,或发送邮件至 vitaldb@snu.ac.kr,主题注明 “Account Activation Follow-Up” |
| 表单下载失败 | 访问备用链接:https://vitaldb.net/docs/?documentId=1jLTcF4JYbRTuSM2mZeTMmvzxMmrqUjEEp6p02cFEs_Q,联系技术支持获取 |
| API 调用失败 | 检查 token 是否过期(有效期 1 小时,需重新获取),或确认网络是否可访问 AWS 服务器 |
| 需特定格式数据 | 邮件中说明需求(如 Excel 格式 / 特定病例筛选),官方可提供定制化数据提取支持 |
MOVER 数据集
一、核心前提:明确数据访问资格与用途
MOVER 数据集面向全球学术研究者开放,需满足以下基础条件:
- 所属机构:高校、医院、科研院所等非营利性机构
- 使用目的:仅用于学术研究(禁止商业开发、临床决策、LLM 训练等)
- 合规承诺:同意数据去标识化保护要求,不尝试识别个体患者
二、第一步:访问 MOVER 官方申请入口
- 打开 MOVER 官网首页:https://mover.ics.uci.edu/index.html
- 点击顶部导航栏「Download」(或直接访问下载页面:https://mover.ics.uci.edu/download.html),此页面包含数据使用协议(DUA)和申请入口
- 下滑至「Data Access Request」板块,确认申请前需阅读的核心规则:
- 数据已通过第三方去标识化验证,符合 HIPAA 隐私标准
- 禁止二次分发原始数据,仅可共享分析结果(需引用数据集来源)
- 数据集包含 58,799 名患者、83,468 例手术的完整 EMR 记录、波形数据及术后并发症信息
三、第二步:填写并提交数据访问申请
MOVER 采用「在线申请 + 协议签署」一体化流程,无需单独下载表单,具体步骤:
- 在「Download」页面找到「Request Access」按钮,点击进入申请表单页面(需用浏览器直接打开,建议使用 Chrome/Firefox)
- 填写申请表单核心信息(所有带 * 为必填项):
✅ 个人信息:姓名、职称、所属机构、部门(如 “外科教研室”“数据科学实验室”)
✅ 联系方式:学术 / 机构邮箱(必须,个人邮箱如 gmail/yahoo 可能被驳回)、电话
✅ 研究信息:
- 研究主题(需明确与手术相关,如 “急诊手术围手术期肾功能变化与并发症关联研究”)
- 所需数据类型(可多选:EMR 记录、波形数据、药物使用、术后并发症、实验室指标等)
- 分析工具(如 Python/R/Matlab)、预期研究周期
✅ 合规声明:勾选「我承诺遵守数据使用协议条款」「仅用于学术研究」等声明项
三、第三步:签署数据使用协议(DUA)
- 申请表单提交后,系统会自动跳转至《Data Use Agreement》(DUA)签署页面(或通过邮件发送 DUA 链接),协议核心条款:
- 禁止将数据用于商业目的或向第三方共享原始数据
- 发表论文需引用 MOVER 数据集(推荐格式:UC Irvine MOVER Dataset. https://mover.ics.uci.edu, 2015-2022)
- 研究结束后 30 日内删除原始数据,仅保留分析结果
- 签署方式:
- 电子签署:在线填写姓名、日期,提交后系统自动记录签署状态
- 机构盖章(如需):若所属机构要求协议备案,可下载 DUA 打印盖章后扫描,通过表单附件上传(或回复后续通知邮件)
四、第四步:等待审核并激活访问权限
- 审核周期:UCI 团队通常在 7-14 个工作日内完成审核(比 PhysioNet 快,比 VitalDB 稍久)
- 审核结果通知:通过申请时填写的学术邮箱发送,包含以下关键信息:
- 权限激活确认:告知账号已升级为「认证用户」
- 数据下载链接:按所需数据类型分类(SIS 数据集 2015-2017、EPIC 数据集 2017-2022),支持分批次下载(避免单次文件过大)
- 访问凭证(如有):部分数据需用临时令牌(Token)登录下载,有效期 1 个月,可申请续期
- 数据格式说明:下载文件为 CSV/Gzip 格式,包含完整的术前 / 术后实验室指标(如白细胞、肌酐、胱抑素 C)、并发症记录(心血管事件、切口感染等),可直接用 Python/R 读取分析
五、关键注意事项(避坑指南)
- 邮箱一致性:申请表单填写的邮箱需与后续接收通知、签署协议的邮箱一致,避免审核延误
- 研究主题匹配:需明确提及 “手术相关研究”,避免填写无关主题(如纯基础医学、非临床数据分析),否则可能被驳回
- 数据范围确认:MOVER 包含 2015-2022 年数据(分 SIS/EPIC 两个电子病历系统模块),申请时可注明所需时间范围,减少下载量
- 二次访问:认证用户权限长期有效,后续数据集更新(按季度更新)会收到邮件通知,无需重复申请
六、常见问题快速解决
| 问题场景 | 解决方案 |
| 找不到「Request Access」按钮 | 清除浏览器缓存,直接访问下载页面:https://mover.ics.uci.edu/download.html,或更换 Chrome 浏览器 |
| 未收到审核通知 | 检查垃圾邮件箱,若超过 14 个工作日未回复,发送邮件至 UCI 数据支持团队:mover-support@ics.uci.edu(主题注明 “Data Access Request Follow-Up - 姓名 - 所属机构”) |
| 下载链接失效 | 回复权限激活邮件,说明 “链接过期”,申请重新生成下载令牌 |
| 需特定格式数据(如 Excel) | 申请时在 “备注” 栏说明需求,UCI 团队可提供格式转换支持(需额外 1-2 个工作日) |
七、数据集引用要求(必看)
发表论文或公开研究成果时,需按以下格式引用 MOVER 数据集,避免侵权:
UC Irvine Medical Center. MOVER (Medical Informatics Operating Room Vitals and Events Repository). https://mover.ics.uci.edu, 2015-2022.
同时在致谢部分注明:“The authors acknowledge the MOVER dataset for providing access to surgical and perioperative clinical data.”
6901





