自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

人工智能(AI)技术,大模型技术,深度学习,机器学习,计算机视觉,AI工具实践应用等分享

任何疑问欢迎交流探讨,也可以直接与我联系,非常欢迎!

  • 博客(1233)
  • 资源 (13)
  • 收藏
  • 关注

原创 【大模型提示词工程】Gradient-based Prompt Search 原理是什么?

Gradient-based Prompt Search 原理是什么?

2025-11-24 15:55:04 3

原创 【大模型提示词工程】Prompt Ensemble 如何提升鲁棒性?

Prompt Ensemble 如何提升鲁棒性?

2025-11-24 15:54:18 6

原创 【大模型提示词工程】提示词搜索可以用强化学习优化吗?

提示词搜索可以用强化学习优化吗?

2025-11-24 15:39:02 3

原创 【大模型提示词工程】什么是Prompt Optimization?

什么是Prompt Optimization?

2025-11-24 15:36:57 4

原创 【大模型提示词工程】如何用AutoPrompt或Prompt Tuning自动搜索提示?

如何用AutoPrompt或Prompt Tuning自动搜索提示?

2025-11-24 15:34:53 91

原创 【大模型提示词工程】 Prompt Compression:如何在小窗口内压缩更多语义?

Prompt Compression:如何在小窗口内压缩更多语义?

2025-11-23 21:12:36 15

原创 【大模型提示词工程】 Conversation History 的最佳截断策略?

Conversation History 的最佳截断策略?

2025-11-23 21:11:57 15

原创 【大模型提示词工程】 提示词如何帮助模型维持上下文身份一致?

提示词如何帮助模型维持上下文身份一致?

2025-11-23 20:12:12 25

原创 【大模型提示词工程】模型在多轮对话中如何保持“短期记忆”?

模型在多轮对话中如何保持“短期记忆”?

2025-11-23 20:11:23 9

原创 【大模型提示词工程】 如何在Prompt中引用文档内容而不触发幻觉?

如何在Prompt中引用文档内容而不触发幻觉?

2025-11-23 20:10:44 31

原创 【大模型提示词工程】什么时候需要引入外部记忆(Memory)机制?

什么时候需要引入外部记忆(Memory)机制?

2025-11-22 17:36:50 55

原创 【大模型提示词工程】什么是Context Window?为什么影响巨大?

什么是Context Window?为什么影响巨大?

2025-11-22 17:33:23 29

原创 【大模型提示词工程】如何在长上下文中保持主题一致?

如何在长上下文中保持主题一致?

2025-11-22 17:30:12 24

原创 【大模型提示词工程】Retrieval-Augmented Prompting 与 RAG 的关系?

Retrieval-Augmented Prompting 与 RAG 的关系?

2025-11-22 17:29:26 8

原创 【大模型提示词工程】Retrieval-Augmented Prompting 与 RAG 的关系?

Retrieval-Augmented Prompting 与 RAG 的关系?

2025-11-22 17:28:23 7

原创 【大模型提示词工程】动态上下文提示(Dynamic Prompting)是如何实现的?

动态上下文提示(Dynamic Prompting)是如何实现的?

2025-11-22 17:25:22 10

原创 【大模型提示词工程】如何让模型“自己验证自己的思维链”?

如何让模型“自己验证自己的思维链”?

2025-11-21 22:09:18 82

原创 【大模型提示词工程】自我反思(Self-Reflection)提示如何帮助模型纠错?

自我反思(Self-Reflection)提示如何帮助模型纠错?

2025-11-21 21:55:39 40

原创 【大模型提示词工程】Tree-of-Thought 的分支选择如何控制?

Tree-of-Thought 的分支选择如何控制?

2025-11-21 21:43:45 18

原创 【大模型提示词工程】多步推理时,如何让模型保持逻辑一致性?

多步推理时,如何让模型保持逻辑一致性?

2025-11-21 21:43:05 43

原创 【大模型提示词工程】CoT 提示在代码生成任务中是否同样有效?

CoT 提示在代码生成任务中是否同样有效?

2025-11-21 21:42:13 31

原创 【大模型提示词工程】如何平衡推理深度与推理效率?

如何平衡推理深度与推理效率?

2025-11-20 22:54:00 43

原创 【大模型提示词工程】思维链是否会引入更多幻觉?

思维链是否会引入更多幻觉?

2025-11-20 22:19:10 26

原创 【大模型提示词工程】Chain-of-Thought 与 Tree-of-Thought 有何区别?

Chain-of-Thought 与 Tree-of-Thought 有何区别?

2025-11-20 21:56:14 16

原创 【大模型提示词工程】“Let’s think step by step” 为什么有效?

“Let’s think step by step” 为什么有效?

2025-11-20 21:55:38 15

原创 【大模型提示词工程】为什么思维链(CoT)能显著提升推理性能?

为什么思维链(CoT)能显著提升推理性能?

2025-11-20 21:55:00 33

原创 【大模型提示词工程】Prompt模板在多语言环境中如何迁移?

Prompt模板在多语言环境中如何迁移?

2025-11-19 18:15:11 514

原创 【大模型提示词工程】如何结合正反例(Positive/Negative Example)优化Prompt?

如何结合正反例(Positive/Negative Example)优化Prompt?

2025-11-19 18:14:03 451

原创 【大模型提示词工程】任务分解型提示词的构建流程?

任务分解型提示词的构建流程?

2025-11-19 13:11:11 511

原创 【大模型提示词工程】如何设计层级化Prompt(Hierarchical Prompt)?

如何设计层级化Prompt(Hierarchical Prompt)?

2025-11-19 13:10:04 360

原创 【大模型提示词工程】 什么是“Prompt Pattern”?有哪些经典模式?

什么是“Prompt Pattern”?有哪些经典模式?

2025-11-19 13:09:17 339

原创 【大模型提示词工程】模板提示在自动化任务中如何集成?

模板提示在自动化任务中如何集成?

2025-11-18 16:06:18 321

原创 【大模型提示词工程】使用占位符和变量能否让Prompt更通用?

使用占位符和变量能否让Prompt更通用?

2025-11-18 16:04:57 465

原创 【大模型提示词工程】如何设计一个通用的Prompt模板?

如何设计一个通用的Prompt模板?

2025-11-18 16:02:23 258

原创 【大模型提示词工程】系统提示(System Prompt)在Chat模型中起什么作用?

系统提示(System Prompt)在Chat模型中起什么作用?

2025-11-18 15:57:49 217

原创 【大模型提示词工程】为什么结构化提示比自由文本提示更稳定?

为什么结构化提示比自由文本提示更稳定?

2025-11-18 15:56:49 1080

原创 【大模型提示词工程】为什么提示词中的角色设定(Role Prompting)能改变模型行为?

为什么提示词中的角色设定(Role Prompting)能改变模型行为?

2025-11-17 21:57:39 700

原创 【大模型提示词工程】如何快速判断一个提示词是否“有效”?

如何快速判断一个提示词是否“有效”?

2025-11-17 21:56:23 702

原创 【大模型提示词工程】Prompt、Input、Context、Instruction之间的区别?

Prompt、Input、Context、Instruction之间的区别?

2025-11-17 21:53:58 1394

原创 【大模型提示词工程】Chain-of-Thought(思维链)提示能带来哪些提升?

Chain-of-Thought(思维链)提示能带来哪些提升?

2025-11-17 21:51:02 820

爬虫案例基于arXiv API的热点趋势分析工具:利用Python爬虫与Z-score模型实现研究主题热度挖掘系统设计

内容概要:本文提供了一个可直接运行的Python脚本,用于从arXiv公开API抓取计算机科学、机器学习等领域近28天的论文数据,通过将时间划分为最近7天和此前21天两个窗口,利用词频统计、提升比(lift)和z-score显著性分析等方法,自动挖掘研究热点术语。脚本实现了文本预处理、n-gram提取、热点计算与榜单生成,并输出全局及分学科的热点排名CSV文件,整个过程遵循合规爬取原则,使用标准库和requests,具备良好扩展性。; 适合人群:具备一定Python编程基础,对科研趋势分析、数据抓取与文本分析感兴趣的研发人员、数据科学家或研究生;适合工作1-3年希望实践爬虫与数据分析结合的技术人员。; 使用场景及目标:①快速掌握当前学术前沿动态,自动识别新兴研究主题如“diffusion model”、“foundation model”等;②构建科研情报监控系统原型;③学习如何设计基于时间对比的热点发现算法及合规爬虫实现。; 阅读建议:此资源以实际代码驱动分析思维,建议结合脚本逐模块理解数据获取、文本处理与统计建模流程,可自行调整学科分类、时间窗口与阈值参数进行验证,并在此基础上扩展多源数据融合、可视化展示等功能。

2025-10-05

算法竞赛基于离线处理与树状数组的区间不同元素计数方法:蓝桥杯高频题型优化方案

内容概要:本文围绕蓝桥杯竞赛中常见的“离线+数据结构”类题目,详细讲解了“区间内不同数的个数”这一经典问题的高效解法。针对大规模输入下朴素方法易超时的问题,重点介绍了两种优化方案:解法A采用离线处理结合树状数组(Fenwick Tree),通过按右端点排序查询并动态维护元素最后出现位置,实现O((n+q)log n)的时间复杂度;解法B介绍莫队算法的基本思想及其适用场景。文章还提供了小样例的逐步执行过程、参考代码(Python/C++)、常见错误、边界坑点、自测数据及多种扩展变体,帮助深入理解和举一反三。; 适合人群:准备蓝桥杯等算法竞赛的学生,具备一定数据结构与算法基础、希望提升解题效率的初学者至中级选手(如提高组或省赛水平);; 使用场景及目标:①掌握离线查询与树状数组的实际应用技巧;②理解如何通过预处理和排序优化多查询问题;③避免常见TLE陷阱,提升编码稳定性与调试能力;④为应对类似“区间去重统计”及其变体问题提供模板和思路支持;; 阅读建议:建议结合提供的代码与测试用例动手实现,并通过手算模拟执行流程加深对“最后出现位置”机制的理解;注意输入输出优化和索引边界处理,在实际比赛中灵活选用解法A作为首选方案。

2025-10-05

【智能车竞赛】视觉组全栈技术方案:基于双处理器架构的路径识别与控制算法设计

内容概要:本文详细介绍了“中国大学生智能车竞赛(视觉/电磁通用组)”的完整参赛方案,涵盖赛题分析、系统架构设计、软硬件选型、核心算法实现(如视觉感知、状态机决策、轨迹规划与控制)、调参流程、测试评估体系及12周项目里程碑。重点采用双处理器分层架构(Raspberry Pi/Jetson Nano + STM32/ESP32),通过视觉处理获取道路特征,结合FSM实现多场景决策,并使用Pure Pursuit等算法完成横向控制,最终达成稳定跑完全程并精准停车的目标。同时提供常见问题解决方案与现场应对策略。; 适合人群:具备嵌入式开发与Python/C编程基础,参与智能车竞赛的本科生或研究生团队,尤其是有1-2年项目经验的技术负责人或核心开发者。; 使用场景及目标:①指导学生从零搭建智能车系统并实现稳定完赛;②掌握视觉感知、多传感器融合、实时控制、状态机设计等关键技术;③优化控制参数与系统鲁棒性以冲击高分。; 阅读建议:建议按照12周里程碑逐步推进,结合代码骨架搭建工程,重视标定与数据记录,在仿真与实车测试中反复迭代;重点关注延迟控制、抗干扰设计与现场快速调试能力。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷1

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【信息管理系统】基于Node.js与React的全栈项目管理系统:支持评审全流程的轻量级学术项目管理平台设计

内容概要:本文介绍了一个轻量级全栈项目管理与评审系统的Demo源码,覆盖从选题到归档的完整项目生命周期管理。系统支持学生提交、导师评审、管理员监管三大角色,功能包括项目CRUD、团队协作、里程碑跟踪、KPI设定、材料上传、评审评分、审计日志及数据导出。技术栈采用Node.js + Express作为后端,React + Vite构建前端,使用Tailwind CSS和shadcn/ui组件库,数据库为better-sqlite3,认证基于JWT与bcrypt加密,具备RBAC权限控制和基础安全防护。源码结构清晰,含详细目录、接口实现、数据库设计及运行指引,并提供种子数据用于快速启动。; 适合人群:具备一定全栈开发基础,熟悉JavaScript/Node.js/React的技术人员,尤其是高校开发者或参与科研项目管理的1-3年经验工程师。; 使用场景及目标:①学习全栈项目架构设计与前后端分离开发实践;②理解RESTful API设计、JWT认证、RBAC权限控制、审计日志等核心模块实现;③作为毕业设计、课程项目或科研管理系统的可扩展原型参考;④掌握从需求分析到部署运行的完整开发流程。; 阅读建议:建议结合文档依次搭建前后端环境并运行项目,通过内置账号体验各角色功能,随后深入源码理解路由逻辑、权限中间件、数据库操作与状态管理机制,可进一步扩展为生产级应用。

2025-10-05

【创新创业教育】基于评审导向的大学生创新创业训练项目高分策略设计:全流程规范化实施与成果可复现方法研究

内容概要:本文是一份针对大学生创新创业训练项目(如国家级大创项目)的“高分攻略”经验分享,系统梳理了从选题、团队搭建、项目执行到答辩全流程的关键策略。文章强调以评审标准为导向,围绕原创性、科学性、可行性、成果规范性四大维度进行逆向设计,提供具体可操作的模板与工具,如选题筛选标准、里程碑规划、证据链准备、答辩PPT结构等,帮助学生将创意转化为高分项目。核心理念是“用证据说话”,突出可验证、可量化、可落地的项目执行过程。; 适合人群:参与大学生创新创业训练计划(大创)、挑战杯、互联网+等科研创新类竞赛的本科生或研究生团队;尤其适合缺乏项目经验但希望提升项目质量和评审得分的学生。; 使用场景及目标:①指导团队科学选题并设计符合评审偏好的项目方案;②规范项目全过程管理,包括进度控制、数据记录、经费使用与成果固化;③高效准备高质量申报材料与答辩展示,提升获奖概率。; 阅读建议:建议团队在立项初期即参照本文框架开展规划,结合提供的模板(如PRD、风险清单、KPI设定等)边执行边积累过程证据,注重原始记录与合规性,避免后期补材料。同时应定期对照“中期自查清单”进行复盘调整,确保项目稳步推进。

2025-10-05

【深度学习-活体检测】CASIA-SURF-images-压缩卷4

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷3

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷2

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷4

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-images-压缩卷1

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-images 是由 CASIA-SURF 视频数据集抽取并处理得到的静态图像版本,保留了原始数据的 RGB、Depth、IR 三模态信息。它从 1000 名被试者的 21000 段视频中抽取关键帧,形成了大规模的 多模态人脸图像对齐集,同时包含真人样本与多种伪造攻击(如纸质打印的多种裁剪方式)。数据经过统一的人脸检测与对齐预处理,便于直接用于图像级的人脸反欺骗任务研究。 价值和意义: 该数据集为研究者提供了更轻量化、更直接的图像样本形式,使模型训练和验证不必局限于视频输入,降低了计算和存储成本。同时,它保持了多模态和攻击多样性的优势,能够支持图像级特征学习、跨模态融合以及深度网络的快速实验。作为视频版数据集的补充,CASIA-SURF-images 不仅方便学界在不同输入粒度下比较方法性能,还进一步推动了人脸反欺骗从视频理解到图像表征学习的多角度探索,对提高方法的通用性和实用性具有重要意义。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷3

数据量大,包括压缩卷1-压缩卷4. CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷1

CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。数据量大,包括压缩卷1-压缩卷4. 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-CVPR2019-压缩卷2

CASIA-SURF-CVPR2019 数据内容: CASIA-SURF 数据集由中国科学院自动化研究所发布,用于人脸反欺骗(活体检测)研究。该数据集包含 1000 名受试者、21000 段视频,每个视频同时采集 RGB、Depth、IR 三种模态,并涵盖真人与伪造样本。设计了六种不同的裁剪方式以增加多样性。数据被划分为训练、验证和测试三部分,并配套了统一的评测协议与指标(如 ACER、APCER、NPCER 及 TPR@FPR=1e-4),形成了 CVPR2019 官方挑战赛的标准数据基础。数据量大,包括压缩卷1-压缩卷4. 价值和意义: 该数据集的出现首次提供了大规模、多模态、高质量的人脸活体检测基准,显著提升了研究的可比性和现实性。它不仅解决了当时人脸反欺骗研究中“数据规模小、模态单一”的瓶颈,还推动了学术界和产业界从单一 RGB 逐步转向 多模态融合 的研究路线。同时,基于该数据集举办的 CVPR2019 挑战赛,促进了统一评测标准的建立,使新方法在公平、客观的环境中得以迭代,对后续更复杂的跨域、多族裔、多攻击场景数据(如 CeFA、HiFiMask)奠定了重要基础。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷3

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷1

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-活体检测】CASIA-SURF-Challenge-压缩卷2

数据量大,包括压缩卷1-压缩卷3. **CASIA-SURF-Challenge** 是由中国科学院自动化研究所发布的大规模人脸活体检测数据集,专为学术竞赛与算法研究设计。该数据集包含超过 **1,000 名被试**,采集了 **RGB、Depth、Infrared** 三模态人脸图像,总量达到 **数百万帧**,并覆盖多种攻击类型(如打印照片、视频回放等),同时划分了严格的训练、验证和测试协议。 它的价值在于:作为目前规模最大的多模态活体检测数据集之一,它为研究者提供了 **高质量、多模态、多样化攻击场景** 的基准,使得算法能够在真实应用中更具鲁棒性和泛化性。通过挑战赛的形式,它还推动了业界和学术界在 **人脸反欺骗、活体检测** 方向上的算法比拼与进步,成为该领域的一个重要里程碑数据集。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷5

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷5 数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷4

数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷3

【深度学习-人脸活体检测】WMCA人脸活体检测的数据集-压缩卷1 数据内容包含四种模态的对齐人脸图像:C(Color,可见光/彩色)、D(Depth,深度)、I(Infrared,红外)、T(Thermal,热成像)。它将原始的多模态采集数据统一裁剪、对齐和归一化,方便研究者直接在不同模态上开展算法训练和测试,而不需要再处理原始视频或多传感器输出。-由于内容太大,包括压缩卷1-压缩卷5 它的价值和作用主要在于: 多模态研究基准:为人脸活体检测/展示攻击检测(PAD)提供了丰富的传感器维度,能支持单模态、跨模态以及多模态融合研究。 复杂攻击覆盖:WMCA 数据集涵盖多种攻击类型(纸质照片、3D 面具、视频回放等),结合 CDIT 四通道,使研究者能在更贴近真实应用场景的数据上评估模型鲁棒性。 推动算法泛化:相比只用 RGB 的数据集,这一预处理版本能帮助探索不同模态的互补性,从而提升系统在真实环境中的泛化与安全性。 一句话总结:WMCA_preprocessed_CDIT.tar.gz 是一个包含 Color、Depth、Infrared、Thermal 四通道人脸图像的预处理数据集版本,价值在于为人脸反欺骗提供标准化、多模态的实验基准,支持更全面和更鲁棒的算法研究。

2025-10-04

C++单目 RGB 视频即可进行实时三维手部追踪算法源码

只用单目 RGB 视频即可进行**实时三维手部追踪**的方法。它把卷积神经网络与手部运动学模型结合,能在遮挡、视角变化下保持解剖合理、时间平滑的手部姿态估计;使用一种**几何一致**的合成到真实图像翻译网络,将合成手部图像“GAN 化”为与真实分布一致的图像,用以训练追踪网络,并在困难的 RGB-only 视频上优于当时 SOTA。 **其核心贡献在于:1)首个在**非约束场景**中仅凭普通摄像头实现**全局 3D 关节**实时跟踪的系统;2)提出融合对抗损失、循环一致性与**几何一致性损失**的翻译网络,显式保留手部姿态几何,从而让“GANerated”图像既逼真又能沿用精确标注;3)据称构建了**>26 万帧**标注的 RGB 数据集,提升了规模、保真度与标注精度,显著缓解了真实 3D 标注难以获取的瓶颈。这些特性让其在 VR/AR、人机交互等需要低成本、通用摄像头输入的应用中具有长期影响。

2025-10-06

【支持C++和python】人体关键点实时检测

本项目实现了人体关键点(Pose Estimation)推理,支持 COCO 与 MPI 两种关键点定义。提供 Python 与 C++ 两套示例,便于快速上手与集成到你的工程中。 主要特性 支持 COCO / MPI 两种骨架格式切换 一键下载模型权重脚本 getModels.sh Python 与 C++ 双语言示例,接口简单、易扩展 适用于单张图片、视频与摄像头输入(可自行扩展)

2025-10-06

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷15

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷14

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷13

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷12

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷11

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷10

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷9

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷8

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷7

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷6

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷5

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷4

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷3

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷2

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-人脸活体检测】CASIA-CeFA-Challenge-压缩卷1

数据量大,包括压缩卷1-压缩卷15. 需要一起解压。 CASIA-CeFA-Challenge 基于 CASIA-SURF CeFA 的跨种族人脸活体检测竞赛用数据:CeFA 数据集覆盖 3 个族群(如非洲、东亚、中亚)、3 种模态(RGB/Depth/IR)、1,607 名受试者,并同时包含 2D(打印、重放)与 3D(3D 面具/硅胶)等攻击类型;CVPR 2020 ChaLearn 挑战设置了单模态(仅 RGB)与多模态两条赛道,并采用官方协议(挑战主要使用 Protocol-4:跨种族 + 攻击类型)与常见指标(如 ACER)进行评测与排名。 其意义与价值在于:CeFA 明确标注族群并提供多模态、更多样的攻击形式,能系统研究与缓解活体检测中的“族群偏置”,提升方法在跨人群与跨场景的泛化;竞赛基准把单/多模态方法置于统一协议与指标下对比,促进模型在鲁棒性与可复现性上的进步,并通过公开数据与排行榜推动社区复现与后续研究

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷4

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷3

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

【深度学习-活体检测】CASIA-SURF-CROP-压缩卷2

数据量大,包括压缩卷1-压缩卷4. 需要一起解压。 CASIA-SURF-CROP 通常指 CASIA-SURF 人脸活体检测数据集的裁剪版:在原始多模态(RGB/Depth/IR)视频基础上,官方已提供对齐的人脸裁剪图(常见训练尺寸约 112×112),便于直接进行图像级别建模而无需再做人脸检测与对齐。CASIA-SURF 本身包含 1,000 名受试者、21,000 段视频(每人 1 段真脸 + 6 段不同纸质打印攻击的伪造视频),由 Intel RealSense SR300 采集;竞赛/基线设置中常按每 10 帧取一帧,并给出训练/验证/测试划分与标签。论文与竞赛报告明确提到“CASIA-SURF 已提供人脸裁剪(face crops)”,实践中常将该裁剪版称为 “CASIA-SURF-CROP”。 意义与价值在于:其规模与多模态设计为活体检测(PAD)提供了大样本且跨通道的监督信号,裁剪后的标准化人脸区域减少了检测噪声与背景干扰,提升了训练效率与可复现性,也使多模态融合/对抗不同纸质攻击的算法评测更客观;同时,该数据集推动了后续更具多样性的扩展(如跨种族、含 2D/3D 多类型攻击的 CASIA-SURF CeFA),用以研究偏置与泛化问题,从而在学术与落地安全场景中都具有基准价值。

2025-10-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除