
关于Octopii
Octopii是一款功能强大的AI驱动的个人身份信息(PII)扫描工具,可以帮助广大研究人员在一个目录中扫描各种和个人身份信息(PII)相关的图片资源,比如说身份*证信息、护照、照片和签名等等。
工作机制
Octopii使用了Tesseract的OCR和Keras的CNN模块来检测各种形式的可能会发生泄漏面临安全风险的个人身份信息。该工具通过下列步骤实现其功能:
1、导入和清理图片资源
图像通过OpenCV导入,并进行清理、去扭斜和旋转以进行扫描。
2、执行图片分类
扫描图像的特征,如ISO/IEC 7810规格、颜色、文本位置、照片、全息图等,这一步通过传递图像并将其与训练模型进行比较来完成。
3、光学字符识别(OCR)
作为一种最终验证方法,扫描图像中的某些字符串,以验证模型的准确性。
扫描的准确性可以通过输出中的置信分数来确定。如果满足上述所有条件,则返回100.0分。
为了训练模型,还可以将数据输入model_generator.py脚本并使用新改进的h5文件来进行数据处理。
工具下载
由于该工具基于Python 3开发,因此广大研究人员首先需要在本地设备上安装并配置好Python 3环境。接下来,使用下列命令将该项目源码克隆至本地:
git clone https://github.com/redhuntlabs/Octopii.git
接下来,使用pip命令和项目提供的requirements.txt文件来安装该项目所需

Octopii是一款使用AI技术,基于TesseractOCR和KerasCNN模块的个人身份信息扫描工具,用于检测图片中的敏感信息如身份证、护照等。它通过图像处理、分类和OCR来识别PII,并提供置信度评分。用户需先安装Python3环境和依赖,然后运行工具进行扫描。文章还提供了学习网络安全的详细路线图。
最低0.47元/天 解锁文章
9452

被折叠的 条评论
为什么被折叠?



