Octopii:一款AI驱动的个人身份信息(PII)扫描工具

Octopii是一款使用AI技术,基于TesseractOCR和KerasCNN模块的个人身份信息扫描工具,用于检测图片中的敏感信息如身份证、护照等。它通过图像处理、分类和OCR来识别PII,并提供置信度评分。用户需先安装Python3环境和依赖,然后运行工具进行扫描。文章还提供了学习网络安全的详细路线图。

关于Octopii

Octopii是一款功能强大的AI驱动的个人身份信息(PII)扫描工具,可以帮助广大研究人员在一个目录中扫描各种和个人身份信息(PII)相关的图片资源,比如说身份*证信息、护照、照片和签名等等。

工作机制

Octopii使用了Tesseract的OCR和Keras的CNN模块来检测各种形式的可能会发生泄漏面临安全风险的个人身份信息。该工具通过下列步骤实现其功能:

1、导入和清理图片资源

图像通过OpenCV导入,并进行清理、去扭斜和旋转以进行扫描。

2、执行图片分类

扫描图像的特征,如ISO/IEC 7810规格、颜色、文本位置、照片、全息图等,这一步通过传递图像并将其与训练模型进行比较来完成。

3、光学字符识别(OCR)

作为一种最终验证方法,扫描图像中的某些字符串,以验证模型的准确性。

扫描的准确性可以通过输出中的置信分数来确定。如果满足上述所有条件,则返回100.0分。

为了训练模型,还可以将数据输入model_generator.py脚本并使用新改进的h5文件来进行数据处理。

工具下载

由于该工具基于Python 3开发,因此广大研究人员首先需要在本地设备上安装并配置好Python 3环境。接下来,使用下列命令将该项目源码克隆至本地:

git clone https://github.com/redhuntlabs/Octopii.git

接下来,使用pip命令和项目提供的requirements.txt文件来安装该项目所需

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值