识别并脱敏上传到deepseek/chatgpt的文本文件中的身份证/手机号

本文将介绍一种简单高效的方法解决用户在上传文件到DeepSeek、ChatGPT,文心一言,AI等大语言模型平台过程中的身份证号以及手机号等敏感数据识别和脱敏问题。

DeepSeek、ChatGPT,Qwen,Claude等AI平台工具快速的被接受和使用,用户每天上传的文本数据中潜藏着大量敏感信息,大量的AI服务数据泄漏事件源于未正确处理输入数据。

  • 你是否在上传数据到deepseek,chatgpt,通义千问,豆包,腾讯元宝,纳米搜索等平台之前犹豫过?
  • 是否纠结如何快速的检查数据中是否存在敏感信息?
  • 是否受制于如何快速轻量的对这些数据进行脱敏?
  • 你是否担心数据上传到大语言模型等AI平台之后,敏感信息等会被用于特殊的用途?
  • 你是否担心数据不仅会被大模型平台获取,还会被诸多的插件应用获取?

那么本文将帮你找到答案。

如果不想了解原理和过程部分的内容,可以直接跳转到单一敏感信息脱敏章节获取使用的方法和技巧,本文的目录结构如下:
在这里插入图片描述

单一信息信息脱敏

下面将使用cyberchef对于姓名,身份证号,手机号这几种信息进行识别和脱敏。关于cyberchef内容的详细介绍,见我的专栏《Cyberchef 从入门到精通教程》,

如果 `idCard` 没有经过脱敏处理,而 `verifyCard` 是前端传递的脱敏身份证数据,您可以使用一些方法来进行比较。以下是一种可能的解决方案: ```java // 解密脱敏身份证数据 String idCard = userInfo.getCard(); String verifyCard = verifyUser.getCard(); // 前端传递的脱敏身份证数据 // 判断前端传递的脱敏身份证数据是否与原始身份证数据相匹配 boolean isMatch = isIdCardMatch(idCard, verifyCard); if (isMatch) { userInfo.setCard(verifyCard); } // 进行身份证数据匹配的方法 private boolean isIdCardMatch(String idCard, String verifyCard) { // 这里假设前端传递的脱敏身份证数据是去除了部分字符的原始身份证数据 // 比较时忽略身份证中的空格和其他特殊字符 String processedIdCard = idCard.replaceAll("\\s", "").replaceAll("[^\\da-zA-Z]", ""); String processedVerifyCard = verifyCard.replaceAll("\\s", "").replaceAll("[^\\da-zA-Z]", ""); return processedIdCard.equalsIgnoreCase(processedVerifyCard); } ``` 在上述代码中,我假设前端传递的脱敏身份证数据是去除了部分字符的原始身份证数据。我们通过去除空格和其他特殊字符,将 `idCard` 和 `verifyCard` 进行比较。如果处理后的字符串相同(忽略大小写),则认为匹配成功,将脱敏身份证数据赋值给 `userInfo` 对象的 `card` 属性。 请注意,这只是一种可能的解决方案,具体实现方式取决于您的需求和数据处理逻辑。您可以根据实际情况进行相应的调整和修改。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

村中少年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值