用python实现垃圾文件的识别

在使用电脑的过程中,我们难免会收到垃圾文件,有时候会影响我们的工作和生活,现我打算编写一个python程序来实现垃圾文件的鉴别.

一般情况下垃圾文件中会包含【】*-/\\这些符号,我们可以设定阈值以判断是否为垃圾文件,比如我现在认为这些符号的占比>=0.2时判定为垃圾文件,可以设置rate=0.2.

接下来我们自定义一个函数用来判断字符串是否为垃圾文件,这里我定义这个函数为check,即检查判断的意思:def check(text, rate=0.2):,其中text就是我们要进行判断的字符串.接下来用python进行编写,这里我还使用了lambda进行赋值,如下图所示:

这样我们就可以通过阈值来判断字符串是否为垃圾文件了,运行一下试试

可以看到该字符串被判定为垃圾文件,我们也可以改变阈值进行操作:

当把阈值提高到0.5时,此字符串被判定为正常邮件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值