在使用电脑的过程中,我们难免会收到垃圾文件,有时候会影响我们的工作和生活,现我打算编写一个python程序来实现垃圾文件的鉴别.
一般情况下垃圾文件中会包含【】*-/\\这些符号,我们可以设定阈值以判断是否为垃圾文件,比如我现在认为这些符号的占比>=0.2时判定为垃圾文件,可以设置rate=0.2.
接下来我们自定义一个函数用来判断字符串是否为垃圾文件,这里我定义这个函数为check,即检查判断的意思:def check(text, rate=0.2):,其中text就是我们要进行判断的字符串.接下来用python进行编写,这里我还使用了lambda进行赋值,如下图所示:

这样我们就可以通过阈值来判断字符串是否为垃圾文件了,运行一下试试

可以看到该字符串被判定为垃圾文件,我们也可以改变阈值进行操作:

当把阈值提高到0.5时,此字符串被判定为正常邮件
1179

被折叠的 条评论
为什么被折叠?



