看看人家那文本识别系统,那叫一个优雅

本文推荐了一款强大的文本识别工具pyWhat,能快速识别各类信息格式如邮件、视频编号等。它不仅适用于恶意软件分析,还能快速分析Pcap文件,提取信用卡号、加密货币地址等结构化数据。扫码获取源码,提升数据分析效率。

正文

今天,推荐一个文本识别系统项目。猿哥第一次使用就有点上头,爱不释手,必须要推荐给大家。

上次是谁要的文本识别系统项目啊,猿哥帮你找到了。

这是我目前见过最好的文本识别系统项目。功能完整,代码结构清晰。值得推荐。

📚 项目介绍

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

356e111bb4ae1ca6905f21757a4460db.png

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

e04b4d7c2a12e94d78156e427295df6e.png

目前,pyWhat已经在Github上标星3.9K,累计分支 127 个。

1a90b9cd54a696b7870ae915034b7e35.gif

同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配。

示例

6d79b548ff90c82f02cda8edfa70b086.png

比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。

更快地分析 Pcap 文件

bcff8afba9fb3cf8522e77f186dbebca.gif

假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:

  • 所有哈希

  • 信用卡号码

  • 加密货币地址

  • 联系方式等

简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

项目源码,怎么领取?

源码获取
扫码下方二维码,后台回复【文本识别】即可获取所有系统

88d204dcb3d08d434e1d5bf2e1cf1ea1.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值