基于PCFG的密码破解实践优化
现有工具情况与问题
在当前的密码破解工具中,部分工具支持字母大小写规则、键盘模式,还能使用马尔可夫链生成新的密码片段。在训练阶段,用户可以设置覆盖值,以此确定仅使用重写规则生成猜测的比例,其余部分则通过基于马尔可夫的暴力破解生成。同时,平滑参数可让用户应用概率平滑。此外,工具还支持处理像“<3”或“#1”这类上下文敏感的字符序列,若训练数据中存在这些序列,会形成一套独立的重写规则。
然而,尽管Houshmand做出了诸多改进,但用户仍面临密码猜测速度缓慢的问题,这已成为整个过程的瓶颈。随着时间推移,密码猜测的生成速度会逐渐变慢,并且内存需求较高。使用基于泄露数据集训练的概率上下文无关文法(PCFG)创建完整的可能密码候选词列表可能需要数小时甚至数天。而且,当前工具无法提供密钥空间大小的信息,即可能的密码候选数量,这使得用户难以预估整个过程所需的时间。
优化目标与指标
为了让基于PCFG的密码破解更适用于实际应用,我们设定了以下目标:
- 创建一个更快的“密码生成器”,在相同硬件条件下能同时生成更多猜测。
- 开发一个工具来计算PCFG可能生成的密码猜测数量,这有助于估算输出字典的大小以及生成所有密码候选所需的时间。
- 分析修改现有文法是否能对密码猜测过程有所帮助,具体考察是否能加速猜测过程或使猜测在合理时间内完成。
为验证这些努力的成效,我们研究以下指标:
- 单位时间内的猜测数量。
- 密码猜测的总时间。
- 生成的密码数量。
- 测试数据集的成功率,即新生成的密码在现有密码字典中的出现比例。
超级会员免费看
订阅专栏 解锁全文
1360

被折叠的 条评论
为什么被折叠?



