Set 1-6 Break repeating-key XOR
题目大意
使用repeating-key XOR对明文文本进行加密并进行base64编码得到此文件,试得到明文文本。
分析
- 首先猜测密钥长度,记为keysize,建议猜测范围为2到40。
- 写一个计算两个字符串的Hamming distance的函数。Hamming distance是两个字符串不同比特的数量。例如,
this is a test
和wokka wokka!!!
之间的Hamming distance为37。 - 对于每一个keysize,获得密文文本的第一个长度为keysize的块以及第二个长度为keysize的块,计算这两个块的Hamming distance并除以keysize得到结果记为nomal_distance。
- 有着最小的nomal_distance的keysize很可能就是密钥的长度。可以选择最小的三个nomal_distance所对应的keysize进行接下来的操作。也可以在第3步中使用4个keysize大小的块来计算得到nomal_distance。
- 将密文分为长度为keysize的块。
- 将每个块中的第一个字节组合成一个新的块,每个块中的第二个字节组合成一个新的块,依次类推。
- 使用single-character XOR来处理每个新块。即第一个新块中的每个字节均和密钥的第一个字节异或,第二个新块中的每个字节均和密钥的第二个字节异或,依次类推。由此可得到每个keysize所对应的候选密钥key。
- 分别将每个候选密钥key与密文进行xor_repeat_key操作得到明文文本。计算各个明文文本的评分分数,分数最高的即为我们需要得到的明文文本。
实现
python代码见github:
https://github.com/nasume/cryptopals/blob/master/Set1/break_repeating_key_XOR.py