基于机器学习的恶意软件检测技术详解
1. 提取文件的N - 元组
1.1 准备工作
在进行文件的N - 元组提取前,需要进行一些准备工作:
- 安装 nltk 包,使用以下命令:
pip install nltk
- 下载一个测试文件,例如从 这里 下载Python可执行文件。
1.2 操作步骤
以下是提取文件4 - 元组并选择最频繁的50个的具体步骤:
1. 导入必要的库:
import collections
from nltk import ngrams
- 指定要分析的文件:
file_to_analyze = "python-3.7.2-amd64.exe"
- 定义读取文件字节的函数:
def read_file(file_path):
"""Reads in
超级会员免费看
订阅专栏 解锁全文
7726

被折叠的 条评论
为什么被折叠?



