35. BI - 利用项目「恶意软件检测」来看 GCN 和 LSTM 的对比

茶桁

于 2024-04-28 07:45:00 发布

阅读量883

点赞数 10

CC 4.0 BY-SA版权

分类专栏：茶桁的AI秘籍#BI 茶桁的 AI 会员专栏文章标签： lstm 人工智能 rnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ivandoo/article/details/138261174

茶桁的 AI 会员专栏同时被 2 个专栏收录

139 篇文章 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

茶桁的AI秘籍#BI

37 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文为「茶桁的 AI 秘籍 - BI 篇第 35 篇」

文章目录

在这里插入图片描述

Hi，你好。我是茶桁。

我们通过两节课的内容，应该对 GCN 已经有了初步的了解并熟悉了它的整个逻辑和应用过程。那么这一节课咱们就来看一个实际的项目。这个项目中一共有 4 万多个恶意软件。

相信很多同学应该都或多或少的用过查毒的软件吧？那么，杀毒软件怎么查毒呢？杀毒软件其实也是要通过软件的一些特征行为来做判断，那行为的采集是由 API 来做标识的。

20240227145035

在途中，hash 是理解成是一个ID，后面 t_0 到 t_99 是它 100 次调用的序号，这里的API的序号是系统里面的哪一个进程。最终，malware 代表的是恶意软件，0 是正常，1 是恶意软件。

这是 Kaggle 上的一个案例，具体地址可以参看这里：https://www.kaggle.com/datasets/ang3loliveira/malware-analysis-datasets-api-call-sequences

打开地址之后咱们来看一看

20240227145339

整个案例的数据是一共有 4 万多个恶意和 1,000 多个正常的。看到这里我们就可以知道，这个样本是一个分类的任务，并且这个分类还很不均衡。对于不均衡的问题一会做数据以及切分的时候要注意

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

茶桁 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。