使用遗传算法优化LSTM模型进行垃圾短信检测
1. 引言
随着技术的发展,短信服务(SMS)的使用日益广泛。然而,这也给一些人提供了机会,他们通过向消费者发送垃圾短信来利用这项服务。垃圾短信不仅使人们难以接收重要信息,还对个人隐私构成威胁。
在亚洲,2012年约20 - 30%的短信被报告为垃圾短信;2008年,中国手机用户一周内收到约20000亿条垃圾短信;2011年,尽管北美每人每天收到的垃圾短信量仅约0.1%,但美国仍有44%的手机用户在调查中确认曾是垃圾短信的受害者。
为了减少垃圾短信对手机用户的影响,研究人员提出了多种方法,包括机器学习分类算法(如支持向量机、决策树等)和自然语言处理(NLP)技术。深度学习的发展也使得卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等技术被用于垃圾短信检测,并取得了令人满意的结果。
不过,神经网络通常有大量的超参数,这些超参数决定了网络的拓扑结构和计算能力。选择合适的超参数通常通过试错法,但这种方法计算成本高且耗时。近年来,进化算法被用于自动寻找最优的神经架构,遗传算法就是其中一种,它可以模拟生物的遗传机制,如遗传、交叉、变异和选择,以找到最优的参数配置。
2. 相关工作
- Gupta等人的研究 :使用多个数据集对八种常用的机器学习分类器进行比较,包括支持向量机(SVM)、朴素贝叶斯、决策树、逻辑回归、随机森林、AdaBoost、人工神经网络(ANN)和卷积神经网络(CNN)。使用四个性能指标(准确率、精确率、召回率和CAP曲线)进行评估,结果表明CNN在两个数据集上的准确率最高。 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



