作业头
| 这个作业属于那个课程 | 自然语言处理 |
|---|---|
| 这个作业要求在哪里 | https://bbs.youkuaiyun.com/topics/615901519 |
| 我在这个课程的目标是 | 了解如何识别垃圾短信的具体流程 |
| 这个作业在那个具体方面帮助我实现目标 | 实践操作如何去实现基于文本内容的垃圾短信识别 |
| 参考文献 |
作业内容:
基于文本内容的垃圾短信识别
作业要求:
1.设计目的
通过课程设计的练习,加深学生对所学自然语言处理的理论知识与操作技能的理解和掌握,使得学生能综合运用所学理论知识和操作技能进行实际工程项目的设计开发,让学生真正体会到自然语言处理算法在实际工程项目中的具体应用方法,为今后能够独立或协助工程师进行人工智能产品的开发设计工作奠定基础。通过综合应用项目的实施,培养学生团队协作沟通能力,培养学生运用现代工具分析和解决复杂工程问题的能力;引导学生深刻理解并自觉实践职业精神和职业规范;培养学生遵纪守法、爱岗敬业、诚实守信、开拓创新的职业品格和行为习惯。
2.设计要求
2.1 实验仪器及设备
(1)使用64位Windows操作系统的电脑。
(2)使用3.8.5版本的Python。
(3)使用PyCharm Community Edition编辑器。
(4)使用 jieba, wordcloud……
2.2 设计要求
课程设计的主要环节包括课程设计作品和课程设计报告的撰写。课程设计作品的完成主要包含方案设计、计算机编程实现、作品测试几个方面。课程设计报告主要是将课程设计的理论设计内容、实现的过程及测试结果进行全面的总结,把实践内容上升到理论高度。
3.设计内容
通过进行文本分类来识别出数据集里的垃圾信息,使用了高斯朴素贝叶斯(Gaussian Naive Bayes)模型进行文本分类,然后计算模型的性能指标。运用多标签分类器等分类器来进行模型训练,得出混淆矩阵以及各个模型的正确率。
4.设计过程
4.1 设计背景
随着移动通信技术和智能手机的不断普及,短信成为人们日常沟通的重要方式之一。然而,随着短信的广泛使用,垃圾短信也不断增多,甚至成为了

最低0.47元/天 解锁文章


被折叠的 条评论
为什么被折叠?



