数据挖掘第四周周报

本周在数据挖掘项目中,利用神经网络对处理后的数据集进行分类,虽取得非随机效果,但优化困难。为提升效果,深入进行特征工程,尝试了低方差过滤、缺省值删除、高相关过滤、PCA等多种降维方法,并对数据集进行填充缺失值、分箱和字符串映射等操作。面对降维方法选择和计算效率问题,计划进一步研究和优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 数据挖掘第四周周报
  • 1、本周工作
    • 本周主要是实现了神经神经网络在数据集上的初步运用,在经过主观降维的数据集处理以后,对测试集进行了分类,并得到了结果。如图所示:

得到了不是0.5的结果,说明神经网络的作用还是有的,但是在经过对于迭代次数的改变和训练集的改变以后,还是没有能优化到一个更好的结果,于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理,

这一周的后几天我都是在处理数据集的特征,https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的帮助下,我对很多的降维方法进行尝试,有什么低方差过滤、缺省值删除、高相关过滤、PCA降维等方法,

trainData[numerical_fea] = trainData[numerical_fea].fillna(trainData[numerical_fea].median())
testAData[numerical_fea] = testAData[numerical_fea].fillna(testAData[numerical_fea].median())

mm = MinMaxScaler()
data = mm.fit_transform(data)

pca = PCA(n_components = 10,copy=True)
data = pca.fit_transform(data)

在结

爬虫Python学习是指学习如何使用Python编程语言来进行网络爬取和数据提取的过程。Python是一种简单易学且功能强大的编程语言,因此被广泛用于爬虫开发。爬虫是指通过编写程序自动抓取网页上的信息,可以用于数据采集、数据分析、网站监测等多个领域。 对于想要学习爬虫的新手来说,Python是一个很好的入门语言。Python的语法简洁易懂,而且有丰富的第三方库和工具,如BeautifulSoup、Scrapy等,可以帮助开发者更轻松地进行网页解析和数据提取。此外,Python还有很多优秀的教程和学习资源可供选择,可以帮助新手快速入门并掌握爬虫技能。 如果你对Python编程有一定的基础,那么学习爬虫并不难。你可以通过观看教学视频、阅读教程、参与在线课程等方式来学习。网络上有很多免费和付费的学习资源可供选择,你可以根据自己的需求和学习风格选择适合自己的学习材料。 总之,学习爬虫Python需要一定的编程基础,但并不难。通过选择合适的学习资源和不断实践,你可以逐步掌握爬虫的技能,并在实际项目中应用它们。 #### 引用[.reference_title] - *1* *3* [如何自学Python爬虫? 零基础入门教程](https://blog.youkuaiyun.com/zihong523/article/details/122001612)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [新手小白必看 Python爬虫学习路线全面指导](https://blog.youkuaiyun.com/weixin_67991858/article/details/128370135)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值