
python
文章平均质量分 70
武者小路
Python数据挖掘与分析
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
二维装箱gui
【代码】二维装箱gui。原创 2023-06-10 17:28:05 · 1017 阅读 · 0 评论 -
Pandas transform函数
Pandas是一个很有用的库,它包含了大量用于操作数据的内置函数。其中,transform()在处理行或列时非常有用。在本文中,我们将介绍以下最常用的Pandas transform()用途: 1. 转换值 2. 组合groupby() 3. 过滤数据 4. 在组级别处理缺失值转载 2021-03-31 15:43:40 · 1663 阅读 · 0 评论 -
python随机森林回归数据实战
文章目录前言一、随机森林回归器参数介绍二、数据实战1.数据介绍2.重点代码2.1特征集和标签集获取2.2数据集划分2.3随机森林模型训练2.4预测结果可视化2.5 特征重要性选择及可视化3.完整代码总结前言我为什么写这篇博客?答:记录一下自己对于sklearn库的学习过程以及学习方法,方便以后进行复用这篇文章主要讲什么?这篇文章是我使用sklearn的随机森林对我这个你在研究的数据进行处理分析的一个过程,其中包括对应的一些方法,具体见目录。随机森林简介?随机森林是一种统计学习理论,其随机有两原创 2020-11-12 11:51:53 · 19561 阅读 · 12 评论 -
Python函数执行效率的探究
1.前言1.1 文章简介之所以会写本篇博客是因为在用python写代码的时候发现数据分析的时间开销特别大,所以希望来如何去尽可能优化我的python代码(本篇目的旨在优化我的python代码,仅供参考)探究影响因素1.函数调用2 函数嵌套3 单变量数值(已取消)评价指标程序执行时间t1.2 代码简介本次代码取自我毕设数据分析代码的一部分通过遍历三个层级的文件...原创 2020-03-21 11:57:22 · 1146 阅读 · 1 评论 -
Python中利用pandas统计列表中不同元素的数量
0.前言常见的统计python列表内不同元素个数的方法有很多,最常用的是len(set(a))这个方法,但是这个方法的问题在于a的数据类型不能是列表及其他复杂数据类型,本篇博客的目的就是为了解决这个问题。1.使用函数pandas.value_couts()2.代码示例#使用传统方法a= [[1,2,1],[2,1,2],[2,1,1],[1,2,1]]print(set(a))Tr...原创 2020-03-07 10:38:46 · 15659 阅读 · 1 评论 -
python新手常见的错误汇总
1.invalid character in identifier翻译:标识符中的无效字符原因:1.符号中英文切换问题比如: 英文的冒号 ‘:’以及中文的冒号‘:’混用2.EOL while scanning string literal翻译: EOL字符串文字扫描出现错误原因:1.检查一下“ ”或者‘ ’ 等字符串符号是否完整,可能缺半边3.local variable ‘&...原创 2018-10-19 11:50:02 · 1481 阅读 · 0 评论 -
Python提取Excel表格数据并用DataFrame处理求平均值输出
使用ipython进行代码编写,清洗excel的数据并且转化到DataFrame上进行平均值的输出,最后输出为新的Excel的表格原创 2018-10-17 14:19:05 · 33570 阅读 · 3 评论