利用python进行数据分析
文章平均质量分 91
利用python进行数据分析书本学习总结
tenderjets
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用python进行数据分析(重点、易忘点)---第八章数据规整:聚合、合并和重塑
因为一些历史版本的遗留原因,DataFrame的join方法默认使用的是左连接,保留左边表的行索引。combine_first可以看作用传递对象中的数据为调用对象的缺失数据“打补丁”,举例就是下面df1的缺失值在df2看看有没有,如果有就用来替换掉df1的缺失值。它允许你将 DataFrame 中的某个列的值,按另外两列进行分组,创建一个以这些列的组合为列标签的宽格式表。最后一个关于DataFrame的问题是,如果DataFrame的行索引不包含任何相关数据,即行索引作用不大,在这种情况下,传入。原创 2025-02-26 21:32:24 · 995 阅读 · 0 评论 -
利用python进行数据分析(重点、易忘点)---第九章绘图和可视化
使用savefig保存图片,一般用.png格式,在发布图片时最常用到两个重要的选项是dpi(控制“每英寸点数”分辨率)和bbox_inches(可以剪除当前图表周围的空白部分)。使用pandas绘图与之前主要区别在于,之前是在图里面绘制(ax.plot()),或者直接绘制(plt.plot()),这里是在Series或DataFrame后接上plot()。上下两行代码的作用相同,上面是下面的简化版,color是颜色,linestyle是线型,marker是标记。是一个图形对象,它代表整个图形窗口或画布。原创 2025-02-24 21:10:00 · 1071 阅读 · 0 评论 -
利用python进行数据分析(重点、易忘点)---第五章Pandas基础学习
之前看的pandas的教材和课程里,内容参差不齐,很多实际使用很少用上的方法内容有点多,导致很乱而且记不住那么多,这个帖子尽量用最少的文字,最精炼的语言来总结我认为比较实用的方法。原创 2024-12-22 00:26:58 · 1187 阅读 · 0 评论 -
利用python进行数据分析(重点、易忘点)---第三章
所以,像数字、字符串、元组(里面不包含可变对象)等可哈希的类型可以作为集合的元素,而列表、字典等不可哈希的类型不能直接放入集合中。(iterator protocol,它是一种使对象可迭代的通用方式)的方式实现的,一个原生的使对象可迭代的方法。在Python中,可迭代对象是指可以逐一访问其元素的对象,常见的有列表、元组、字符串、字典、集合等容器类型,以及生成器和。的部分是想要舍弃的部分,rest的名字不重要。这里的行指的是换行符,可以是手动输入的”/n“,更多指的是按enter在文本文件形成的换行符。原创 2024-10-16 00:05:21 · 1089 阅读 · 0 评论 -
利用python进行数据分析(重点、易忘点)---第四章
自然对数e的次方,这里的arr的dtype应为float,下面的sqrt也是,不然会报错# 开方# 求两组相同结构array最大值(x、y多维的也行,也能直接用大于小于号比较得到相同结构的布尔值)# 分开整数部分和小数部分# 把开方后的结果赋给arr,exp等其他函数也可以。原创 2024-10-17 22:15:43 · 1101 阅读 · 0 评论
分享