数据处理和统计分析
文章平均质量分 95
在Python数据分析的世界里,Pandas、Numpy、Matplotlib、Scikit-learn等库是必备利器。本专栏以实战案例为引,带你从基础到进阶,掌握数据清洗、计算、可视化与建模技巧,无论是新手入门,还是老手精进,都能有所收获。
阳光开朗大男孩(๑•̀ㅂ•́)و✧
C++博主太难混了,转行做AI博主. Hi~ o(* ̄▽ ̄*)ブ
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Pandas篇】纵横数据江湖:Pandas核心秘籍全解
本文系统拆解Pandas数据处理九大核心:从DataFrame/Series数据结构筑基,到索引操控、缺失值清洗的实战技法;详解数据合并、分组聚合高阶策略,结合链家房价分析、泰坦尼克生存预测双案例,演绎apply函数与时间序列的化形之术。附赠Pandas性能调优心法,助你5分钟突破数据清洗、转换、分析全链路瓶颈,打造结构化数据处理的「人剑合一」境界。文末开放论剑区,诚邀共探数据江湖疑难!原创 2025-05-26 22:43:36 · 1199 阅读 · 3 评论 -
【Numpy篇】数据乾坤:用Numpy三十六计玩转科学计算江湖
本文系统解析Python核心库Numpy的高维数据操控之道,直击传统列表在存储与计算中的性能瓶颈。通过掌握ndarray的多维结构(shape/ndim/dtype)、矩阵生成术(zeros/arange/随机矩阵)和向量化运算(广播机制/矩阵乘法),开发者可轻松实现千倍性能飞跃。内容涵盖数据创建、类型转换、统计函数、排序去重等实战技巧,特别针对图像处理、机器学习场景,揭秘内存连续存储优化与C语言级运算加速的底层逻辑,助你从“数据搬运工”蜕变为“高维空间架构师”。原创 2025-05-23 18:09:58 · 1367 阅读 · 3 评论 -
Pandas 墨韵:DataFrame 绘就数据丹青
本文聚焦 Pandas 数据分析核心功能,详解 DataFrame 文件读写(如 CSV、Excel、Pickle 格式)、数据探索(行列筛选、类型查看)、分组聚合计算(groupby 语法与实战)及排序方法。结合链家租房数据案例,演示从数据加载、清洗到业务指标计算(如租金分布、房型偏好)的全流程,助力初学者与开发者快速掌握 Pandas 数据处理关键技术,实现从基础操作到实战分析的能力提升。原创 2025-05-04 00:50:37 · 701 阅读 · 0 评论 -
维度的语法:从列表的散文到 ndarray 的十四行诗
本文聚焦 Numpy,对比 Python 列表,其数组可存多维数据,计算速度快 100 - 1000 倍,内存省 50% 以上。解析 ndarray 核心属性,如 shape、ndim 等。介绍 7 大创建场景,含列表转换、zeros/ones/empty 初始化、随机数生成等。提及内置函数(基本、统计等)与运算(基本、矩阵),展现其高效数据处理能力。原创 2025-04-28 17:03:50 · 1182 阅读 · 1 评论 -
5 分钟搭建你的「数字实验室」:Anaconda+Jupyter 入门全攻略
本文介绍数据科学工具 Anaconda 及 Jupyter Notebook:Anaconda 内置 Jupyter 等工具,预装 150 + 库(如 NumPy),3 步完成可视化环境安装。终端运行 “jupyter notebook” 启动,未打开则复制链接。基础操作:新建英文文件夹、创建并重命名.ipynb 文件,代码支持快捷键运行;进阶技巧:ESC/Enter 双模式,常用快捷键(插入 A/B、删除 DD、保存 Ctrl/Cmd+S),Markdown 美化标题、列表、公式。原创 2025-04-28 13:25:03 · 1592 阅读 · 1 评论 -
驯龙日记:用Pandas驾驭数据的野性
引言:为什么选择Pandas?(NumPy):精密的数值计算(Pandas):处理现实数据的全套工具。原创 2025-04-27 23:06:20 · 1022 阅读 · 0 评论 -
解构数据的七十二变:Pandas 的 Series 与 DataFrame 织梦术
本文深度解析Python数据分析库Pandas的技术突破与商业实践,通过对比NumPy揭示其双索引定位(效率+300%)、智能类型推断、自动对齐(错误率-80%)三大革新特性。以电影数据为脉络,系统拆解Series/DataFrame的6种构建方法与15+核心操作,覆盖数据清洗、向量化运算、元数据管理等全流程实战,结合导演作品分析、演员影响力评估等场景实现数据价值转化,并提供即用代码模板与官方进阶路径,构建从基础操作到商业决策的完整能力链路。。原创 2025-04-26 23:57:02 · 1876 阅读 · 2 评论 -
Jupyter 中 Markdown 邂逅 LaTeX:一场知识的绮梦
本文聚焦 Jupyter Notebook 中 Markdown 与 LaTeX 结合的技术写作应用。先点明对于数据科学家等群体,优质文档呈现的重要性,引出二者作用。接着详细介绍 Markdown 基础语法,涵盖标题层级、文本样式、换行、列表、链接与图片、引用、代码块等规范。随后阐述 LaTeX 在数学公式方面的规范,包括基本运算符、上下标、求和与根式、分式等。掌握这些技能,能显著提升实验报告、技术文档、学术论文等成果的表现力,助力专业内容以更专业方式呈现。原创 2025-04-17 12:01:52 · 1123 阅读 · 0 评论 -
于 Jupyter 天地,借 NumPy 之手编织数据锦缎
本文聚焦 Python 中 NumPy 库基础操作。先以import numpy as np导入库,随即创建包含特定元素的arr1、全 1 的arr2与全 0 的arr3,并合并为arr4。对arr1排序后,用正负索引打印其第三个元素、进行切片。实现arr1与arr2对应元素相加、arr1元素乘 - 5 运算,输出arr1的最值、和、均值,筛选出arr1里小于 1 或大于 3 的数字 。原创 2025-04-17 11:59:00 · 1250 阅读 · 0 评论
分享