- 博客(12)
- 收藏
- 关注
原创 数据预处理之数据清洗
原始数据一般会十分凌乱。不仅数据结构不满足需要,键值也可能存在错误甚至缺失。此时,数据预处理的重要性就突显出来了。数据预处理是一个产生有效数据的过程,即通过自动化、半自动化、甚至手动操作等手段将原始数据文件或者数据仓库里面的数据,处理成能输入到训练模型中的数据。数据预处理是数据挖掘和模型构建过程中十分重要的步骤。对没有经过预处理的数据进行分析,结果是没有任何意义的。使用没有经过预处理的数据训练模型,最终可能得到错误的结论。因此,在对数据正式分析之前,预处理的工作必不可少。
2025-06-25 16:53:02
1298
原创 数据可视化及初步探索
本文将介绍数据可视化中静态图形的绘制,并学习 Python 中两个十分出色的数据可视化模块 Matplotlib 和 Seaborn。最后,利用所学的可视化知识,对经典数据分析 iris 数据集进行初步的数据探索。
2025-06-22 01:08:57
947
原创 苹果公司股票数据分析预测
本文将介绍如何分析股票历史数据,并实现快速绘图。同时,我们将尝试计算买入和卖出过程中的收益,并标记出涨跌转折点。最后,实验会使用机器学习方法对数据进行建模,并给出股票未来走势的预测结果。
2025-06-19 23:25:51
740
原创 可视化案例:美国人口与种族变迁史
本文通过对美国人口普查局与美国国家卫生统计中心自 1990 以来调查获得的长达 29 年的美国人口和种族数据的分析,研究及可视化了美国在此期间的人口和种族的变迁史。
2025-06-14 17:46:24
861
原创 Linux目录结构及文件基本操作
命令,其主要作用是来更改已有文件的时间戳的(比如,最近访问时间,最近修改时间),但其在不加任何参数的情况下,只指定一个文件名,则可以创建一个指定文件名的空白文件(不会覆盖已有同名文件),当然你也可以同时指定该文件的时间戳,更多关于。经过实操后,你会发现使用这几个命令,默认的终端窗口大小,一屏显示不完文本的内容,得用鼠标拖动滚动条或者滑动滚轮才能继续往下翻页,要是可以直接使用键盘操作翻页就好了,那么你就可以使用下面要介绍的命令。文件,不过我们前面也看到了,这个文件里面一大堆乱糟糟的东西,看起来实在费神啊。
2025-06-10 10:23:53
951
原创 Linux用户及管理权限
所有者权限,这一点相信你应该明白了,至于所属用户组权限,是指你所在的用户组中的所有其它用户对于该文件的权限,比如,你有一个 iPad,那么这个用户组权限就决定了你的兄弟姐妹有没有权限使用它破坏它和占有它。在 Linux 里面每个用户都有一个归属(用户组),用户组简单地理解就是一组用户的集合,它们共享一些资源和权限,同时拥有私有资源,当然一个用户是可以属于多个用户组的,正如你既属于家庭,又属于学校或公司。账户拥有整个系统至高无上的权限(默认密码root,在你安装系统的时候设置),比如新建和添加用户。
2025-06-08 23:37:52
706
原创 LINUX基本操作
在通配符被处理后, Shell 会先完成该命令的重组,然后继续处理重组后的命令,直至执行该命令。通常情况下,man 手册里面的内容都是英文的,这就要求你有一定的英文基础。如果说你在 Linux 命令行中无意输入了一个不知道的命令,或者错误地使用了一个命令,导致在终端里出现了你无法预料的情况,你想要立即停止并恢复到你可控的状态,这时候你就可以使用。旁边,这个技巧给你带来的最大的好处就是当你忘记某个命令的全称时可以只输入它的开头的一部分,然后按下。在 Linux 环境中,如果你遇到困难,可以使用。
2025-06-08 23:29:31
627
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人