利用 Jupyter 笔记本进行数据科学工作
1. 引言
Jupyter 笔记本无疑是 Python 科学计算和数据科学项目中最常用的工具之一。接下来,我们将简要探讨 Jupyter 笔记本的基础知识,以及它为何是数据分析的优秀工具,同时还会介绍 PyCharm 对其使用的支持方式。
2. 准备工作
我们将使用相关项目中的 jupyter_notebooks 项目。要使用示例项目,别忘了在虚拟环境中安装 requirements.txt 文件里的依赖项。
3. 传统 Python 脚本示例
在使用 Jupyter 笔记本编写代码之前,先看一个传统 Python 脚本中的基础程序,以便后续更好地体会使用笔记本的优势。以下是 main.py 文件中的代码:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Generate sample data
x = np.random.rand(50,)
y = x * 2 + np.random.normal(0, 0.3, 50)
z = np.random.rand(50,)
df = pd.DataFrame({
'x': x,
'y': y,
'z': z
})
# Compute and show correlation matrix
corr_mat = df.corr()
plt.matshow
Jupyter笔记本与数据科学实践
超级会员免费看
订阅专栏 解锁全文
2422

被折叠的 条评论
为什么被折叠?



