Jupyter notebook 读取文件的问题

本文介绍了如何在Jupyter Notebook中导入不同大小的数据集。对于小文件,可以直接上传并通过pd.read_csv读取;对于大文件,则需将数据集拷贝到Jupyter Notebook的目录下,若不清楚默认目录,可通过链接修改。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Jupyter notebook只能打开当前目录下的数据集(txt、CSV等),所以需要把数据集倒导入到当前目录下,导入的方法是

1.文件不大时

 

直接上传文件。pd.read_csv读取.

2.文件较大时

把数据集拷贝到Jupyter notebook的目录下,如果不知道Jupyter notebook的默认目录就修改它的目录,修改方法见 https://www.zhihu.com/question/31600197?sort=created

然后把数据集拷贝到这个目录下就好了。

转载于:https://www.cnblogs.com/2019-02-11/p/10708092.html

### 如何在 Jupyter Notebook读取文件 #### 使用 Pandas 库读取 Excel 文件 为了在 Jupyter Notebook读取 Excel 文件,可以使用 `pandas` 库中的 `pd.read_excel()` 函数。此方法适用于处理 `.xlsx` 或其他 Excel 格式文件。 ```python import pandas as pd df = pd.read_excel('./学生成绩.xlsx') # 读取文件路径[^1] print(df.head()) ``` 这段代码会加载位于当前工作目录下的名为 `学生成绩.xlsx` 的 Excel 文件,并显示前几行数据以便确认内容是否正确加载。 #### 设置默认工作目录以简化文件访问 如果希望每次启动 Jupyter Notebook 都能自动定位到特定的工作目录,则可以通过修改配置来实现这一点: - 打开 Anaconda Prompt 并执行命令 `jupyter notebook --generate-config` 来创建一个新的配置文件。 - 编辑生成的配置文件,取消注释并设置 `c.NotebookApp.notebook_dir` 参数为你想要作为默认打开位置的绝对路径。 - 修改 Jupyter Notebook 快捷方式的目标属性,移除其后的 `%USERPROFILE%/` 字符串部分,从而确保它指向正确的安装位置而不是用户的个人资料夹。 完成上述更改之后重启 Jupyter Notebook 即可生效[^2]。 #### 解决读取带有中文字符名称 CSV 文件时遇到的问题 当尝试从 Jupyter Notebook 加载具有汉字命名的 CSV 数据集时可能会碰到一些挑战。一种解决方案是在调用 `read_csv()` 方法时指定解析器引擎为 Python 版本而非 C 版本(`engine='python'`);然而这样做可能导致性能下降尤其对于大型数据集而言[^3]。 另一种更优的方式可能是调整源文件本身的编码格式至 ANSI 而不是 UTF-8 ,这通常能够解决由于不同操作系统间文本表示差异所引起的兼容性问题[^4]。 最后值得注意的是,在某些情况下即使不做任何额外操作也有可能成功导入这些类型的文件——具体取决于环境配置和个人计算机上的软件版本等因素影响[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值