小心Jupyter Notebook导入文件的天坑!

本文揭示了在使用Jupyter Notebook时直接拖拽大文件(如数据集)可能导致的数据不完整上传问题。作者通过亲身经历指出,45MB的文件仅成功导入了1000多个样本,远未达到预期的6万个样本。建议对于大型数据集,应避免直接拖拽上传,而采用手动文件夹放置的方式。

我们有时会直接按住鼠标左键拖一个文件到jupyter notebook里,比如这样
在这里插入图片描述
如果文件(数据集)比较大,就会提示这个
在这里插入图片描述
我寻思着这也不是上传到云,不就是本地的文件操作吗,还upload

但是要注意,我今天这样拖一个数据集进去就出问题了

选择ok后,开始“上传”这个文件

结果。。。。后面写代码时反复报错,试了好久才发现,这tm根本没把完整文件导进来啊!!!

45MB的文件,里面应该有6万个样本,结果测试发现才传进来1000多个,就不传了,完了我也不知道是不是完整数据,给我气的

**

所以小伙伴们,以后一些比较大的数据集还是辛苦一下打开文件夹把文件放进去吧

**

一些代码啥的还好,打开还能看到,数据集这个东西就不好说了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值