李沐15实战Kaggle比赛_预测房价——自学笔记

Rrrrrr900

于 2024-03-29 16:39:19 发布

阅读量826

点赞数 18

文章标签：笔记深度学习人工智能 python 线性代数 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Rrrrrr900/article/details/137149941

版权

import hashlib
import os
import tarfile
import zipfile
import requests

#建立字典DATA_HUB
#所有类似的数据集都托管在地址DATA_URL的站点
DATA_HUB=dict()
DATA_URL='http://d2l-data.s3-accelerate.amazonaws.com/'

download函数下载数据集:
1.将数据集缓存在本地目录，并返回下载文件的名称
2.如果缓存目录中存在次数据集文件，并且其sha-1与存储在DATA_HUB中的相匹配，我们将使用缓存文件，避免重复下载。

def download(name, cache_dir=os.path.join('..', 'data')):  #@save
    """下载一个DATA_HUB中的文件，返回本地文件名"""
    assert name in DATA_HUB, f"{
     name} 不存在于 {
     DATA_HUB}"
    url, sha1_hash = DATA_HUB[name]
    os.makedirs(cache_dir, exist_ok=True)
    fname = os.path.join(cache_dir, url.split('/')[-1])
    if os.path.exists(fname):
        sha1 = hashlib.sha1()
        with open(fname, 'rb') as f:
            while True:
                data = f.read(1048576)
                if not data:
                    break
                sha1.update(data)
        if sha1.hexdigest() == sha1_hash:
            return fname  # 命中缓存
    print(f'正在从{
     url}下载{
     fname}...')
    r = requests.get(url, stream=True, verify=True)
    with open(fname, 'wb') as f:
        f.write(r.content)
    return fname

实现两个实用函数：一个将下载并解压缩一个zip或tar文件，另一个是将本书中使用的所有数据集从DATA_HUB下载到缓存目录中。

def download_extract(name, folder=None):  #@save
    """下载并解压zip/tar文件"""
    fname = download(name)
    base_dir = os.path.dirname(fname)
    data_dir, ext = os.path.splitext(fname)
    if ext == '.zip':
        fp = zipfile.ZipFile(fname, 'r')
    elif ext in ('.tar', '.gz'):
        fp = tarfile.open(fname, 'r')
    else:
        assert False, '只有zip/tar文件可以被解压缩'
    fp.extractall(base_dir)
    return os.path.join

最低0.47元/天解锁文章

博客等级

码龄6年

64
原创

834
点赞

450
收藏

0
粉丝

关注

私信

热门文章

最新评论

李沐16神经网络基础——自学笔记
优快云-Ada助手: 恭喜作者发布了第14篇博客！不断学习和分享知识是非常值得赞赏的。建议下一步可以尝试深入探讨一些实际案例，结合自己的理解和经验，给读者更多启发和思考。希望您能继续坚持创作，加油！谦虚谨慎地学习和分享是我们不断成长的不竭动力。
李沐测试15-California房价预测测试
优快云-Ada助手: 恭喜李沐测试15在博客中分享了关于California房价预测的测试内容！持续创作是提升自己技能的不二选择，相信您的努力一定会有所收获。希望在下一篇博客中，可以深入探讨一些实际案例，或者结合更多的数据分析方法，以丰富内容吸引更多读者的关注。期待您的下一篇作品！加油！
李沐14数值稳定性_模型初始化和激活函数——自学笔记
优快云-Ada助手: 恭喜用户在自学笔记中分享了关于李沐14数值稳定性、模型初始化和激活函数的内容。持续创作对于个人学习和分享经验都是非常有益的，希望您能继续坚持下去，为更多人带来知识的启发和帮助。建议您在下一篇博客中可以深入探讨一些实际案例，结合具体的应用场景进行分析，这样可以让读者更加直观地理解相关概念。期待您的更多精彩内容！
李沐15实战Kaggle比赛_预测房价——自学笔记
优快云-Ada助手: 恭喜您发布了第12篇博客！看到您在自学笔记中分享了李沐15实战Kaggle比赛预测房价的经验，让人深感佩服。希望您能继续坚持创作，不断提升自己的技术水平。下一步，可以考虑分享更多具体的数据分析案例，或者挑战更多不同领域的Kaggle比赛，拓展自己的技术视野。期待看到您更多精彩的文章！
李沐06 矩阵计算
优快云-Ada助手: 恭喜用户写了第三篇博客，标题为“李沐06 矩阵计算”！持续创作是提升自己的最好方式，希望用户能够坚持下去，不断分享自己的学习和经验。下一步建议可以尝试写一些实践性更强的文章，比如结合具体案例进行分析和总结，这样能够更好地帮助读者理解和应用知识。期待用户更加优秀的作品！愿用户在创作的路上越走越远！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。