
深度学习
文章平均质量分 95
专注于深度学习的原理、算法和应用实践。从基础知识到最新研究,本专栏为你提供全面的学习资源和实践案例,帮助你深入理解并应用深度学习技术。
是Yu欸
这里是我读博期间的笔记本,记录学习和成长,争取顺利毕业ing
展开
-
【报错】解决 RuntimeError: CUDA error: CUBLAS_STATUS_INVALID_VALUE 报错问题
本次问题的解决过程可供遇到类似问题的开发者参考,特别是在远程服务器上运行 PyTorch 代码时出现。此外,该代码在 Pycharm 中可以完美运行,但在 MobaXterm SSH 远程连接时会报错。然而,在本次运行中,我确认 Tensor 尺寸是正确的。是一个环境变量,用于指定共享库文件(也称为动态链接库)的搜索路径。后,系统将只使用默认的共享库搜索路径,从而避免由于错误的。在多用户使用的服务器上,导致的环境变量的冲突和不匹配问题,这个函数处,查阅中文论坛后发现,许多类似的错误是由于。原创 2025-02-13 15:43:03 · 531 阅读 · 3 评论 -
【代码优化】model.cuda() ,让模型快速起飞
是 PyTorch 中连接模型与 GPU 的关键接口。它使得模型可以利用 GPU 的强大计算能力,从而大幅提升训练和推理速度。为了充分发挥 GPU 的性能,请确保输入数据和模型都位于 GPU 上,同时合理使用多 GPU 和显存优化技术。如果在使用中遇到任何问题,欢迎留言讨论!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-27 10:59:07 · 1217 阅读 · 0 评论 -
【深度学习代码调试5】标准化数据集:TensorFlow Datasets (TFDS)自动化数据加载与预处理
是一个为机器学习模型提供标准化数据集的库。它不仅支持 TensorFlow,也可以与其他框架(例如 PyTorch)一起使用。TFDS 提供了一个一致的 API 来访问广泛的标准数据集,同时支持自动下载、预处理和缓存。TFDS 的核心目标是减少数据集准备的繁琐操作,帮助用户专注于模型开发,而不是数据处理。无论是图像、文本、时间序列还是其他类型的数据,TFDS 都可以帮助快速加载和处理。extract_dir='/tmp/tfds_extract', # 数据解压路径。原创 2024-10-24 10:29:52 · 1520 阅读 · 0 评论 -
【深度学习代码调试2】环境配置篇(中) -- 列出conda环境中所有env的pytorch版本
通过上述步骤,您可以手动或自动检查所有 Conda 环境中的 PyTorch 版本,特别是能够重点标注的环境。这对于管理多个虚拟环境并确保某些关键版本的依赖性非常有帮助。版权声明:本文为原创,遵循协议。转载请注明出处。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:45 · 1667 阅读 · 0 评论 -
【深度学习代码调试1】环境配置篇(上) -- 安装PyTorch(安利方法:移除所有国内源,使用默认源)
如果之前添加了非官方源(如清华大学镜像源),可能会导致安装冲突或失败。这将从Conda配置中移除所有自定义的频道设置,使Conda恢复为默认配置。安装深度学习框架时,常常会遇到版本不兼容、依赖库冲突等问题。通过合理选择安装源、升级相关库,通常可以解决大部分问题。希望本文的记录能帮助大家顺利完成环境配置,并避免常见的坑。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:19 · 1767 阅读 · 0 评论 -
【深度学习代码调试5】任务执行后日志log只有一行,同时没有报错,没有有效提示:解决命令行 Output 目录参数设置问题
遇到日志问题时,优先检查输出目录的状态。合理管理文件输出路径,可以避免系统跳过关键步骤,确保任务正常运行。希望这篇博客能帮助你快速定位并解决类似的命令行问题。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-15 14:38:53 · 909 阅读 · 1 评论 -
【服务器】在Linux查看运行的Python程序,并找到特定的Python程序
在Linux环境下,有时候需要查看当前运行的Python程序,并根据特定的参数或详细信息找到目标程序。这篇博客将介绍几种方法,帮助你快速定位和分析正在运行的Python程序。原创 2024-07-10 19:47:07 · 7782 阅读 · 49 评论 -
【深度学习】单机多卡 | DataParallel将计算任务在多个 GPU 上并行执行,可以在多个 GPU 上分摊工作负载,从而加快训练速度
它在单机多卡环境中非常有用,可以在多个 GPU 上分摊工作负载,从而加快训练速度。PyTorch 中的一个工具,可以让模型在多个 GPU 上并行运行。它通过将输入批次拆分成多个子批次,每个子批次发送到不同的 GPU 上,并行执行前向传播和反向传播,然后将每个 GPU 上的梯度聚合到主 GPU 上进行参数更新。原创 2024-06-28 22:56:55 · 1986 阅读 · 4 评论 -
【深度学习】服务器炼丹代码配置、Python使用指定gpu显卡运行代码
在大型机构分配的服务器集群中,需要使用GPU的程序默认都会在第一张卡上进行,如果第一张卡倍别人占用或者显存不够的情况下,程序就会报错说没有显存容量,所以能够合理地利用GPU资源能帮助你更快更好地跑出实验效果。本篇博客将介绍在服务器上进行深度学习炼丹(即训练模型)时如何配置代码,以及如何在Python中指定特定的GPU显卡来运行代码。原创 2024-06-28 22:45:22 · 1851 阅读 · 0 评论 -
【数据集划分】oracle数据集划分(总结版)
假如你有超百万条oracle数据库数据,那么一直使用的代码:`train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42)`,很可能1h还没划分完数据。最终解决方案:生成一列随机数,然后随机打乱。取前70%的样本划分为训练集,70%到90%之间的样本划分为测试集,剩余的样本划分为验证集。原创 2024-06-06 18:07:31 · 3470 阅读 · 92 评论 -
【香橙派 AIpro 开发板】AI 应用部署测评:视频目标检测+Linux镜像+vscode远程连接+全细节试用
在人工智能和物联网技术日益成熟的今天,边缘计算设备因其在数据处理和实时性方面的优势而受到广泛关注。香橙派 AIpro(OrangePi AIpro)开发板以其出色的性能和丰富的应用场景,成为开发者探索 AI 应用部署的理想选择。有幸获得了邀请,并有幸邀请到了闪电[@shandainchengzi](https://shandianchengzi.blog.youkuaiyun.com/?type=blog),和我一起对这款备受瞩目的开发板进行一次体验测评。下面将从新手个人开发经验出发,对香橙派 AIpro 开发板进原创 2024-05-30 17:34:45 · 5206 阅读 · 182 评论 -
【Paddle】稀疏计算的使用指南 & 稀疏ResNet的学习心得 (2) + Paddle3D应用实例稀疏 ResNet代码解读 (1.6w字超详细)
稀疏格式是一种特殊的数据存储方式,旨在有效存储和处理其中大部分元素为零的矩阵或张量。这种方法可以显著减少存储空间的需求,并提高数据处理的效率。常见的稀疏格式包括 COO(坐标列表格式)、CSR(压缩稀疏行格式)等。conv3x3和conv1x1是用于创建3D稀疏卷积层的帮助函数,它们使用了PaddlePaddle的SubmConv3D,这是一种专门处理稀疏数据的3D卷积。原创 2024-05-29 14:06:52 · 5681 阅读 · 171 评论 -
【Paddle】Inplace相关问题:反向传播、影响内存使用和性能
`inplace` 参数在许多编程语言和库中用来指示一个操作是否应该直接修改输入的数据,而不是创建一个新的数据副本。这个参数常见于 Python 的库,如 Pandas 和 PyTorch,其中可以通过 `inplace=True` 直接修改原始数据。关于 `inplace` 是否能降低计算复杂度,答案是:不直接影响计算复杂度(Big O notation),但它可以影响内存使用和性能。原创 2024-05-29 13:16:17 · 2077 阅读 · 4 评论 -
快速入门深度学习9.1(用时20min)——GRU
8节 和 9节 中,循环神经网络(recurrent neural network,`RNN`),这是⼀种利用数据中的`时间或序列结构`的模型,通常用于自然语言处理和时间序列预测。10节 中,`注意力机制`的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将 帮助读者快速了解大多数现代深度学习应用背后的基本工具。原创 2024-04-14 22:23:49 · 1139 阅读 · 4 评论 -
【ACL 2023获奖论文】再现奖:Do CoNLL-2003 Named Entity Taggers Still Work Well in 2023?
该研究提供了对NER模型泛化能力深入的理解,特别是在长时间跨度下的性能变化。通过创建CoNLL++测试集和对多个模型的评估,揭示了时间漂移对模型性能的影响及其与过拟合无关。此外,研究还强调了模型架构、参数规模、预训练数据的时效性和微调数据量在模型泛化中的重要性。这些发现不仅为未来NER模型的开发提供了宝贵的见解,也对如何评估模型在面对新兴数据时的适应性提供了新的视角。原创 2024-03-19 15:27:58 · 10104 阅读 · 4 评论 -
【相关问题解答2】bert中文文本摘要代码:结果输出为一些重复的标点符号和数字
感谢大家的支持和关注。最近好多人咨询之前博客【bert中文文本摘要代码】的相关代码报错问题,由于报错有一定的相似性,因此这里统一进行答复原创 2024-03-13 16:00:34 · 6675 阅读 · 20 评论 -
【相关问题解答1】bert中文文本摘要代码:import时无法找到包时,几个潜在的原因和解决方法
感谢大家的支持和关注。最近好多人咨询之前博客【bert中文文本摘要代码】的相关代码报错问题,由于报错有一定的相似性,因此这里统一进行答复原创 2024-03-13 15:56:39 · 6725 阅读 · 15 评论 -
一文综述:自然语言处理技术NLP
Preprocessing预处理Tokenization令牌化、标记化Stop Words 停用词Stemming and Lemmatization词干提取和词形还原(英文单词)Parts-of-Speech Tagging词性标记Bag of Words and N-Grams词袋模型、N元模型Term Frequency–Inverse Document Frequency(TF-IDF)Negation Detection否定检测WORD EMBEDDINGS文本嵌入Word2ve原创 2023-04-23 11:31:06 · 6383 阅读 · 1 评论 -
【文本摘要(3)】Pytorch之Seq2seq: attention
本文承接【文本摘要(2)】pytorch之Seq2Seqhttps://blog.youkuaiyun.com/WTYuong/article/details/129683262本代码已跑通,若有问题欢迎留言,一起交流探讨如有理解不对的地方,还请过路的大佬们指点一二原创 2023-04-04 16:16:20 · 5730 阅读 · 3 评论 -
【文本摘要(2)】pytorch之Seq2Seq
本代码已跑通,若有问题欢迎留言,一起交流探讨注释部分结合之前改废的代码加的,方便自己理解如有理解不对的地方,还请过路的大佬们指点一二原创 2023-04-04 10:53:03 · 6367 阅读 · 8 评论 -
【文本摘要(1)】抽取式之textrank(无监督学习):生成200字以内摘要
将每个句子看成图中的一个节点,若两个句子之间有相似性,认为对应的两个节点之间有一个无向有权边,权值是相似度。通过pagerank 算法计算得到的重要性最高的若干句子可以当作摘要。论文中使用下面的公式计算两个句子 Si 和 Sj 的相似度:分子是在两个句子中都出现的单词的数量。|Si | 是句子 i 的单词数。原创 2023-04-03 16:51:02 · 6068 阅读 · 0 评论 -
大概率(5重方法)解决RuntimeError: CUDA out of memory. Tried to allocate ... MiB
主机中的内存,有两种存在方式,一是锁页,二是不锁页,锁页内存存放的内容在任何情况下都不会与主机的虚拟内存进行交换(注:虚拟内存就是硬盘),而不锁页内存在主机内存不足时,数据会存放在虚拟内存中。显卡中的显存全部是锁页内存,当计算机的内存充足的时候,可以设置pin_memory=True。pin_memory就是锁页内存,创建DataLoader时,设置pin_memory=True,则意味着生成的Tensor数据最开始是属于内存中的锁页内存,这样将内存的Tensor转义到GPU的显存就会更快一些。原创 2023-03-24 15:47:16 · 24352 阅读 · 1 评论 -
完全小白的pycharm深度学习调试+for循环断点条件设置
仅对常用的展开说明,其他的可通过鼠标悬停查看一般操作步骤就是:设置好断点,debug运行,然后 F8单步调试,遇到想进入的函数 F7 进去,想出来在 shift + F8,跳过不想看的地方,直接设置下一个断点,然后 F9 过去。step over(F8快捷键):在单步执行时,在函数内遇到子函数时不会进入子函数内单步执行,而是将子函数整个执行完再停止,也就是把子函数整个作为一步。在不存在子函数的情况下是和step into效果一样的。原创 2023-03-21 15:51:37 · 8545 阅读 · 0 评论 -
快速入门深度学习2(用时1h)——数据操作
快速介绍实践深度学习所需的前提条件,例如如何`存储和处理数据`,以及如何应用基于线性代数、微积分和概率基本概念的各种数值运算。原创 2023-03-14 17:31:54 · 5498 阅读 · 0 评论 -
快速入门深度学习4.1(用时1h)——多层感知器
涵盖了深度学习的最基本概念和技术,例如`线性回归、多层感知机和正则化`原创 2023-03-14 17:31:24 · 5941 阅读 · 0 评论 -
快速入门深度学习1(用时1h)——MXNet版本
问题:判断图片是否有猫简化:① 假设所有图像的高和宽都是同样的400像素大小,一个像素由红绿蓝三个值构成,那么一张图像就由近50万个数值表示。② 哪些数值隐藏着我们需要的信息呢?是所有数值的平均数,还是四个角的数值,抑或是图像中的某一个特别的点?③ 事实上,要想解读图像中的内容,需要寻找仅仅在结合成千上万的数值时才会出现的特征,如边缘、质地、形状、眼睛、鼻子等,最终才能判断图像中是否有猫。原创 2023-03-09 17:39:17 · 6376 阅读 · 0 评论 -
base model初始化large model,造成的参数矩阵对不上权重不匹配问题+修改预训练权重形状和上采样
在https://huggingface.co/搜索下载后,载入预训练模型时Pytorch遇到权重不匹配的问题。arg.那个值,可能用base model初始化了一个large model,所以参数矩阵对不上。下载的是large model ,但初始化用的是base model。排除以上两个原因后,尝试删除.pkl缓存文件,重新生成.pkl文件。1、现为CPU,但加载了原先GPU训练的pkl。解决方案2:pytorch model文件大了。首先排除代码因素,然后查看gpu状态。原创 2023-03-02 14:34:05 · 6740 阅读 · 0 评论 -
服务器中的conda环境
最近经常用服务器的conda,总结一下命令方便调用最简单方法, pip安装之后, 点击右下角状态栏里的python解释器, 重新点击当前的python解释器,这时候会触发重建索引即index, 远程的包会下载到本地。原创 2022-12-09 14:24:59 · 6938 阅读 · 0 评论 -
【pycharm】在本地利用远程服务器显卡跑代码
Pycharm2021.1连接远程服务器原创 2022-12-03 12:59:51 · 9054 阅读 · 4 评论