面朝大海,春不暖,花不开
失败是成功之母
展开
-
如何在Ubuntu 22.04上安装NVIDIA驱动:自动安装与手动安装的全面指南
在现代计算环境中,NVIDIA显卡因其卓越的图形处理能力和对深度学习、科学计算等高性能任务的支持而备受青睐。然而,在Linux系统(如Ubuntu)上正确安装和配置NVIDIA驱动是充分发挥GPU性能的关键步骤。无论选择哪种方式,掌握基本的Linux操作技能和问题排查方法都是至关重要的。无论是通过系统包管理工具自动安装,还是从NVIDIA官网手动下载并安装驱动程序,每种方式都有其独特的优势和局限性。首先,确认你的显卡型号以及系统推荐的驱动版本。,并分析它们的优缺点,帮助你根据需求选择最适合的方式。原创 2025-02-20 14:11:18 · 703 阅读 · 0 评论 -
RAG:赋予语言模型“搜索”能力,让知识触手可及
这样,LLM就可以基于检索到的最新知识或领域知识来生成更准确、更可靠的答案,从而突破自身知识的限制。虽然RAG技术仍处于快速发展阶段,面临着一些挑战,但随着研究的深入和技术的进步,相信RAG将在未来的人工智能领域扮演越来越重要的角色,成为构建更智能、更可靠的语言模型应用的关键技术。LLMs的知识来源于其训练数据,对于训练数据之外的新知识或者特定领域知识,LLMs往往束手无策,容易产生“一本正经地胡说八道”的情况。希望这篇文章能够帮助您对RAG技术有一个初步的了解,并激发您进一步学习和探索的兴趣。原创 2025-02-19 13:30:24 · 191 阅读 · 0 评论 -
FastAPI:现代 Python Web 开发的闪电利器
FastAPI 会自动解析依赖关系,并在调用路径操作函数之前,先调用依赖项函数,并将依赖项函数的返回值注入到路径操作函数中。它以其高性能、易学性、强大的功能和出色的开发者体验,迅速成为了构建API和Web应用的理想选择。恭喜你,通过本文的学习,你已经掌握了 FastAPI 的基本概念和核心特性,并能够构建简单的 FastAPI 应用。我们将从FastAPI的基本概念入手,逐步深入到其核心特性和高级功能,并通过丰富的代码示例,帮助您快速掌握FastAPI,并将其应用于实际项目中。原创 2025-02-18 13:01:53 · 384 阅读 · 0 评论 -
深入理解大语言模型的文本数据处理流程
标记化:将文本切分为更小的单位。标记ID映射:将每个标记转换为唯一的整数ID。词嵌入:将标记ID映射为向量表示。特殊标记:引入特殊标记来处理特殊情况。字节对编码(BPE):通过将单词拆分为子单元处理词汇外的单词。数据采样:通过滑动窗口生成输入-输出对。嵌入层:将标记ID转换为嵌入向量供神经网络使用。位置嵌入:为模型注入位置信息,帮助模型理解顺序。通过这些步骤,我们能够将原始文本转化为神经网络能够理解和处理的数字表示。这为后续的模型训练奠定了基础,确保了模型能够学习到有效的语言表示。原创 2025-02-17 17:08:35 · 447 阅读 · 0 评论 -
深度学习入门指南:从零理解Transformer模型到实践进阶
当我们将Transformer模型的注意力机制与人类认知过程类比,会发现深度学习的本质是建立对世界的分布式表征。这种技术与人性的共鸣,正是其强大生命力的源泉。建议初学者从今天开始:立即动手运行第一个"Hello World"深度学习程序在GitHub上fork一个感兴趣的项目加入技术社区参与讨论建立每周学习复盘机制记住,在这个快速演进的时代,重要的不是你现在掌握了多少知识,而是构建起持续进化的学习能力。原创 2025-02-16 07:50:09 · 41 阅读 · 0 评论 -
PyTorch张量基础操作与数据表示完全指南
张量(Tensor)是PyTorch中最核心的数据结构,可以理解为多维数组的扩展:0维张量:标量(Scalar)1维张量:向量(Vector)2维张量:矩阵(Matrix)3维张量:时间序列数据4维张量:图像数据(批量大小×通道×高×宽)5维张量:视频数据# 维度不匹配try:c = a + bprint("维度错误:", e)# 原地操作问题b = a.add_(1) # 原地操作会影响梯度计算。原创 2025-02-15 10:55:55 · 170 阅读 · 0 评论 -
图片旋转方向分类:从零开始构建深度学习模型
在计算机视觉领域,图片方向分类是一项常见的任务,尤其是在文档扫描、图像预处理和 OCR 系统中。本文将详细介绍如何使用深度学习技术构建一个高效的图片旋转方向分类模型,涵盖数据准备、模型设计、训练过程、超参数调试以及部署等关键步骤。为了训练一个可靠的旋转方向分类模型,我们需要准备包含 0°、90°、180° 和 270° 四种旋转方向的图片数据集。我们选择了经典的卷积神经网络(CNN)架构 VGG11 作为基础模型,并对其进行了微调以适应旋转方向分类任务。数据增强是提升模型泛化能力的重要手段。原创 2025-02-14 09:49:07 · 701 阅读 · 0 评论 -
基于PaddleHub Serving的服务部署
hubserving服务部署目录下包括文本检测、文本方向分类,文本识别、文本检测+文本方向分类+文本识别3阶段串联,版面分析、表格识别和PP-Structure七种服务包,请根据需求选择相应的服务包进行安装和启动。目录结构如下:本文只针对文本检测模块和文本识别模块进行讲解,会使用其串联服务ocr_system进行处理!以上七种服务中,都包含以下三个文件,如下所示:因此,在我们进行下一步之前,需要进行配置修改。原创 2025-02-11 14:20:00 · 633 阅读 · 0 评论 -
深度学习:未来已来,不要再错过这场AI革命
深度学习是人工智能领域的一个重要分支,它模仿人类大脑的结构和功能,通过复杂的神经网络来处理和分析数据。让我们从基础开始,了解这个迷人的技术。什么是深度学习?深度学习是一种特殊的机器学习方法,它使用多层神经网络来处理数据。就像人类的大脑由多个神经元层组成一样,深度学习模型也通过多层结构来逐步提取和处理信息。原创 2025-02-10 16:41:25 · 28 阅读 · 0 评论 -
在模型训练中接入 Comet:以 PaddleOCR 为例
Comet是一个用于机器学习实验管理和可视化的平台。实验跟踪:自动记录模型的超参数、指标、日志等信息。可视化:提供直观的图表和仪表盘,方便分析实验结果。协作与分享:支持团队协作和实验结果的共享。通过 Comet,你可以轻松地管理和对比多个实验,从而找到最佳的模型配置。为了更精细地记录训练过程中的指标(如每个 epoch 的损失值和准确率),可以自定义一个回调函数,并将其集成到 PaddleOCR 的训练流程中。# 记录每个 epoch 的指标# 在训练过程中使用回调函数。原创 2025-02-10 16:15:52 · 309 阅读 · 0 评论