
人工智能学习笔记
文章平均质量分 87
介绍人工智能相关的知识 新技术和新发现等
优惠券已抵扣
余额抵扣
还需支付
¥199.90
¥299.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
空间机器人
不会的东西越来越多,我该怎么办。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从零开始构建大语言模型(LLM)全解析(四)
自注意力机制让模型能够灵活地捕捉输入序列中的各个部分之间的关系,而不依赖于顺序信息。前馈网络进一步优化了自注意力机制输出的表示,使模型能更好地处理复杂的上下文信息。并行计算提高了效率,大大加速了训练和推理过程。全局上下文让模型能够捕捉更长程的依赖关系,比传统模型更为强大。通过这种机制,Transformer 成为了自然语言处理领域中不可或缺的工具,并且在多项任务中都取得了突破性的成绩。想要进一步学习 Transformer 的细节,记得多实践,理解每一层的作用,掌握其中的微妙之处。原创 2025-04-05 10:36:00 · 31 阅读 · 0 评论 -
从零开始构建大语言模型(LLM)全解析(三)
仅编码器架构🧠 适合任务如文本分类(例如 BERT)。仅解码器架构🔮 适合任务如文本生成(例如 GPT)。编码器-解码器架构🔄 适合任务如机器翻译(例如 T5)。每种架构在不同的任务中都有着独特的优势和应用场景,选择合适的架构能大大提升模型的表现。原创 2025-04-05 10:35:49 · 29 阅读 · 0 评论 -
从零开始构建大语言模型(LLM)全解析(五)
✅防未来信息泄露✅输入输出强交互✅结构清晰,支持并行:每个 token 互不影响,可批处理训练。✅长文本处理能力强:自注意力能直接跳跃远距离依赖。✅输出控制自由:可以自定义起始 token,灵活生成。如果你想掌握 Transformer 解码器,强烈建议你亲自实现一个小型版本,用 PyTorch 或 TensorFlow 手撸一遍。只有“写”过,才真的“懂”。原创 2025-04-06 08:33:55 · 20 阅读 · 0 评论 -
机器学习从连续数据到二元分类:引入逻辑回归
逻辑回归的强大之处在于,它利用了线性回归的思想,但通过引入 Sigmoid函数对输出进行限制,将连续的结果转化为概率,解决了二元分类的问题。这使得逻辑回归不仅仅是一个理论工具,更是实际应用中非常有效的分类算法。通过优化模型参数,我们能够在各种实际问题中完成精准的二元分类。原创 2025-04-06 08:35:01 · 36 阅读 · 0 评论 -
LangGraph + MCP + Ollama: 打造强大的多智能体聊天机器人
在当今的人工智能领域,开发人员总是不断寻求提高效率和智能化的途径。今天,我要分享一个关于和的强大组合,这些工具帮助你创建出具备智能代理(Agentic)特性的多智能体聊天机器人,能让你更好地应对个人和商业需求。原创 2025-04-05 10:36:56 · 229 阅读 · 0 评论 -
【工程师一次性讲明白】终于将卷积神经网络(CNN)原理搞懂了
普通的神经网络(全连接网络 MLP)处理图片的时候,直接把所有像素“摊平”成一个超长的向量,然后喂给神经网络。假设你要找一只猫的眼睛👀,你不会把整张图片都扫一遍,而是只看那些“像是眼睛”的区域。📢 **赶快自己写个代码训练一下,试试 CNN 的神奇魔法吧!(就是用一个小的滤波器,在图片上滑动,每次都计算一个加权求和):CNN 通过不同的卷积核,可以学到不同层次的特征!🔥 **搞懂 CNN,你就掌握了深度学习的核心!:减少数据量,提高计算效率,同时保留主要信息!,来拆解 CNN 的核心概念,并通过。原创 2025-04-05 10:36:37 · 37 阅读 · 0 评论 -
什么是视觉-语言模型(VLMs)
视觉-语言模型(VLMs)是结合图像和文本的AI模型,它们不仅可以理解图片中的内容,还能根据文本描述图像,或者反过来根据图像生成文本。想象一下,这些模型就像是图像和文字的双语翻译官,能够在这两种“语言”之间来回转换。视觉-语言模型正在逐步改变我们与AI互动的方式,给我们带来更加智能、富有创意的应用。从内容生成到自动驾驶,VLMs的潜力几乎无处不在。随着技术不断进步,我们未来的世界将更加智能、便捷!VLMs的关键技术符号🌐 跨模态学习:图像和文字之间的深度学习联系。🧠 对比学习:让图像和文字相互理解。原创 2025-04-04 10:50:24 · 33 阅读 · 0 评论 -
2.4深度学习—— 小批量样本的矢量化&损失函数
唯一的区别是,我们现在用一个概率向量表示,如(0.1, 0.2, 0.7),而不是仅包含二元项的向量(0, 0, 1)。因此,如果正确地预测实际标签,即,如果实际标签 P(y | x) = 1,则损失函数不能进一步最小化。假设我们读取了一个批量的样本 X,其中特征维度(输入数量)为 d,批量大小为 n。换句话说,导数是我们模型分配的概率(由softmax得到)与实际发生的情况(由独热标签向量表示)之间的差异。这不是巧合,在任何指数族分布(参见关于分布的在线附录45)模型中,对数似然的梯度正是由这给出的。原创 2025-03-22 10:10:17 · 27 阅读 · 0 评论 -
2.2深度学习——训练过程的实现和单元总结
我们通过计算真实参数和训练得到的参数之间的误差来评估模型的学习效果。由于我们使用的是合成数据,我们知道真实的 (w) 和 (b) 的值。因此,可以通过比较训练得到的值和真实值的差异来验证训练是否成功。在这部分中,我们通过逐步实现训练过程来训练我们的线性回归模型。这是深度学习中最基础、最常见的训练过程之一。这些练习会加深你对训练流程的理解,并帮助你在实践中更好地掌握这些技术。随着训练的进行,损失值逐渐降低,表明模型逐步学习到了正确的参数。这表明模型通过训练学到的参数与真实参数非常接近,说明训练成功。原创 2025-02-03 10:58:00 · 591 阅读 · 0 评论 -
2.2深度学习——定义损失函数&定义优化算法
首先,我们定义了一个线性回归模型。线性回归模型的输出可以通过特征矩阵 (X) 和权重向量 (w) 的矩阵-向量乘法得到,再加上一个偏置 (b) 得到。"""线性回归模型。"""X:输入特征(通常是训练数据的特征矩阵)。w:模型的权重。b:偏置项。这个模型非常简单,它的工作原理就是将输入的特征 (X) 和权重 (w) 进行线性组合(矩阵乘法),然后加上偏置 (b)。接下来,我们需要定义损失函数。在这里我们使用的是均方误差(MSE)损失函数,它可以衡量模型预测与实际目标值之间的差距。"""均方损失。原创 2025-02-03 10:57:54 · 368 阅读 · 0 评论 -
2.4深度学习——独热编码的使用&软max回归
在软max回归(Softmax Regression)中,我们要处理的是分类问题。在此问题中,每个输入(例如图像)对应一个标签,而标签通常使用(One-Hot Encoding)进行表示,确保每个类别都有明确的标识,并且类别间没有大小关系。原创 2025-02-25 21:43:55 · 471 阅读 · 0 评论 -
2.3深度学习——回归的简捷实现
通过使用深度学习框架的高层API,我们能够简化数据集生成、数据加载和迭代的过程。这使得我们能够专注于模型的构建和训练,而不需要担心底层的细节。接下来,我们可以使用这些数据进行模型训练,并利用更高效的方式来更新和优化参数。通过现代的高层API,我们可以自动化许多重复性工作,从而更快速和方便地实现复杂的机器学习任务。这不需要我们手动实现数据迭代器。,我们可以轻松地创建一个可迭代的数据加载器对象。为了简化数据加载和处理过程,我们可以直接调用。中的数据集是一样的。提供的库来创建样本数据。首先,我们生成的数据集和。原创 2025-02-05 11:31:21 · 406 阅读 · 0 评论 -
2.3深度学习——定义损失函数&定义优先算法&模型参数与真实值对比
在Gluon中,损失函数通过loss模块提供。在这个例子中,我们使用的是L2损失(也叫均方误差(MSE)),它衡量的是模型预测值与真实标签之间的差异。L2Loss:计算预测值和真实值之间的平方差并返回该值作为损失。适用于回归任务,尤其是线性回归模型中。优化算法是训练模型的关键部分,负责调整模型参数,使得损失函数的值最小化。小批量随机梯度下降SGD)是最常用的优化方法之一,Gluon提供了Trainer类来处理不同的优化算法及其超参数。在实例化 Trainer模型参数:通过获取。优化算法。原创 2025-02-25 21:43:46 · 925 阅读 · 0 评论 -
简单聊聊机器学习12大经典算法学习笔记
想象你是一个商场的经理,你想把顾客分成不同的群体(例如:高收入群体、低收入群体),K均值就能帮你把顾客划分成若干个簇。假设你是一名天气预报员,你想预测未来的天气状态(如:晴天、雨天等),HMM可以基于历史数据推测出最可能的天气状态。假设你是餐厅老板,想知道是否应该给客人提供优惠券,决策树会根据“天气”,“客人到达时间”等特征,帮你做出决定。假设你有很多种商品的销售数据,每个商品有上百个特征,但我们只需要关注最重要的几个特征,PCA能帮你找到这些最重要的特征(成分)。KNN就像你在派对上,决定跟谁坐在一起。原创 2025-03-13 07:58:39 · 96 阅读 · 0 评论 -
2.4深度学习—— 全连接层的参数开销&Softmax 操作
在 Softmax 回归模型中,我们首先需要一个有多个输出的神经网络,每个输出对应一个类别。为了实现这个分类任务,Softmax 回归采用了仿射函数来进行计算,即每个类别的输出是通过与输入特征进行加权求和并加上偏置得出的。Softmax 回归中每个类别的输出依赖于所有输入特征的加权求和,因此它是一个全连接层。在实际应用中,全连接层可能会涉及大量的参数。如果输入特征数为 ( d ),输出类别数为 ( q ),那么全连接层的参数开销是 ( O(dq) )。在深度学习中,通常通过调整超参数 ( n ) 来平衡计算原创 2025-03-03 08:48:29 · 47 阅读 · 0 评论 -
2.3深度学习——使用 `Sequential` 容器定义模型&关于全连接层(Dense)&参数初始化的推迟执行
在这一节中,我们将使用深度学习框架(如MXNet)中的预定义层来简化模型的定义过程。相比于手动实现每一层的细节,使用框架提供的高层API可以让我们更加专注于模型架构的设计,而无需关心每一层的内部实现。在2.2 节中,我们手动定义了线性回归模型的参数,并通过基本的线性代数操作进行计算。但随着模型的复杂性增加,手动编写每个细节会变得越来越繁琐。这时,使用MXNet提供的高层接口就变得非常有用。我们使用 Sequential类来定义模型。Sequential是一个容器,可以将多个层按顺序连接在一起。原创 2025-02-25 21:43:39 · 583 阅读 · 0 评论 -
比喻的方法大话Python语言
定义一个函数就像是给你自己的厨房工具取名字。例如,你可以定义一个“做蛋糕”的工具,告诉它需要什么材料、怎么做。然后你可以多次使用这个工具,做不同的蛋糕。这里的make_cake就是一个函数,它接受一个“ingredient”(材料),然后打印出制作蛋糕的步骤。比喻:定义函数就像制定一个烹饪计划。你决定好所需的步骤(函数体)以及所需的配料(参数),然后根据计划制作食物(调用函数)。代码示例"""打印一个问候语"""print(f"你好,原创 2024-10-30 19:23:11 · 747 阅读 · 0 评论 -
用R语言揭示毕业生就业心理:机器学习与深度学习的案例深度解析
通过使用R语言进行机器学习和深度学习分析,我们可以深入揭示毕业生就业心理的复杂特征。这些模型和分析方法不仅可以帮助我们更好地理解毕业生的就业决策过程,还可以为政策制定和职业指导提供科学依据。未来,我们可以进一步结合更多的心理学理论和数据,以提高分析的准确性和实用性。原创 2024-06-15 23:07:09 · 950 阅读 · 0 评论 -
从硬件语言到手写CPU,开启“电路探险”之旅
就像你用 Python 写代码一样,Verilog 也有自己的语法规则,虽然和 Python 不太一样,但核心思想是相似的:给电路下达命令,告诉它做什么。但别担心,我不会让你陷入枯燥的公式和抽象的概念中,反而是通过一系列轻松有趣的步骤,帮你从零开始设计属于自己的。通过 Verilog,你可以用几行代码就实现一个基本的 ALU,虽然它很简单,但却能做你希望它做的事——计算。没有时钟的同步,CPU 就会混乱不堪。你可以把这些硬件语言看作是电路的“语言”,它们可以告诉电路:“嘿,你现在该做什么,什么时候做。原创 2024-12-24 09:00:08 · 380 阅读 · 0 评论 -
比喻的方法介绍什么是自然语言生成 (NLG)?
自然语言生成就像是一个聪明的厨师,他根据你提供的“原料”(数据),规划出合适的菜谱(内容),然后用他的烹饪技巧(文本生成),为你做出一道美味的菜肴(文本)。通过这种方式,复杂的数据可以转化为简单易懂的自然语言,帮助你更好地理解信息。想象你有一个非常聪明的厨师(NLG系统),他能够根据你提供的原料(数据)做出美味的菜肴(文本)。NLG的目标是使机器能够以自然、流畅的方式表达信息,提升用户体验和信息的可达性。我们可以用比喻来形象地理解自然语言生成(NLG)。原创 2024-09-08 15:38:14 · 396 阅读 · 0 评论 -
比喻的方法介绍大型语言模型(Large Language Model,LLM)
大型语言模型(Large Language Model,LLM)是一种基于深度学习的自然语言处理(NLP)技术。它们通过在大量文本数据上进行训练,学习语言的模式、结构和语义,以生成或理解自然语言文本。原创 2024-09-08 17:55:34 · 806 阅读 · 0 评论 -
用比喻的方法介绍什么是语言建模?
统计语言模型就像一个记住了很多故事片段的老师,他通过统计数据来做出预测。神经网络语言模型就像一个能够理解故事深层次结构和情感的老师,他能做出更自然、更贴合上下文的预测。通过这样的比喻,希望能帮助你更直观地理解语言建模的概念和不同类型的语言模型如何运作。原创 2024-09-08 16:45:13 · 500 阅读 · 0 评论 -
深度学习在机器翻译中的应用:使用Spring Boot与DL4J实现自然语言处理
通过以上模块,我们可以构建一个简单的机器翻译系统。希望这些内容能帮助你深入理解每个部分的功能和实现。记住,机器翻译是一个复杂的任务,涉及多个技术环节,深入的研究和不断的实践是掌握这一领域的关键。原创 2024-11-03 12:56:02 · 832 阅读 · 0 评论 -
比喻的方法介绍什么是自然语言处理 (NLP)?
NLP的许多应用(如机器翻译)就像这样的翻译器,它将一种语言转换成另一种语言,使计算机能理解和处理人类语言。你可以把NLP看作计算机的大脑,它试图模仿人类的大脑如何理解和处理语言。NLP的任务就是让计算机像你一样处理语言,识别出句子中的信息并作出相应的回应。NLP就像是一个高级图书馆员,它可以快速找到相关的书籍、文章或信息,帮助你从大量的文本中提取出有用的信息。你告诉它你的需求,它会理解你的语言并给出合适的回应。它了解你写的内容,并基于已有的语言模型生成自然流畅的文本。原创 2024-09-08 14:24:55 · 594 阅读 · 0 评论 -
从硬件语言到手写CPU,开启“电路探险”之旅
就像你用 Python 写代码一样,Verilog 也有自己的语法规则,虽然和 Python 不太一样,但核心思想是相似的:给电路下达命令,告诉它做什么。但别担心,我不会让你陷入枯燥的公式和抽象的概念中,反而是通过一系列轻松有趣的步骤,帮你从零开始设计属于自己的。通过 Verilog,你可以用几行代码就实现一个基本的 ALU,虽然它很简单,但却能做你希望它做的事——计算。没有时钟的同步,CPU 就会混乱不堪。你可以把这些硬件语言看作是电路的“语言”,它们可以告诉电路:“嘿,你现在该做什么,什么时候做。原创 2024-12-10 16:02:03 · 1027 阅读 · 0 评论 -
比喻的方法介绍卷积神经网络(CNN)和循环神经网络(RNN)
CNN擅长处理具有固定网格结构的数据,能够提取局部特征,适用于图像处理任务。RNN擅长处理序列数据,能够记住序列中的上下文信息,适用于时间序列和语言处理任务。这两种网络结构各有优势,常常根据任务需求选择合适的网络类型,有时还会结合使用。可以用比喻来帮助理解CNN和RNN的区别。CNN(筛选器):就像通过不同的筛网提取配料,CNN通过卷积层从数据中提取局部特征,适合处理具有固定网格结构的数据,如图像。RNN(接龙游戏)原创 2024-09-08 17:38:35 · 706 阅读 · 0 评论 -
为什么深度神经网络难以训练
深度神经网络的训练难点主要来自梯度消失/爆炸、过拟合、非凸优化问题、计算资源的需求、权重初始化和激活函数选择等方面。为了应对这些挑战,研究者提出了多种方法,例如使用ReLU等激活函数、批量归一化、残差网络(ResNet)、更好的权重初始化、使用正则化技术(如Dropout)等。这些改进帮助缓解了一部分问题,但随着网络的规模不断增大,训练依然是一个复杂且需要精心设计的过程。原创 2024-09-08 13:17:01 · 895 阅读 · 0 评论 -
2.1深度学习-矢量化加速&正态分布与平方损失
在机器学习中,预测是一个非常关键的步骤。通过已训练的线性回归模型,我们可以根据输入的特征来预测目标变量。为了提高效率,尤其是在大数据集的处理上,向量化技术显得尤为重要。通过利用高效的线性代数库,能够大幅加速计算,简化代码,减少错误,这对于深度学习和机器学习模型的训练与推断都是至关重要的。未来,随着数据规模的不断增大和计算能力的提升,向量化技术将继续发挥重要作用,尤其是在硬件加速(如GPU、TPU)的支持下,我们可以更高效地处理复杂的模型训练和推断任务。正态分布与线性回归之间有着密切的关系。原创 2024-11-18 17:56:35 · 1000 阅读 · 0 评论 -
深度学习——神经网络架构发展现状与技术瓶颈
尽管当前神经网络架构在许多领域取得了巨大成功,但仍然面临不少挑战。在计算资源消耗、训练效率、泛化能力等方面的瓶颈依然存在。通过模型压缩、量化、知识蒸馏等手段,减少模型的计算量和存储需求,提升深度学习模型在边缘设备上的应用。加强多模态数据的融合处理能力,推动跨领域迁移学习,使得模型在不同任务和不同数据集之间具有更好的泛化能力。自监督学习和无监督学习将成为深度学习的重要方向,通过充分利用未标注数据进行模型训练,进一步减少对大量标注数据的依赖。原创 2024-11-23 20:00:29 · 819 阅读 · 0 评论 -
智能驾驶与多核心域控制器融合:深度学习推动自动驾驶革新
自动驾驶技术正以前所未有的速度发展,尽管面临许多技术和社会挑战,但它无疑是未来交通的主流趋势。从“眼睛”到“大脑”,再到“心脏”,每一个细节都充满了创新和挑战。随着技术不断突破,自动驾驶的商业化与普及将为人类带来更加智能、安全、绿色的出行体验,开启全新的智能交通时代。而你,准备好迎接未来的自动驾驶之旅了吗?原创 2024-12-10 14:02:19 · 847 阅读 · 0 评论 -
深度学习——优化探索:用PyTorch打破完全连接神经网络的训练瓶颈
本章详细介绍了完全连接神经网络的基础知识,包括训练循环、损失函数的选择、网络实现和批量训练的优化。随着深度学习的普及,越来越多的工程师和研究人员开始面对如何高效地训练和优化这些模型的问题。虽然当前的技术仍然面临很多瓶颈,但随着研究的深入,我们有理由相信,未来会有更多创新性的技术出现,帮助我们解决这些问题。建议:在实际项目中,设计和训练神经网络时,除了基础的模型架构外,调优训练过程、优化算法和硬件资源的利用,都是提升效率和效果的关键。原创 2024-11-23 10:09:02 · 1019 阅读 · 0 评论 -
1.6 深度学习-处理多个随机变量
假设我们有一个疾病检测的例子,疾病的真实发生率为 0.1%(即先验概率 P(D) = 0.001),测试的准确度很高,假阳性率为 1%,即 P(Test Positive | Healthy) = 0.01,而真阳性率为 100%,即 P(Test Positive | Sick) = 1。:给定两个事件 A 和 B,分别具有概率 P(A) 和 P(B),你需要计算 P(A ∪ B) 和 P(A ∩ B) 的上下限。这两个公式表示的是期望的基本概念,其中第一式是单纯的随机变量的期望,第二式则是函数的期望。原创 2024-11-20 16:45:18 · 952 阅读 · 0 评论 -
深度学习模型全解析:你必须了解的知识
深度学习是机器学习的一个分支,使用多层神经网络来模拟人类大脑的思维过程,从而让计算机能够像人类一样进行学习。通过深度学习,计算机可以识别模式并做出决策,且其表现往往超过传统的算法方法。深度学习在处理复杂任务时尤其有效,如图像识别、自然语言处理、自动驾驶等领域。例如,在无人驾驶汽车中,深度学习技术用于识别交通标志、行人、路灯等。这些模型能够从大量数据中学习并做出预测,从而让汽车能根据环境信息作出决策。深度学习是当前人工智能领域最为重要的技术之一,它使得计算机可以像人类一样理解和生成复杂的数据。原创 2025-01-02 08:17:51 · 1289 阅读 · 0 评论 -
2.2深度学习——初始化模型参数
接下来,我们需要定义一个线性回归模型。线性回归的核心是通过输入特征X和权重w的矩阵乘法,再加上偏置b来计算输出。根据线性回归的公式:其中,X是特征矩阵,w是权重向量,b是偏置。def linreg(X, w, b): # 线性回归模型"""线性回归模型"""在训练过程中,我们需要定义损失函数,以度量模型的预测值与真实值之间的差距。对于线性回归,通常使用均方误差(MSE)作为损失函数,公式为:其中,y_hat是模型的预测值,y是实际的目标值。原创 2024-11-28 09:11:05 · 851 阅读 · 0 评论 -
2.1深度学习——从线性回归到深度神经网络的演变
虽然神经网络的基本结构受生物神经元的启发,但随着深度学习的发展,人工神经网络的设计和实现已经大大超越了生物神经元的模型。这种分层的结构使得神经网络能够处理更复杂的任务。通过多层的非线性变换,深度神经网络能够学习到输入数据的高层次特征,这使得它在处理复杂任务时具有巨大的优势。在最基本的神经网络模型中,输入层与输出层之间的连接非常简单,输入数据通过权重进行加权和求和,最后输出结果。现代深度学习中的神经网络通常包含多个层,每一层都能够提取输入数据中的不同特征,而这些层的组合使得神经网络能够处理更复杂的任务。原创 2024-11-30 10:27:04 · 1016 阅读 · 0 评论 -
1.7 深度学习-查阅文档
你可以选择任何一个深度学习框架(例如 TensorFlow、PyTorch、MXNet 等),然后使用框架的文档搜索功能查找特定函数或类的使用方法。通常,官方文档会提供详细的函数说明、参数介绍、使用示例以及可能的最佳实践。在学习MXNet时,由于篇幅限制,我们无法介绍所有的函数和类。在本节中,我们将介绍如何查找和使用MXNet中的函数和类。通过这些方式,你可以快速查找和学习MXNet中各种函数和类的用法,帮助你更高效地使用该框架。这将显示该函数的帮助文档,内容包括该函数的功能、参数、返回值以及示例。原创 2024-11-20 13:30:37 · 887 阅读 · 0 评论 -
机器学习与深度学习:谁是更聪明的“小助手”?
他不是一开始就知道该如何做,但随着越来越多的尝试和错误,他能“自学成才”,总结出一套自己的方法来解决问题。最棒的是,他从不依赖别人指导,而是通过大量的数据学习,不断改进自己的技能。换句话说,机器学习要先搞清楚数据的哪些部分(特征)能用,哪些不能用,它的智能往往是通过人类的“引导”来实现的。”于是你告诉他:“嗯,你先从这些工具箱里挑出几个适合的工具,然后按照我给你的建议操作。总之,懂得如何选择这两者,就像是选择用学徒还是天才来完成任务一样,关键在于你要解决的是什么问题,所需的资源以及你的技术需求。原创 2024-12-23 08:41:44 · 509 阅读 · 0 评论 -
深度学习与LLM大冒险:操作指南
✨ 这份指南不仅帮你搞懂深度学习和LLM的基础知识,还给你带来了很多有趣的代码示例!👾 无论你是刚刚入门的小白,还是已经在AI领域遨游的高手,这份教程都能让你从基础到进阶,轻松搞定!生成模型是AI的“魔术师”,它们能从数据中“创造”新的样本!深度学习是人工智能(AI)的一大“秘密武器”,它让机器可以像人一样,从数据中“自己”学习并做出聪明的决策。让我们一起探索机器如何从海量数据中汲取智慧,让深度学习和LLM的神奇力量为你开启前沿科技的大门!深度学习不仅让机器“聪明”,它还帮助我们生活得更便利哦!原创 2025-01-26 08:46:56 · 496 阅读 · 0 评论 -
2.2深度学习——读取数据集
在本节中,我们实现了一个简单的数据迭代器data_iter,它能够按小批量读取并打乱数据集。虽然这种实现适用于教学目的,但在处理大规模数据时,可能会遇到内存和效率上的问题。现代深度学习框架已经为我们提供了更加高效的数据加载机制,能够处理更大的数据集并提高训练效率。原创 2024-11-26 00:22:19 · 818 阅读 · 0 评论 -
2.2深度学习——从零开始实现线性回归
从零开始实现线性回归模型的过程,帮助我们深入理解了模型的构建过程。尽管现代深度学习框架已经高度自动化了这些过程,了解这些细节对于提升我们的编程能力和理论水平是非常有帮助的。通过手动实现数据生成、损失函数计算和参数优化,我们不仅理解了线性回归的数学原理,还学会了如何将这些原理应用到实际的代码中。这为我们日后更复杂的模型提供了基础,并使我们能够灵活地调整和优化模型。原创 2024-11-28 09:11:20 · 957 阅读 · 0 评论