
ML
文章平均质量分 80
技术与健康
这个作者很懒,什么都没留下…
展开
-
【LLM 大模型的发展和未来】
事实上,LLM依然是人工智能领域的核心技术之一,尤其是在自然语言处理(NLP)和生成任务中扮演重要角色。当前,LLM的研究和应用正在不断发展,越来越多的新模型和创新应用正基于这一技术进行构建。原创 2024-10-18 14:27:40 · 692 阅读 · 0 评论 -
神经网络微调技术全解(01)-不同的微调方法如PEFT、SFT、LoRa、QLoRa等,旨在解决不同的问题和挑战
PEFT:关注减少全面微调的计算和存储需求,通过部分参数的微调实现高效适应性。SFT:专注于将无监督预训练模型转换为能够执行特定监督任务的模型。LoRa:通过低秩矩阵分解减少微调参数的数量,从而降低计算和存储成本。QLoRa:在LoRa的基础上引入量化,进一步减少存储需求,适用于资源有限的场景。Adapter: 用于多任务学习,通过添加可训练模块进行适应。: 通过优化输入提示来引导大语言模型的任务表现。: 通过训练前缀向量来影响模型输出,适合大模型。BitFit: 仅微调偏置项,极大减少参数量。原创 2024-08-25 08:53:00 · 1418 阅读 · 0 评论 -
机器学习入门必须理解的概念-终于掰扯清楚了一些
定义:过拟合发生在模型在训练数据上表现得非常好(如预测准确率很高或误差很小),但在未见过的测试数据或验证数据上表现较差。这意味着模型学到了训练数据中的细节和噪声,而不是数据的普遍规律。表现:过拟合的模型通常会对训练数据的特异性模式做出过度的响应,从而在面对新数据时不能很好地泛化。这导致模型在新数据上的误差大幅增加。统计学习:重视模型的解释性和参数合理性,强调模型的统计基础和理论性。适用于需要明确因果关系和统计推断的场景。机器学习:重视模型的泛化能力和预测性能,强调模型在处理新数据时的表现。原创 2024-08-18 07:46:25 · 1013 阅读 · 0 评论 -
从简单到复杂,训练神经网络的秘诀
据称,开始训练神经网络非常简单。许多库和框架都以展示 30 行神奇的代码片段来解决问题而自豪,给人一种这些东西是即插即用的(错误)印象。常见的情况如下:#conquer world here这些库和示例激活了我们大脑中熟悉标准软件的部分 - 通常可以获得干净的 API 和抽象。请求库演示:不幸的是,神经网络并非如此。当您稍微偏离训练 ImageNet 分类器时,它们就不是“现成的”技术。当您破坏或错误配置代码时,通常会遇到某种异常。您插入了一个整数,而某个函数需要字符串。该函数只需要 3 个参数。此导原创 2024-08-16 08:18:03 · 1041 阅读 · 0 评论 -
回归分析系列2-二项回归模型
二项回归模型用于处理二元响应变量,即因变量是0或1的分类变量。最常见的二项回归模型是逻辑回归,它可以用来预测事件发生的概率。逻辑回归模型假设:其中,p 是事件发生的概率,x1,x2,…,xp是自变量。原创 2024-08-15 08:02:26 · 954 阅读 · 0 评论 -
回归分析系列1-多元线性回归
多元线性回归是简单线性回归的扩展,允许我们同时研究多个自变量对因变量的影响。多元回归模型可以表示为:其中,x1,x2,…,xp是 p 个自变量,β0 是截距,β1,β2,…,βp是对应的回归系数,ϵ是误差项。原创 2024-08-14 07:54:35 · 1233 阅读 · 0 评论 -
回归分析系列0-最基础的简单线性回归
回归分析是一种用于理解和量化变量之间关系的统计方法。无论是在社会科学、自然科学、经济学,还是在工程学、医学等领域,回归分析都被广泛应用。通过构建模型,我们可以探索和解释变量之间的关联,并利用这些模型进行预测和推断。回归分析的核心思想是通过一个或多个自变量(独立变量)来预测或解释因变量(应变量)的变化。例如,研究人员可能会使用回归分析来探讨教育水平、工作经验等因素如何影响工资收入。回归分析不仅限于预测,它还可以帮助我们理解变量之间的关系,例如判断某个因素是否对结果产生显著影响。原创 2024-08-13 07:42:49 · 945 阅读 · 0 评论 -
使用 PyTorch 的聊天机器人 - NLP 和深度学习
为此,我们需要收集训练词,即我们的机器人可以在训练数据中查看的所有单词。基于所有这些单词,我们可以计算每个新句子的词袋。我们不能直接将输入句子传递给我们的神经网络。我们必须以某种方式将模式字符串转换为网络可以理解的数字。)是用于构建处理人类语言数据的 Python 程序的领先平台。对于标签,我们按字母顺序对其进行排序,然后使用索引作为类标签。单词在传入的句子中可用,则每个位置包含 1,否则包含 0。您已实现聊天机器人!正如开头提到的,您可以根据自己的需求进行自定义。可能的模式和响应,然后重新运行训练即可。原创 2024-08-12 07:48:03 · 1021 阅读 · 0 评论 -
笔记:线性回归,模型轻量化,LORA
量化是把模型中的浮点类型的权重转换为低精度(如 INT8 或 INT16)的过程,不仅可以减少模型的存储空间需求,还能在某些硬件上加速模型的推理速度。和动态量化不同,静态量化会在推理前对模型的权重和激活数据进行量化,通常需要一个校准步骤,通过这一步可以决定最佳的量化参数。知识蒸馏是一种训练技术,其中一个小的模型,被叫做学生模型,学习模仿一个大的已经训练好的模型,这个模型通常叫做教师模型。这种方法通常能保持或仅轻微影响模型的精度。我们可以将更复杂的回归视为由更简单的模型构建而成,从简单的比较开始并添加调整。原创 2024-08-11 07:46:49 · 538 阅读 · 0 评论 -
从线性回归到深度学习(无代码),重在理解基本概念和流程。
在这本书里,我们将深入探讨回归分析。回归分析是一种强大的统计工具,能够帮助我们理解变量之间的关系,并进行预测。在开始之前,我们先来了解一些基本概念和背景知识。在这本书里,我们将深入探讨回归分析。回归分析是一种强大的统计工具,能够帮助我们理解变量之间的关系,并进行预测。在开始之前,我们先来了解一些基本概念和背景知识。回归分析是一种统计方法,用于研究和建模一个或多个自变量(解释变量)与因变量(响应变量)之间的关系。简单来说,就是找到一种方法,用自变量的值来预测因变量的值。原创 2024-08-10 08:09:53 · 1456 阅读 · 0 评论 -
入门者的十大机器学习算法
在本文中,我们回顾了对于任何新兴数据科学家来说必不可少的十大机器学习算法。请记住,在现实场景中持续练习和应用是掌握这些算法的关键。原创 2024-08-08 07:08:59 · 1640 阅读 · 0 评论 -
机器学习:识别AI,GraphRAG,LoRA,线性变换,特征
LoRA 是一种加速 LLM 微调同时消耗更少内存的技术。这不涉及对整个基础模型进行微调,因为这可能需要耗费大量的时间和金钱。相反,它会向模型中添加少量可训练参数,同时保持原始模型参数不变。为什么选择 LoRA?尽管我们使用 LoRA 为模型添加了更多层,但它实际上有助于节省内存。这是因为与大模型相比,较小的层(A 和 B)需要学习的参数较少,而可训练参数较少意味着需要存储的优化器变量较少。因此,尽管整体模型看起来更大,但就内存使用而言实际上更高效。什么是等级?原创 2024-08-06 17:25:52 · 749 阅读 · 0 评论 -
推荐:数据工程的原则和推荐的项目结构
例如数据始终位于 data/ 中,原始数据位于 data/raw/,用于分析的最终清理版本位于 data/processed/ 中。这种合理的结构有助于其他人理解、重现和扩展您的分析,并建立一种信任感,。要想做好数据工程,就需要遵守一定的规则,并建立良好的项目结构,这样才能确保我们的数据项目事半功倍。在实践中,需要根据实际情况,不断优化数据项目的流程和结构,真正实现数据的端到端,可重复的生成过程,从而满足数据分析,机器学习的需要。规则 9:项目运行默认是详细的,并产生有形的工件。原创 2024-08-06 08:23:10 · 1033 阅读 · 0 评论 -
深度机器学习入门-知识要点
具体方法的采用,要综合成本和效率。原创 2024-08-01 07:38:36 · 1096 阅读 · 0 评论 -
机器学习入门-新手常见问题记录
在选择具体的算法时,建议从训练数据的大小、特征的数量、是着重考量模型的性能还是考量模型的可解释性、是否要求模型有很快的训练速度,以及数据的线性程度这几个方面,来选择最适宜的算法。0,机器学习项目的5步: 定义问题(营销/运营/维护等)—>收集数据(A/B测试)和预处理/–>(选择算法和确定模型—>训练模型—>评估并优化模型),很多时候,后面3步需要不断的反复循环的,甚至有时候后面四步 包含数据的处理特别是涉及特征工程话,也需要反复。2. 普通的 CNN,和VGG19使用的Y的特征数量不同。原创 2024-07-31 07:47:15 · 956 阅读 · 0 评论 -
参考:设计overfitting网络
1.如何有意设计过度拟合的神经网络?原创 2024-07-31 07:28:15 · 173 阅读 · 0 评论 -
机器学习应用
1,探索:如何利用和训练overfitting的模型-优快云博客2 ,........原创 2024-07-29 17:26:21 · 175 阅读 · 0 评论 -
探索:如何利用和训练overfitting的模型
使用过拟合模型进行调试和理解模型行为的过程包括识别过拟合问题、分析模型表现、以及通过可视化和特征重要性分析来理解模型的决策机制。这些方法可以帮助我们改进模型、提高模型的泛化能力,并深入了解模型的预测逻辑。合成基准测试和竞赛可以帮助研究人员和工程师更好地理解和解决过拟合问题,通过设计合成数据集和评估模型性能,推动机器学习模型的改进。合成基准测试可以用来建立标准化的评估方法,而竞赛则激励创新并发现最佳解决方案。通过具体的示例和实验,教学中可以利用过拟合模型来帮助学生理解复杂的机器学习概念。原创 2024-07-29 17:05:19 · 1102 阅读 · 0 评论