萱仔学习自我记录-优快云博客

原创基于 Qwen-0.5B Lora 微调训练英语问答任务

Qwen是阿里巴巴集团的Qwen团队研发的一个大语言模型系列，包含了语言模型和多模态模型。本文是使用了Lora微调的方法对qwen进行微调，使得模型在自己的数据集上更加准确

2024-10-07 17:48:12 2747 1

原创 C++ 类和对象的定义涉及到的关键字记录

在 C++ 中，类和对象的定义涉及到许多关键字，这些关键字用于描述类的属性、行为和访问权限等。

2024-11-25 17:35:30 398 1

原创萱仔求职复习系列：C++超基础期末复习版本

按值传递：传递值的副本按引用传递：传递引用，使用 & 符号1、函数定义返回类型：定义函数的返回值类型（例如 int、double、void 等）。如果函数不返回任何值，使用 void 作为返回类型。函数名：标识函数的名字，用来在调用时进行引用。参数列表：定义传递给函数的变量，写在括号内，可以为空。函数体：包含了执行的代码块，位于大括号内。2、函数参数传递方式。

2024-11-25 11:24:24 711

处理大数据：如果你有成千上万的文件、日志数据，或者每天需要处理几百 GB 的数据量，Spark 是一个理想的工具。在需要反复计算的数据任务中，如迭代式的机器学习算法，它有很大的优势。1、高速处理： Spark 能够将数据加载到内存中进行计算，相比于传统的 Hadoop MapReduce，它的迭代计算速度要快很多，特别是在处理需要多次操作的数据集时（例如机器学习任务）。分布式和容错性： Spark 通过分布式集群运行，可以处理非常大的数据集（数百 TB 级别），并且自带容错机制，任务失败时可以自动恢复。

2024-10-21 23:59:07 1042 1

原创如何在 Jupyter Notebook 执行和学习 SQL 语句（下）—— 进阶版题目综合（多表连接，窗口函数，子查询等等）

目标：使用窗口函数 ROW_NUMBER() 找到每个用户的最后一次购买的产品名称和购买日期。FROM (FROM users) as t内层查询 (FROM 子句):选择字段:users.name: 用户的名字。products.product_name: 产品的名称。transactions.transaction_date: 交易的日期。窗口函数 (ROW_NUMBER()):PARTITION BY users.id：按照用户的 ID 分组。每个用户的交易将单独进行编号。

2024-10-21 17:17:35 1250

原创 Kaggle竞赛的流程 —— 手把手讲述如何完成一次kaggle比赛

通过熟悉这些术语，你可以更有效地参与竞赛，与社区互动，并更快地提升你的数据科学技能。为了帮助初学者快速掌握Kaggle的术语，Kaggle提供了由。制作的视频，介绍常用的Kaggle术语。

2024-10-17 23:58:30 3175 2

原创萱仔求职系列——C++临时抱佛脚：期末复习系列

由于最近投简历的时候，虽然总体是冲着NLP大模型进行一个投递的擦破自拍，但是由于我以前的项目都是图像算法的项目，还是有HR小哥哥小姐姐来问我是不是求职图像相关（我真的非常心动，现在我已经想要一个好offer就行，不在意到底是什么方向的了，回归老本行我也是愿意的！常用算法：sort(), find(), count(), lower_bound(), upper_bound()栈：后进先出（LIFO），常用操作：push(), pop(), top()异常的抛出与捕获（try, catch, throw）

2024-10-17 23:56:42 487

原创如何在 Jupyter Notebook 执行和学习 SQL 语句（中）—— 1、SQL基础语句

为了模拟涵盖SQL所有重要考点的实验，设计五个实验场景，并使用多个不同的数据集。这些场景可以包含基本操作（如创建表、插入数据）、中高级操作（如联结查询、分组聚合、窗口函数、子查询、排序等）以及复杂操作（如计算各种比率、复杂查询等）。每个实验使用不同的业务场景并针对特定SQL操作进行练习。数据集设计创建以下三张表：users 表：包含用户的基本信息。products 表：包含产品信息。transactions 表：包含用户购买产品的交易记录。

2024-10-15 23:59:24 938

原创如何在 Jupyter Notebook 执行和学习 SQL 语句（中）—— 2、SQL基础数据类型

INT/INTEGER：存储整数，正数和负数。FLOAT/REAL/DOUBLE：存储带小数的浮点数。DECIMAL/NUMERIC：存储精确的小数，常用于金融数据。数字类型常见操作：比较操作：=、>、<、>=、<=（用于比较数字大小）。算术操作：+（加）、-（减）、*（乘）、/（除）、%（取余）。SUM()：对一列数字进行求和。AVG()：计算平均值。MIN()：返回最小值。MAX()：返回最大值。COUNT()：计算行数。

2024-10-15 23:57:20 567

原创如何在 Jupyter Notebook 执行和学习 SQL 语句（上）—— 基本原理详解和相关库安装篇

SQLite 是一个轻量级的数据库系统，适合本地小型项目。SQLAlchemy 是一个强大的数据库连接工具，可以在Jupyter中方便地运行SQL查询。帮助有jupyter的人懒得装SQL的人学习SQL一大利器！

2024-10-14 18:59:57 2046

原创萱仔求职复习系列——力扣：删除链表的倒数第 N 个结点

这种方法通过使用两个指针，其中一个指针先移动 n+1 步，另一个指针从头开始一起移动，这样当第一个指针到达链表末尾时，第二个指针恰好指向倒数第 n个节点的前一个节点。要删除链表的倒数第 n个节点，可以使用。给你一个链表，删除链表的倒数第。个结点，并且返回链表的头结点。

2024-10-11 23:51:44 242

原创萱仔求职复习系列——力扣

递归处理：每次递归处理 k 个节点，翻转它们，然后将翻转后的部分与递归处理的剩余部分连接起来。翻转部分链表：我们需要在每次递归时翻转 k 个节点，翻转完成后将新的头节点返回，并递归连接。递归结束条件：当剩下的节点少于 k 个时，保持原有顺序，不再翻转。是一个正整数，它的值小于或等于链表的长度。你不能只是单纯的改变节点内部的值，而是需要实际进行节点交换。的整数倍，那么请将最后剩余的节点保持原有顺序。个节点一组进行翻转，请你返回修改后的链表。

2024-10-11 23:49:29 255

原创萱仔求职复习系列——2 Linux的常用方法（包含基础进阶高级操作）

由于最近接了一个笔试，发现笔试可能涉及到Linux，我准备临时抱佛脚一下赶紧复习一下Linux的用法哈哈。Linux 的基础用法包含文件系统操作、权限管理、网络配置、进程管理等基本命令；进阶操作包括网络调试、包管理、服务管理和用户管理等；高级操作则涵盖Shell 脚本编程、计划任务设置、文件系统管理以及日志分析等功能。

2024-10-10 23:53:15 497

原创萱仔求职系列——1.2 机器学习常用算法代码与调参过程

机器学习基础知识复习的理论部分如下所示：（已经涉及到我常常碰到面试的问题）本内容的代码最近将上传到我的仓库里：这里留有一个网址的地方。(这是部分，还没有完全整理好)以下连接时我以前复习的一些理论基础知识，非常实用，涉及到很多次面试用到的东西！这里总结一下每个算法的代码实现过程，然后我把汇总版放入了jupyter，大家需要的自取！

2024-10-10 18:07:55 1010

原创萱仔求职系列——力扣刷题：随即链表的复制

这个复制很简单，直接用那个字典记录下来所有的对应值，来记录原链表节点与新复制链表节点之间的对应关系，首先，遍历原链表，复制每个节点，并将原节点和复制后的节点用哈希表存储起来。在复制链表时，random 指针可以指向链表中的任意节点，因此需要用一种方法来保证新节点的 random 指针正确地指向新链表中的对应节点。深拷贝则需要确保新链表的每个节点的 random 指针指向新链表中对应的节点，而不是原链表中的节点。指针也都应指向复制链表中的新节点，并使原链表和复制链表中的这些指针能够表示相同的链表状态。

2024-10-09 23:55:54 367

原创萱仔求职系列——力扣刷题：两数相加

虽然递归也只处理链表中的每个节点一次，但是由于递归调用函数本身会消耗栈空间，每次递归调用会占用一层栈，栈的深度等于两个链表的最大长度。比如，两个链表的长度总和为 k，递归的调用栈深度就是 k，因此空间复杂度为 O(k)。实际上，迭代方法和递归方法的时间复杂度是相同的，都是 O(max(m, n))，其中 m 和 n 分别是两个链表的长度。迭代方法：只需使用一组指针遍历链表，不需要保存函数调用帧，所有的操作都在同一个栈帧中进行，因此只占用常数级别的内存。的链表，表示两个非负的整数。感觉这样结果也不错！

2024-10-09 23:39:17 414

原创 PEFT库和transformers库在NLP大模型中的使用和常用方法详解

原理：通过在预训练模型的权重矩阵中添加低秩矩阵，LoRA将大模型的微调问题转化为对小矩阵的优化。优点：显著减少训练时所需的参数，降低计算复杂度。使用场景：适合在计算资源有限的情况下进行快速微调。# 加载预训练模型和分词器# 配置LoRAr=8, # 低秩适配的秩# 应用LoRA# 训练代码（略）Adapter原理：在预训练模型的不同层之间插入小型的“适配器”网络，只微调适配器参数，保留主模型的权重不变。优点：适配器可以在不同任务之间共享，大幅度减少微调时的参数数量。使用场景。

2024-10-06 23:55:50 1521

原创 Qwen大模型简介

Qwen是由阿里巴巴集团达摩院开发的一个开源大语言模型系列。该系列模型专注于多任务场景下的自然语言处理（NLP），并提供了优秀的多模态扩展能力。Qwen模型家族包括多个版本，如等，分别适用于不同的计算资源和应用场景。启元系列不仅有纯文本语言模型，还包括支持图像、文本、对话等多模态输入的模型。

2024-10-06 21:18:49 11026

原创 HugginngFace的Trainer的常见用法

类提供了一个高度集成的训练、评估和预测接口，能大幅简化我们预训练和微调的工作量。比如我最近最常会遇到的用监督学习微调语言模型任务为例，只需要定义一个。传入我想要训练的模型和数据集，就可以直接运行微调任务。Trainer，然后。

2024-10-05 23:57:31 228

原创微调大语言模型——超详细步骤

首先，我得下载这个AI助手的模型，然后又要给它准备一套数学题和答案（新数据集）。接着，你把这些题目整理成它能读懂的格式，最后让它一遍又一遍地看和学习这些题目和答案，通过反复练习，逐渐让它变得擅长解数学题。微调一个语言模型，其实就是在一个已经训练过的模型上，继续用新数据进行训练，帮助模型更好地理解和处理这个新的任务。然后，再准备一个新的数据集，这个数据包含你希望模型学会的新任务，比如解数学题的训练数据。：一旦模型完成了训练，你可以用它从未见过的测试数据来检查它的表现。

2024-10-05 23:57:25 883

原创 NLP任务一些常用的数据集集锦——包含简介和详细内容

Shakespeare文本数据集包含莎士比亚的作品，常用于文本生成任务，尤其是生成与莎士比亚风格相似的文本。CoNLL 2003是一个标准的数据集，用于命名实体识别任务，包含对新闻文章中人名、地点和组织的标注。SQuAD是一个用于问答系统的热门数据集，包含大量的问答对，旨在促进自然语言处理中的问答研究。SNLI是一个用于文本蕴涵任务的标准数据集，旨在研究句子之间的关系，如蕴涵、对立或中立。Multi30k是一个用于机器翻译的多语言数据集，提供图像的描述文本，并翻译为多种语言。

2024-10-03 23:53:54 1151

原创萱仔求职系列——力扣刷题：链表

这个题吧我觉得可以用双指针的办法，创建一个新的链表，通过比较两个链表的节点值来选择较小的节点，从而确保合并后的链表依然是升序的。这个题目吧，我觉得得多设置一些节点，在原链表的每个节点后面插入一个新节点。新节点的值与原节点相同。指针也都应指向复制链表中的新节点，并使原链表和复制链表中的这些指针能够表示相同的链表状态。节点组成，其中每个新节点的值都设为其对应的原节点的值。新链表是通过拼接给定的两个链表的所有节点组成的。个节点组成的链表来表示输入/输出中的链表。，该指针可以指向链表中的任何节点或空节点。

2024-09-29 23:50:08 462

原创萱仔求职系列——力扣刷题：反转链表（面试超高频题目！）

要反转单链表中从位置。

2024-09-29 23:49:17 244

原创 LLaMA: Open and Efficient Foundation Language Models论文原文代码学习

LLaMA: Open and Efficient Foundation Language Models》主要介绍了Meta AI团队提出的一系列开源的基础语言模型LLaMA（Large Language Model Meta AI）。该论文的关键点可以总结如下：LLaMA模型系列从7B到65B不等，展示了不同参数规模下的表现。尽管LLaMA-13B的参数数量远小于GPT-3的175B，但在大多数基准测试中表现优于GPT-3。

2024-09-29 23:12:24 1180

原创常用大语言模型简单介绍

LLaMA是 Meta 开发的开源大型语言模型，用于执行多种 NLP 任务。Ollama是一个工具或平台，允许用户在本地运行和管理多个语言模型，包括 LLaMA。它简化了 LLM 的运行流程，使用户可以通过命令行轻松调用和实验模型。因此，LLaMA 是一个模型本身，而Ollama 是一个工具，用于运行包括 LLaMA 在内的多种大语言模型。

2024-09-29 22:02:33 4959

原创萱仔求职系列——链表练习

由于我这几天面到的一些图像算法岗也提到了我不熟悉c++的软肋，我准备复习算法的时候顺带复习复习c++，也算是不浪费一丝一毫的刷题时间！一开始我以为可以直接记录下来有没有这个内容，字典中，如果有的话就相当于有环，但是这样就比较的复杂，相当于空间复杂度为O（n）。但是我看了题解中写的快慢指针，非常简单，相当于如果有一个快指针夺走一步，满指针每次只走一步，如果遇见了那就是有圈！来表示链表尾连接到链表中的位置（索引从 0 开始）。的链表，表示两个非负的整数。请你将两个数相加，并以相同形式返回一个表示和的链表。

2024-09-28 23:52:14 336

原创 Agent智能体

Agent（智能体）是一个能够感知环境并采取行动的自主实体，通常被设计用于在特定的环境中执行任务。智能体可以通过学习、推理等方式来决策，目标是最大化某种效用或实现某个预定的目标。它们广泛应用于自动化系统、游戏AI、机器人、自然语言处理、推荐系统等领域。

2024-09-27 23:58:43 844

原创机器学习常用的评价指标原理和代码

最近面试的时候，很多面试官问道了我项目中的一些评价指标的算法和原理，我觉得这确实也是一个很重要的内容，所以趁这个机会综合起来一块复习一下，在刷力扣的时候也不能忘记项目最常用的内容嘛。它们都表示模型在所有实际为正类的样本中，正确预测为正类的比例。：计算误差的绝对值与真实值的比率的平均值，反映相对误差。：实际为正类的样本中，正确预测为正类的比例。：预测为正类的样本中，真正为正类的比例。

2024-09-27 15:36:38 516

原创 BLEU和ROUGE评价指标原理和计算方式

BLEU是一种自动评估生成文本与参考文本相似性的指标，主要用于机器翻译。它通过计算n-gram的重叠程度来判断生成文本的质量。ROUGE是一组用于自动评估文本生成质量的指标，主要用于文本摘要。它通过计算生成文本与参考文本之间的重叠情况，尤其关注召回率。

2024-09-26 23:51:44 1516

原创 kaggle项目：ISIC 2024 - Skin Cancer Detection with 3D-TBP

在这场比赛中，将开发基于图像的算法，从3D全身照片（TBP）中识别组织学确诊的具有单病变作物的皮肤癌症病例。图像质量类似于特写智能手机照片，这些照片通常用于远程医疗目的。预测的二元分类算法可以在没有专业护理的情况下使用，并改进早期皮肤癌症检测的分类。该数据集由带有额外元数据的诊断标记图像组成。这些图像是JPEG格式的。相关的.csv文件包含一个二进制诊断标签（目标）、潜在的输入变量（例如age_approx、sex、anatom_site_general等）和其他属性（例如图像源和精确诊断）。

2024-09-26 18:59:27 1823

原创 NLP任务的详细原理与步骤的详细讲解

对每个NLP任务的原理和步骤的详细讲解。每个任务的实现依赖于特定的模型架构和数据处理方法，理解这些原理有助于在实际应用中选择合适的方法和工具。

2024-09-25 23:55:47 1084

原创 nlp大语言模型原理

‌：研究句子意义的任务，包括语义角色标注（Semantic Role Labeling）、语义依存分析（Semantic Dependency Parsing）和指代消解（Coreference Resolution）。‌：这是NLP的基础，包括分词（Tokenization）、词性标注（Part-of-Speech Tagging）和命名实体识别（Named Entity Recognition）。这些任务共同构成了自然语言处理领域的核心内容，涵盖了从基础的语言结构分析到高级的语义理解和应用‌12。

2024-09-25 23:29:28 325

空空如也

空空如也