自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 收藏
  • 关注

原创 RuntimeError: CUDA error: device-side assert triggered CUDA

换到了cpu上,果然爆出了真正的错误!愿世界没有代码bug。

2025-03-17 16:33:18 139

原创 RAG与微调

RAG 通过检索和整合长文本信息,强化了模型对长上下文的理解和生成,有效突破了输入长度的限制,同时降低了调用成本,并提升了整体的处理效率。RAG 通过检索特定领域的相关文档,为模型提供丰富的上下文信息,从而提升了在专业领域内的问题回答质量和深度。RAG 结合检索到的信息和模型的生成能力,通过提供额外的背景知识和数据支持,增强了模型的推理和理解能力。RAG 将生成内容与检索到的原始资料建立链接,增强了内容的可追溯性,从而提升了用户对生成内容的信任度。,从而显著提升了回答的准确性与深度。

2025-02-21 11:21:32 602

原创 O1、R1和V3模型

它通过大规模强化学习(RL)和冷启动技术,在无需大量监督微调(SFT)的情况下,实现了与O1系列相当的推理能力。在基准测试中,R1在数学推理(如MATH-500)和代码生成(如Codeforces Elo)方面表现优于V3,接近或超越O1。:由DeepSeek(深度求索)开发,R1专注于高级推理任务,而V3是通用的自然语言处理模型。:均开源,允许开发者自由定制和优化。:由DeepSeek开发,专注于高级推理任务,适合复杂问题求解和逻辑推理。:由OpenAI开发,专注于复杂推理任务,适合科研和编程辅助。

2025-02-13 21:24:57 886

原创 Transformers基础知识

常见自然语言处理任务情感分析(sentiment-analysis):对给定的文本分析其情感极性文本生成(text-generation)根据给定的文本进行生成命名实体识别(ner):标记句子中的实体阅读理解(question-answering):给定上下文与问题,从上下文中抽取答案掩码填充(fil-mask):填充给定文本中的掩码词文本摘要(summarization):生成一段长文本的摘要机器翻译:(translation):将文本翻译成另一种语言特征提取(feature-extraction):生成

2025-02-08 11:48:47 210

原创 Transformer 的基本结构

2、将得到的单词表示向量矩阵(如上图所示,每一行是一个单词的表示x)传入 Encoder 中经过6个 Encoder block 后可以得到句子所有单词的编码信息矩阵C,如下图。单词向量矩阵用 X(nxd)表示,n是句子中单词个数,d 是表示向量的维度(论文中 d=512)。每一个 Encoder block 输出的矩阵维度与输入完全一致。1、获取输入句子的每一个单词的表示向量 X,X 由单词的Embedding和单词位置的 Embedding 相加得到。解码器模块 Decoder。

2025-02-08 11:44:25 200

原创 BUG--torch.distributed.elastic.multiprocessing.errors.ChildFailedError:

【代码】BUG--torch.distributed.elastic.multiprocessing.errors.ChildFailedError:

2025-02-05 14:38:04 160 1

原创 训练集与训练方法

在预训练模型的基础上,使用标注数据进行任务特定的微调。

2025-01-18 16:43:16 806

原创 NLP中特征提取方法的总结

基于细粒度的特征提取方法(如词性标注、命名实体识别、核心语义分析等),获取更多的上下文信息和语法特征。:利用预训练的 BERT 等语言模型的上下文表示,通过微调模型来获得更丰富的文本特征。:与 Word2Vec 类似,但它学习的是整个文档或句子的向量表示,而非单词的表示。:对 BOW 特征进行加权,考虑词的在文本中的频率和在整个语料库中的反向文档频率。:通过预训练的词向量模型将单词表示为低维度的稠密向量,捕捉词语之间的语义关系。:通过分析文本的句法结构(如依赖解析树)提取特征,捕捉文本中的语法关系。

2025-01-05 20:33:44 1517

原创 数据结构C语言第2版课后习题答案 _ 第6章 图

2.应用1.选择题(1)在一个图中,所有顶点的度数之和等于图的边数的( )倍。A....4答案:C(2)在一个有向图中,所有顶点的入度之和等于所有顶点的出度之和的( )倍。A....4答案:B解释:有向图所有顶点入度之和等于所有顶点出度之和。(3)具有n个顶点的有向图最多有( )条边。A.nB.n(n-1)C.n(n+1)D.n2答案:B解释:有向图的边有方向之分,即为从n个顶点中选取2个顶点有序排列,结果为n(n。

2024-11-16 20:27:03 1607

原创 数据结构C语言第2版课后习题答案 _ 第7章 查找

若非二叉排序树,则置flag为false。(4)已知二叉树T的结点形式为(lling,data,count,rlink),在树中查找值为X的结点,若找到,则记数(count)加1,否则,作为一个新结点插入树中,插入后仍为二叉排序树,写出其非递归算法。设哈希表长为14,哈希函数是H(key)=key%11,表中已有数据的关键字为15,38,61,84共四个,现要将关键字为49的元素加到表中,用二次探测法解决冲突,则放入的位置是。折半查找有序表(4,6,10,12,20,30,50,70,88,100)。

2024-11-16 20:07:41 2036

原创 数据结构C语言第2版课后习题答案 _ 第8章 排序

1.选择题(1)从未排序序列中依次取出元素与已排序序列中的元素进行比较,将其放入已排序序列的正确位置上的方法,这种排序方法称为( )。A.归并排序 B.冒泡排序 C.插入排序 D.选择排序答案:C(2)从未排序序列中挑选元素,并将其依次放入已排序序列(初始时为空)的一端的方法,称为( )。A.归并排序 B.冒泡排序 C.插入排序 D.选择排序答案:D(3)

2024-10-30 23:16:32 1015

原创 数据结构C语言第2版课后习题答案 _ 第5章 树和二叉树

2.应用1.选择题(1)把一棵树转换为二叉树后,这棵二叉树的形态是( )。A.唯一的B.有多种C.有多种,但根结点都没有左孩子 D.有多种,但根结点都没有右孩子答案:A解释:因为二叉树有左孩子、右孩子之分,故一棵树转换为二叉树后,这棵二叉树的形态是唯一的。(2)由3个结点可以构造出多少种不同的二叉树?( )D.5答案:D(3)一棵完全二叉树上有1001个结点,其中叶子结点的个数是( )。D.501答案:D。

2024-10-20 00:29:12 1242

原创 数据结构C语言第2版课后习题答案_第4章 串、数组和广义表

(1)串是一种特殊的线性表,其特殊性体现在( )。A.可以顺序存储B.数据元素是一个字符C.可以链式存储D.数据元素可以是多个字符若答案:B(2)串下面关于串的的叙述中,( )是不正确的?A.串是字符的有限序列B.空串是由空格构成的串C.模式匹配是串的一种重要运算 D.串既可以采用顺序存储,也可以采用链式存储答案:B解释:空格常常是串的字符集合中的一个元素,有一个或多个空格组成的串成为空格串,零个字符的串成为空串,其长度为零。

2024-10-17 23:16:00 776

原创 数据结构C语言第2版课后习题答案_第3章 栈和队列

数据结构C语言第2版课后习题答案_第3章 栈和队列

2024-10-10 23:05:45 1343

原创 数据结构C语言第2版课后习题答案_第2章 线性表

数据结构C语言第2版课后习题答案_第2章 线性表

2024-10-05 23:16:34 1108

原创 数据结构C语言第2版课后习题答案_第1章 绪论

如数学计算中用到的整数和实数,文本编辑所用到的字符串,多媒体程序处理的图形、图像、声音、动画等通过特殊编码定义后的数据。由用户定义的,表示应用问题的数学模型,以及定义在这个模型上的一组操作的总称。换句话说,数据结构是带“结构”的数据元素的集合,“结构”就是指数据元素之间存在的关系。顺序存储结构是借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系,通常借助程序设计语言的数组类型来描述。解释:数据元素是数据的基本单位,数据项是数据的最小单位,数据结构是带有结构的各数据元素的集合。

2024-10-03 23:00:48 889

原创 数据结构_2.2、顺序表插入删除查找

线性表:是具有相同数据类型的n (n≥0)个数据元素的有限序列顺序表:用顺序存储的方式实现线性表顺序存储:把逻辑上相邻的元素存储在物理 位置上也相邻的存储单元中,元素之间的关 系由存储单元的邻接关系来体现。ElemType :就是你的顺序表中存放的数据元素类型。

2024-09-29 00:20:51 480

原创 数据结构_2.1、线性表的定义和基本操作

线性表是具有相同数据类型的n(n≥0)个数据元素的有限序列其中n为表长,当n = 0时线性表是一个空表。若用L命名线性表,则其一般表示为:几个概念: ai是。

2024-09-24 23:18:01 307

原创 数据结构_1.2、算法

健壮性:输入非法数据时,算法能适当地做出反应或进行处理,而不会产生莫名其妙的输出结果。确定性:算法中每条指令必须有确切的含义,对于相同的输入只能得出相同的输出。不费内存,空间复杂度低。可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现。输出:一个算法有一个或多个输出,这些输出是与输入有着某种特定关系的量。输入:一个算法有零个或多个输入,这些输入取自于某个特定的对象的集合。平均时间复杂度:所有输入示例等概率出现的情况下,算法的期望运行时间。可读性:算法应具有良好的可读性,以帮助人们理解。

2024-09-22 00:04:55 249

原创 数据结构_1.1、数据结构的基本概念

数据:是信息的载体,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。数据元素:数据元素是数据的基本单位,通常作为一个整体进行考虑和处理。数据元素可由若干数据项组成数据项:数据项是构成数据元素的不可分割的最小单位数据结构:是相互之间存在特定关系的数据元素的集合数据对象:是具有相同性质的数据元素的集合,是数据的一个子集。数据结构三要素:数据结构有三要素,即逻辑结构、物理结构和数据的运算。逻辑结构是数据元素之间的关系,物理结构是如何在计算机中存储

2024-09-17 22:47:04 499

原创 03-InternLM2-Math-Plus-20B 微调

请参考, 本教程重点为如何微调新模型。

2024-07-23 15:16:04 270 1

原创 常见考研函数泰勒公式展开(清晰)

ex1x2!1​x2⋯n!1​xnOxn)ln1xx−21​x231​x3⋯n1−1n​xn1Oxn)(1xa1αx2!αα−1​x2⋯n!αα−1⋯α−n1​xnOxn)1−x1​1xx2x3⋯xnOxn)1x1​1−xx2−x3⋯−1nxnOxn)sinxx。

2024-07-23 11:47:04 2396

原创 《峡谷小狐仙-多模态角色扮演游戏助手》复现流程

1、移动的文件太多太大,要检测清楚所有文件夹下文件齐全。2、配置环境库按照 requirements.txt 安装下面这个细节没改!!!

2024-07-22 12:05:31 528

原创 第三期闯关基础岛

test.sh

2024-07-14 00:44:25 1123

原创 DW夏令营1期-零基础入门 AI(机器学习)竞赛

delta G, delta H, -T*delta S: 分别表示结合反应的吉布斯自由能变化、焓变和熵变,这些热力学参数用于描述分子间相互作用的能量状态。- IC50 (nM, Protac to Target): 半最大抑制浓度,针对PROTACs与其目标蛋白的复合物。- Kd (nM, Protac to Target): 解离常数,表示PROTACs与其目标蛋白复合物的结合强度。- EC50 (nM, Protac to Target): 半最大有效浓度,即达到一半最大生物效应的浓度。

2024-07-07 16:42:36 274

原创 OpenXlab应用部署踩坑记录

OpenXlab要求创建的应用得有app.py,但是可以在创建应用的时候将默认的启动文件更改,实践中将其改成了start.py,以我要上传的AMChat_internlm2-math-plus-7b_Hong为例。packages.txt 配置下载模型权重的工具包 git 和 git-lfs。requirement.txt 配置 python相关的依赖包。web_demo.py中修改好模型的路径。可以检测到app.py以及下载模型及成功。在上传好的模型查看一下如何使用模型。剩下的正常安装说明文档操作,

2024-06-22 17:01:37 590

原创 大模型部署_书生浦语大模型 _作业7 OpenCompass :是骡子是马,拉出来溜溜

上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现:提供公平、公开、可复现的大模型评测方案全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力丰富的模型支持:已支持 20+ HuggingFace 及 API 模型分布式高效评测:一行命令实现任务分割和分布式评测,数小时即可完成千亿模型全量评测。

2024-06-08 23:52:39 794

原创 大模型部署_书生浦语大模型:Lagent & AgentLego 智能体应用搭建

在本节中,我们将基于 Lagent 自定义一个工具。Lagent 中关于工具部分的介绍文档位于动作 — Lagent。继承 BaseAction 类实现简单工具的 run 方法;或者实现工具包内每个子工具的功能简单工具的 run 方法可选被 tool_api 装饰;工具包内每个子工具的功能都需要被 tool_api 装饰创建工具文件import os@tool_api"""一个天气查询API。可以根据城市名查询天气信息。

2024-06-08 22:24:02 1121

原创 大模型部署_书生浦语大模型 _作业5 LMDeploy 量化部署 LLM & VLM 实践

HuggingFace是一个高速发展的社区,包括Meta、Google、Microsoft、Amazon在内的超过5000家组织机构在为HuggingFace开源社区贡献代码、数据集和模型。可以认为是一个针对深度学习模型和数据集的在线托管社区,如果你有数据集或者模型想对外分享,网盘又不太方便,就不妨托管在HuggingFace。托管在HuggingFace社区的模型通常采用HuggingFace格式存储,简写为HF格式。但是HuggingFace社区的服务器在国外,国内访问不太方便。国内可以使用阿里巴巴的M

2024-06-05 23:59:02 955

原创 大模型部署_书生浦语大模型 _作业4 XTuner 微调个人小助手认知

一个大语言模型&多模态模型微调工具箱。由 MMRazor 和 MMDeploy 联合开发。1.2数据集准备为了让模型能够让模型认清自己的身份弟位,知道在询问自己是谁的时候回复成我们想要的样子,我们就需要通过在微调数据集中大量掺杂这部分的数据。首先我们先创建一个文件夹来存放我们这次训练所需要的所有文件。之后我们可以在 目录下新建一个 文件,将以下代码复制进去,然后运行该脚本即可生成数据集。假如想要加大剂量让他能够完完全全认识到你的身份,那我们可以吧 的值调大一点。 tree.

2024-06-02 23:09:49 1136

原创 大模型部署_书生浦语大模型 _作业3 RAG

RAG(Retrieval Augmented Generation)技术,通过检索与用户输入相关的信息片段,并结合来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。RAG 能够让基础模型实现非参数知识更新,无需训练就可以掌握新领域的知识。

2024-05-30 00:47:38 952

原创 大模型部署_书生浦语大模型 _作业2基本demo

打开 路径下 文件,并修改对应位置 (71行左右) 代码 :internlm2_agent_web_demo_hf.py。图片理解实战(开启 50% A100 权限后才可开启此章节)补充环境包,选用 进行开发:50% A100。

2024-05-28 21:12:28 637

原创 大模型部署_书生浦语大模型 _作业1基本理论

上海人工智能实验室与商汤科技联合香港中文大学、复旦大学发布新一代大语言模型书生·浦语2.0(InternLM2)。这个大模型包含70亿和200亿两种参数规格,以及基座、对话等版本,向全社会开源并提供免费商用授权。书生·浦语2.0(英文名:InternLM2)核心理念:回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力获得质的提升,进而在数理、代码、对话、创作等各方面都取得长足进步,综合性能达到同量级开源模型的领先水平。

2024-05-21 23:58:55 748

原创 深度学习笔记_10YOLOv8系列自定义数据集实验

在ultralytics/models/v8/目录下是模型的配置文件,随着架构的增大,训练时间也是逐渐增大,只用修改一个参数,把nc改成自己的类别数,需要取整。F1得分是精确度和召回率的调和平均值,曲线的峰值表示给定置信度阈值下精确度和召回率的最佳平衡点。与普通混淆矩阵类似,但这里的值显示的是每个类别的预测正确比例。这些图表和数据文件展示了模型在训练过程中的性能变化,包括损失函数的变化和评估指标(如精确度、召回率和mAP)的变化。边界框宽度:这也是一个归一化后的值,代表对象边界框的宽度。

2024-05-08 22:31:49 1364

原创 N元语言模型

本关任务:利用二元语言模型计算句子的概率。

2024-04-18 09:44:33 2563 1

原创 深度学习_NLP常用库报错问题解决

SpaCy。

2024-03-29 19:39:10 880

原创 深度学习_相关报错解决方案

总结:装2.4.3版本的keras就可以。

2024-03-24 21:52:59 628

原创 大模型_1、服务器部署大模型 ChatGLM3

1.1、升级apt。

2024-03-16 23:41:03 1177 2

原创 深度学习笔记_8隐马尔可夫模型(HMM)

HMM 是一种生成概率模型,其中一系列可观测的变量由一系列内部隐藏状态生成。这些隐藏状态并不直接观察到。隐马尔可夫模型(Hidden Markov Model, HMM)是一种统计模型,在语音识别、行为识别、NLP、故障诊断等领域具有高效的性能。HMM是关于时序的概率模型,描述一个含有未知参数的马尔可夫链所生成的不可观测的状态随机序列,再由各个状态生成观测随机序列的过程。每个状态生成一个观测,由此产生的观测随机序列,被称为观测序列。HMM是一个双重随机过程---具有一定状态的隐马尔可夫链和随机的观测序列。

2024-03-12 20:59:29 640

原创 机器学习_10、集成学习-Bagging(自举汇聚法)

Bagging(Bootstrap Aggregating,自举汇聚法)是一种集成学习方法,由Leo Breiman于1996年提出。它旨在通过结合多个模型来提高单个预测模型的稳定性和准确性。Bagging方法特别适用于减少高方差模型(如决策树)的过拟合问题,从而提高模型的泛化能力。

2024-03-02 12:52:43 705

car-price-prediction.csv

数据集包含二手车的详细信息,包括多种特征和目标变量“Price”(价格)。以下是数据集中包含的各个特征的简要介绍: Levy: 车辆税金,单位不详,可能是年费或一次性费用。 Manufacturer: 车辆制造商(品牌)。 Prod. year: 车辆生产年份。 Category: 车辆类别,如轿车、SUV等。 Leather interior: 车辆是否有皮革内饰(Yes/No)。 Fuel type: 燃料类型,如汽油、柴油等。 Engine volume: 发动机排量(升)。 Mileage: 车辆里程数,单位为公里。 Cylinders: 发动机的气缸数。 Gear box type: 变速箱类型,如自动、手动等。 Drive wheels: 驱动轮类型,如前驱、后驱、四驱等。 Doors: 车门数量。 Wheel: 方向盘位置(左/右)。 Color: 车辆颜色。 Airbags: 安全气囊数量。 Price: 目标变量,车辆价格。 这些特征包括数值型特征和类别型特征,用于预测二手车的价格。具体来说: 数值型特征: Levy, Prod. year, Engine vol

2024-07-13

乳腺癌目标检测是医疗图像处理领域的一个重要应用

乳腺癌目标检测是医疗图像处理领域的一个重要应用,它能够帮助医生快速识别和定位乳腺组织中的肿瘤。YOLO(You Only Look Once)系列算法是一种非常流行的目标检测框架,以其速度快、性能好而闻名。对于小数据集的乳腺癌目标检测任务,YOLO系列算法同样适用,但可能需要一些特定的策略和技术来优化模型的性能。

2024-06-09

猫狗数据集cats-and-dogs-small.zip

猫狗数据集完全数据集cats_and_dogs_small.zip

2024-03-02

KNN完整的代码+电离层数据

KNN代码+数据

2024-01-11

JAVA-weka包.zip

JAVA-weka包.zip

2023-06-22

基于Weka的房价回归预测及案例分析.doc

基于Weka的房价回归预测及案例分析.doc

2023-06-22

JAVA课设使用weka包算法代码

JAVA课设使用weka包算法代码

2023-06-22

SQLServer 数据库实验1

SQLServer 数据库实验1

2023-03-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除