- 博客(15)
- 资源 (11)
- 收藏
- 关注
原创 基于LLama_factory的Qwen2.5大模型的微调笔记
模型的输出目录在你的 llama-factory 项目下的saves文件夹中。首先在 检查点路径选择你保存的某个checkpoint。首先在 检查点路径选择你保存的某个checkpoint。导出的模型是已经merge后的模型。模型验证 - 点击evaluate&predict。然后选择推理引擎、数据类型,点击加载模型即可对话。点击开始训练,模型就开始训练,可以观察损失变化。然后添加你的验证集路径,选择验证集,点击开始。选择你验证过的最好的checkpoint.模型推理 - 点击chat。
2024-11-21 16:17:38
2018
原创 windows7下安装pyspark步骤及可能遇到的问题。
windows7下安装pyspark步骤及可能遇到的问题具体安装步骤一、安装JDK二、安装scala三、安装Hadoop四、安装spark本文安装的各软件版本:jdk:1.8;spark:2.3.1;Hadoop:2.7.3具体安装步骤一、安装JDKjdk官网链接或者下载链接jdk1.8运行spark时,需要的JDK的安装目录不能带空格,要不然会报错。之前我的jdk安装目录是D:\Pr...
2020-05-06 17:01:39
423
原创 文本聚类算法
文本聚类算法(Python实现DBSCAN和K-Means)文本聚类算法分类使用DBSCAN进行文本聚类DBSCAN 算法介绍DBSCAN python实现使用K-Means进行文本聚类k-Means 算法介绍K-means Python实现文本聚类算法分类1、划分法(基于划分的聚类算法)给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K<N。而且...
2020-04-22 14:58:34
1407
原创 Linux环境Elasticsearch集群部署及kibana安装笔记
Elasticsearch集群部署及kibana安装笔记Elasticsearch集群部署部署步骤1. 使用root账户创建用户2. 上次相关安装包3. 安装java(如已经安装,可不需要重复)4. 安装ES5. JVM 配置6. 修改系统配置7. 启动elasticsearch安装kibanaElasticsearch集群部署部署步骤1. 使用root账户创建用户 命令如下: gr...
2020-03-27 15:50:07
511
1
原创 Torchtext 库简单文本预处理
Torchtext 库简单文本预处理TorchText 的数据预处理流程常规步骤:TorchText 的数据预处理流程TorchText 的数据预处理流程为:定义样本的处理操作。—> torchtext.data.Field加载 corpus (都是 string)—> torchtext.data.Datasets在Datasets 中,torchtext 将 corpus...
2020-03-27 12:12:23
828
转载 WMD算法原理
WMD(Word Mover’s Distance)算法原理文章主要是自己在学习过程中摘录做的笔记。参考连接:WMD算法详解1. WMD的直观理解两段文字D1D1D1,D2D2D2,每段文字中的字都使用word2vec算法映射到embedding空间中。并且我们在D1D1D1中的每一个词都能找到D2D2D2中的某一个词,那么我们就可以找到每一对词在embedding空间中的距离,那么所有...
2019-10-25 15:15:16
6502
原创 XLNet原理详解
XLNet原理详解1. 什么是XLNet2.自回归语言模型(Autoregressive LM)3. 自编码语言模型4. XLNet模型4.1 排列语言模型(permutation language Modeling)4.2 双流注意力机制4.2.1 引例:4.2.2 双流注意力机制4.2.3 部分预测4.3Transform-XL4.3.1 Transform4.3.2 Transform XL...
2019-10-14 17:11:36
3044
原创 BERT原理详解
BERT原理详解一、BERT原理1.1 BERT原理网上关于BERT的模型讲的好的很多参考BERT模型学习与分析谷歌BERT模型深度解析彻底搞懂BERT1.2 BERT 和 OpenAI GPT 区别与联系这里简单描述一下BERT和OpenAI GPT模型区别与联系BERT和GPT 都是使用了Transformer结构,Transform的Encoder和Decoder是有区别...
2019-10-11 18:01:28
1663
原创 OpenAI-GPT原理详解
OpenAI-GPT原理详解本文参考一、前言二、基础知识三、OpenAI GPT3.1 OpenAI GPT 原理3.2 OpenAI GPT模型结构3.2.1 非监督预训练3.2.2 监督微调fine-tuning3.2.3 改造OpenAI GPT用于下游NLP任务本文参考OpenAI GPT算法原理解析openai-GPT模型一、前言本文对论文《Improving Language...
2019-10-11 16:01:25
5970
转载 ELMO原理介绍
ELMO原理介绍一、引言1.1 从Word Embedding到ELMO二、ELMO2.1 ELMO原理2.2 ELMO 训练2.2.1 第一阶段 语言模型进行预训练2.2.2 第二阶段 接入下游NLP任务2.3 ELMO效果一、引言1.1 从Word Embedding到ELMOWord Embedding:词嵌入。最简单粗劣的理解就是:将词进行向量化表示,实体的抽象成了数学描述,就可以进...
2019-10-11 11:36:22
1707
转载 word2Vector的原理详解
word2Vector的原理详解原型:NNLM(Neural Network Language Model)这个模型其实就是一个结构简单的神经网络,MLP模型。输入层,隐藏层(也许有两层,看个人设计),接softmax输出。它的作用是通过前 N-1 个词,推测出第 N 个词是什么。举个栗子,有一句话 “我今天中午吃的涮羊肉”。这个词要输出模型的话得把它先分词,分词成”我“, ”今天“,...
2019-10-11 10:26:55
808
1
转载 BILSTM原理介绍
BILSTM介绍转载:https://www.jiqizhixin.com/articles/2018-10-24-13一、介绍1.1 什么是LSTM和BILSTM?1.2 为什么使用LSTM与BILSTM?二、BILSTM原理简介2.1 LSTM介绍2.1.1 总体框架2.1.2 详细介绍计算过程2.2 BILSTM介绍转载:https://www.jiqizhixin.com/article...
2019-10-10 17:51:56
10805
hadoop2.7_windows-master.zip
2020-05-06
tensorflow-1.10.1-cp35-cp35m-manylinux1_x86_64.whl
2020-03-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人