自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 资源 (2)
  • 收藏
  • 关注

原创 DPO介绍+公式推理

DPO到底是什么?我们先看看训练DPO需要的数据集形式:给一个提示词,给两个选择,chosen是人选的,rejected是人不选的,现在希望LLM也能像人一样选对,这就是对齐人类偏好。之前的解决方案是RLHF,但是RLHF需要用到PPO算法,而PPO算法需要训练策略网络和价值网络,训练成本过高,而PPO是一种成本低很多,而且很简单的方式。先上公式:KL(P∣∣Q)=∑x∈XP(x)log⁡(P(x)Q(x)) KL(P||Q)=\sum_{x\in X}P(x)\log\left(\frac{P(

2025-03-28 22:24:45 726

原创 优雅的从huggingface上下载文件

【代码】优雅的从huggingface上下载文件。

2025-02-25 10:48:02 538

原创 GRPO详解

GRPO相对于PPO做了很多优化,极大的节约了成本。。。

2025-02-20 12:31:11 955

原创 强化学习的几个主要方法(策略梯度、PPO、REINFORCE实现等)(下)

主要介绍了PPO算法

2024-12-02 21:07:20 520

原创 强化学习的几个主要方法(策略梯度、PPO、REINFORCE实现等)(上)

本文主要介绍了几种强化学习算法和其数学理论

2024-12-02 21:05:00 1022

原创 信息量、熵、KL散度、交叉熵、交叉熵损失函数的概念

在LLM中N表示序列长度。用log主要是为了满足。为基准,衡量概率系统。

2024-11-27 13:23:03 381

原创 huggingface利用bert-base-chinese实现中文情感分类

函数中我多加了个参数,labels,因为数据集里面是携带labels的,而且huggingface的特定任务模型也是接受labels这个参数的,如果不加可能不适应huggingface的trainer的调用。数据集是从huggingface下载的,无需进入Dataset类进行额外变换,只需要做一些简单的预处理。先做一些数据预处理工作,本文主要使用的数据集是。

2024-11-01 13:21:00 843 1

原创 HuggingFace情感分析任务微调

先将模型加载进来简单计算下参数量325.524482参数量大概是325.5M模型加载进来后进行简单的试算data = {定义训练参数# 参数在用colab或者kaggle时注意要加上,不然会让你输入api key,比较麻烦构建训练器上面的训练器中出现了一个常用的对象,它的主要功能是将不同长度的序列补齐到同一长度,自动处理padding,使得一个batch内的所有样本长度一致。这里可以测试一下# 测试数据整理函数1031621715195长度全部都补齐到171了可以解码看看。

2024-10-31 10:58:01 1187

原创 把C盘从huggingface的逆天缓存中解放出来!

仅针对windows添加环境变量V填自己想要保存的路径完事了保存重启生效。

2024-10-22 16:21:23 323

原创 对Transformer的一些理解

Transformer学习笔记

2024-07-02 15:21:54 1204

原创 格式化输出软件

输入文件名字,生成一个”当前时间+文件名“的格式化内容到剪贴板方便改名。主界面有个复选框,勾选后会生成”文件名+当前时间“的内容。一个给图片修改名字的小软件。

2024-06-26 13:30:30 200

原创 基于附带Attention机制的seq2seq模型架构实现英译法的案例

基于Attention机制的英译法案例

2024-05-25 18:15:19 367 1

原创 传统RNN网络及其案例--人名分类

先上图这图看起来莫名其妙,想拿着跟CNN对比着学第一眼看上去有点摸不着头脑,其实我们可以把每一个时刻的图展开来,如下其中,为了简化计算,我们默认每一个隐层参数相同,这样看来RNN的结构就比较简单了,相比较CNN来说,RNN引入了更多的时序信息。

2024-05-22 21:07:01 1243 3

原创 提示工程概要

这篇博客是关于使用大型语言模型进行提示工程的指南。指南包括两大原则:编写清晰具体的说明和给模型足够的时间思考。其中,编写清晰具体的说明包括使用分隔符、要求结构化输出、检查条件是否满足以及提供少量样本提示等内容。给模型足够的时间思考则包括指定任务完成的步骤和指示模型在给出结论之前提出解决方案。此外,指南还提到了避免幻觉现象的重要性以及通过迭代改进提示的方法。除此之外,还介绍了使用大型语言模型进行摘要、推理、转换和扩展的方法,以及在创建聊天机器人时需要考虑的疑点解决方法。

2024-04-05 22:27:13 669 1

原创 P、NP、NP-hard、NP-complete

NP-complete问题:若一个问题同时属于NP问题也属于NP-hard问题,那么这个问题就是NP-complete类问题。NP-hard问题:所有的NP类问题都可以化约NP-hard问题,一般比NP问题难。NP问题:多项式时间内可以验证解的问题。P问题:多项式时间内可以解决的问题。

2024-03-23 13:11:45 248

原创 更加适合CUDA11.2的pytorch显卡版本

【代码】更加适合CUDA11.2的pytorch显卡版本。

2024-01-07 16:27:20 2400 6

转载 DataNode无法启动的原因

datanode无法启动

2023-02-26 21:04:46 494

原创 解决python命令行报错问题

可以看到主要的报错信息。的文件的第82行,加上。保存再次运行就没问题了。

2022-09-05 12:33:20 734

原创 免费的云产品

免费云产品

2022-08-12 11:53:10 470 2

原创 为给git设置代理

为git设置代理

2022-08-12 11:05:51 871

原创 快速排序的C语言实现(严蔚敏教材版)

快速排序的C语言实现(严蔚敏教材版)#include<stdio.h>#define Elemtype int//一趟划分int Partition(Elemtype Array[], int low, int high){ Elemtype pivot = Array[low]; //将当前表中第一个元素设为枢纽,对表进行划分 while(low < high) { while(low < high && Array[hi

2022-05-17 23:17:29 397

原创 软件工程实践—软件评测

IT 人士都会写文章,写技术文档,实验报告,等等。 写博客谁都会,那么,哪家的博客编辑器最好? 大家都听说了 Markdown 这种高效率的文档风格,优快云 的 Markdown 编辑器好用么?它对于各种文件格式,插入图像,动画,表格,代码块的支持如何? 你作为一个开始写博客的人, 发现了什么问题?请写一个详细的博客描述你碰到的问题,以及改进的建议。目录第一部分 调研,评测1.1 网页端博客编辑器调研(Markdown)1.1.1思否1.1.2 博客园1.1.3 掘金1.2 博客编辑器软件调研(Ma.

2022-04-22 14:34:43 644 2

原创 基于单链表简单实现栈

#include<stdio.h>#include<stdlib.h>#define ElemType inttypedef struct LNode{ ElemType data; LNode *next;}LNode, *Linklist;bool init_linklist(Linklist &linklist);bool list_headInsert(Linklist &linklist, ElemType data);b

2022-03-17 23:45:04 679

原创 单链表的基本操作

#include<stdio.h>#include<stdlib.h>#define ElemType inttypedef struct LNode{ ElemType data; LNode *next;}LNode, *Linklist;bool init(Linklist &linklist) { linklist->next = NULL; return true;}// 头插法bool list_hea

2022-03-16 23:35:29 454

原创 unp.h网络运行环境搭建

unp.h的安装以及第一个程序的运行源代码下载以及编译点击此处下载源代码解压到本地文件夹,如果访问不了GitHub的话就用我搬到gitee的仓库吧git clone https://gitee.com/Find-ing/unpv13e.git直接这样就不用解压了这里可以看看README按照README上的顺序首先执行./configure然后cd libmakecd ../libfreemakecd ../libroutemake如果出现了错误,就再来一次cd .

2022-03-02 23:56:38 928 1

原创 Linux创建新用户时遇到的问题记录

创建新用户命令:useradd -d "/home/guest" -m -s "/bin/bash" guest报错:useradd: cannot open /etc/passwd按照网上的解决方案:chattr -ia /etc/passwd此时/etc/passwd的属性:--------------e----- /etc/passwd继续执行:useradd -d "/home/guest" -m -s "/bin/bash" guest继续报错:useradd: c

2022-03-02 20:54:13 1035

原创 C语言自动编译执行脚本

C语言自动编译执行脚本在Linux上面用命令行写一些简单的C语言程序,总是遇到一个问题,代码写完后要先编译后运行,而且编译生成的可执行文件默认还是a.out,自己去加参数去改有觉得十分麻烦,所以干脆就写了个脚本来帮我把这些麻烦的事情做了#!/bin/bashfilename=$1location=$(pwd)cd $location# echo $locationgcc $filename -o ${filename/c/out}./${filename/c/out}随便新建一个文件我把

2022-03-01 22:21:00 2432

原创 Thymelef命名空间引入

<html lang="zh" xmlns:th="http://www.thymeleaf.org">

2021-12-11 13:47:18 538

原创 SpringBoot打包maven仓库里面没有的包

SpringBoot打包maven仓库里面没有的包在遇到一些自定义的jar包,maven仓库里面没有这些包,但是发布线上时我们还是只想发布一个jar包,也就是我们想要把第三方包打在最后生成的大jar包里在根目录新建一个lib目录,把jar包放入lib目录在pom.xml里面先放入这段代码表示导入这个包,从根目录的lib文件夹里面导 <dependency> <groupId>com.arcsoft.face</groupI

2021-12-10 10:07:20 449

原创 卷积神经网络中nn.Conv2d()和nn.MaxPool2d()以及卷积神经网络实现minist数据集分类

卷积神经网络中nn.Conv2d()和nn.MaxPool2d()卷积神经网络之Pythorch实现:nn.Conv2d()就是PyTorch中的卷积模块参数列表参数作用in_channels输入数据体的深度out_channels输出数 据体的深度kernel_size滤波器(卷积核)的大小 注1stride滑动的步长padding零填充的圈数 注2bias是否启用偏置,默认是True,代表启用groups输出数据体深度上和输入

2021-12-03 23:18:47 2419

原创 LetNet、Alex、VggNet分析及其pytorch实现

简单分析一下主流的几种神经网络LeNetLetNet作为卷积神经网络中的HelloWorld,它的结构及其的简单,1998年由LeCun提出基本过程:可以看到LeNet-5跟现有的conv->pool->ReLU的套路不同,它使用的方式是conv1->pool->conv2->pool2再接全连接层,但是不变的是,卷积层后紧接池化层的模式依旧不变。代码:import torch.nn as nnimport torchclass LeNet(nn.M

2021-12-03 23:13:18 1087

原创 nn.Conv2d()中dilation参数的作用

nn.Conv2d()中dilation参数的作用下面这张图很好的描述了这个参数的作用好处:这样每次进行单次计算时覆盖的面积(感受域)增大,最开始时3*3 = 9 然后是5*5 = 25最后是7*7=49,增加了感受域却并未增加计算量,保留了更多的细节信息,对图像还原有明显的提升。...

2021-12-01 11:23:36 4462

原创 全连接神经网络学习笔记

全连接神经网络前馈神经网络包含的层:线性层和卷积层:这两种层对输入进行线性计算。层内维护着线性运算的权重激活层:这层对数据进行非线性运算。非线性运算时可以逐元素非线性运算的,也可以是其它类习惯的非线性运算归一化层:根据输入的均值和方差对数据进行归一化,使得数据的范围在一个相对固定的范围内池化层和视觉层:这两种层和数据重采样有关,包括对数据进行下采样(就是隔几个数据采一个数据)、上采样(把一个数据复制出很多份)和重新排序。丢弃层:在输入中随机选择一些输出补齐层:采用循环补齐等方法让数据变多

2021-11-28 20:10:30 1057

原创 线性回归学习学习笔记及其入门案例

线性回归最小二乘法使用torch.lstsq()求解线性回归问题两个重要推论与权值点乘X[i,:]⋅W=x[i,0]w[0]+x[i,1]w[1]+……+x[i,m−1]w[m−1]+x[i,m]w[m] X[i, :]·W = x[i, 0]w[0] + x[i, 1]w[1] + …… + x[i, m-1]w[m-1] + x[i, m]w[m] X[i,:]⋅W=x[i,0]w[0]+x[i,1]w[1]+……+x[i,m−1]w[m−1]+x[i,m]w[m]二范数的计算方法∣∣Y

2021-11-27 14:06:14 1268

原创 数据库设置一个触发器记录最后一次更改时间

数据库设置一个触发器用于记录最后一次更改时间CREATE TRIGGER 触发器名BEFORE UPDATE ON表名 FOR EACH ROWBEGIN SET NEW.字段名=now();END

2021-11-20 14:44:26 879

原创 一个Java发送邮件的案例

经常有些要发送邮件的需求,但是去网上拷代码老是拷不到能直接运行的,还经常要去以前的项目里面拷,今天直接发出来算了,免得每次都要去别的项目拷。(只支持发送简单的文本文件,发附件的稍微复杂一丢丢,这里就不贴出来了)依赖:<dependency> <groupId>javax.mail</groupId> <artifactId>mail</artifactId> <version>1.5.0-b01</v

2021-11-13 18:39:32 541

原创 KNN聚类

K-Means聚类算法代码:import pandas as pdimport random as rdimport matplotlib.pyplot as pltfrom matplotlib.pylab import styleiris_data = pd.read_csv("iris.csv", header=None, usecols=[0, 2, 4])iris_data[5] = -1# 设置初始距离iris_data[6] = 10000data = iris_dat

2021-11-08 20:18:39 662

原创 数据库连接时遇到的专有名词解释

JdbcTemplate 、Mybatis、ORM 、Druid 、HikariCP 、Hibernate是什么?它们有什么关系?学完Spring和SpringMVC之后,就急于求成的开始学习起SpringBoot而暂时忽略了Mybatis,然后在SpringBoot的学习过程中就开始对这些框架感到非常的迷惑,主要集中于一下几个东西:JdbcTemplate、Mybatis、ORM、Druid、HikariCP、Hibernate以至于晕晕乎乎的看了很多博客之后连最开始学的jdbc是什么都有点迷惑了,

2021-11-07 13:32:58 339

原创 KNN算法实现对iris数据集的预测

KNN算法的实现第一次写机器学习算法,写的是KNN预测iris数据集、不会矩阵运算,实现起来很呆,但是总归还是实现了import pandas as pdfrom math import distk = int(input("请输入k值(不能输入三的倍数!):"))dataTest = pd.read_csv('iristest.csv', header=None).valuestrainData = pd.read_csv('iristrain.csv', header=None).valu

2021-10-29 10:44:52 870

原创 BFS实现迷宫问题

BFS实现迷宫问题问题描述,要求从起点走到终点,找出最短的距离,要避开障碍输入描述,输入一个二维数组表示地图,其中等于10就是终点,等于-10就是起点,等于1就是障碍,等于0就是可以走的代码:import java.util.LinkedList;import java.util.Queue;/** * @author xuziao * @date 2021/10/17 19:40 */public class BFS { public static int getShort

2021-10-19 16:04:42 170

一个自己编写的计时器程序

一个自己编写的计时器程序

2021-01-12

sqlyog数据库管理

sqlyog数据库管理

2021-01-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除