Sout xza-优快云博客

原创 tmux 恢复鼠标滚轮

在 Tmux 默认配置下，鼠标滚轮通常只能滚动终端模拟器的 Viewport，无法查看 Pane 内部的历史输出。这是因为 Tmux 默认未捕获鼠标事件。以下是开启鼠标支持的方法、原理及副作用处理。

2025-12-09 15:55:24 454

原创 Fish shell的abbr命令行参数介绍和Bat文件查看工具

Fish Shell 的 abbr 命令手册提供了创建和管理命令缩写的完整指南。主要功能包括：添加/删除缩写（-a/-e）、列出所有缩写（-l/-s）、设置作用域（全局-g/通用-U）以及高级功能如正则匹配（-r）和函数扩展（-f）。手册还详细介绍了在配置文件中持久化缩写的方法，提供了 Git、系统命令等实用示例，并给出最佳实践建议，如按类别组织、添加注释和版本控制配置。通过abbr命令可以显著提高命令行效率，特别是结合-U参数可实现跨会话的缩写持久化。

2025-08-10 15:04:40 1026

原创 DPO介绍+公式推理

DPO到底是什么？我们先看看训练DPO需要的数据集形式：给一个提示词，给两个选择，chosen是人选的，rejected是人不选的，现在希望LLM也能像人一样选对，这就是对齐人类偏好。之前的解决方案是RLHF，但是RLHF需要用到PPO算法，而PPO算法需要训练策略网络和价值网络，训练成本过高，而PPO是一种成本低很多，而且很简单的方式。先上公式：KL(P∣∣Q)=∑x∈XP(x)log⁡(P(x)Q(x)) KL(P||Q)=\sum_{x\in X}P(x)\log\left(\frac{P(

2025-03-28 22:24:45 1077

原创优雅的从huggingface上下载文件

【代码】优雅的从huggingface上下载文件。

2025-02-25 10:48:02 1799

原创 GRPO详解

GRPO相对于PPO做了很多优化，极大的节约了成本。。。

2025-02-20 12:31:11 1496

原创强化学习的几个主要方法（策略梯度、PPO、REINFORCE实现等）（下）

主要介绍了PPO算法

2024-12-02 21:07:20 941

原创强化学习的几个主要方法（策略梯度、PPO、REINFORCE实现等）（上）

本文主要介绍了几种强化学习算法和其数学理论

2024-12-02 21:05:00 1231

原创信息量、熵、KL散度、交叉熵、交叉熵损失函数的概念

在LLM中N表示序列长度。用log主要是为了满足。为基准，衡量概率系统。

2024-11-27 13:23:03 429

原创 huggingface利用bert-base-chinese实现中文情感分类

函数中我多加了个参数，labels，因为数据集里面是携带labels的，而且huggingface的特定任务模型也是接受labels这个参数的，如果不加可能不适应huggingface的trainer的调用。数据集是从huggingface下载的，无需进入Dataset类进行额外变换，只需要做一些简单的预处理。先做一些数据预处理工作，本文主要使用的数据集是。

2024-11-01 13:21:00 1276 1

原创 HuggingFace情感分析任务微调

先将模型加载进来简单计算下参数量325.524482参数量大概是325.5M模型加载进来后进行简单的试算data = {定义训练参数# 参数在用colab或者kaggle时注意要加上，不然会让你输入api key，比较麻烦构建训练器上面的训练器中出现了一个常用的对象，它的主要功能是将不同长度的序列补齐到同一长度，自动处理padding，使得一个batch内的所有样本长度一致。这里可以测试一下# 测试数据整理函数1031621715195长度全部都补齐到171了可以解码看看。

2024-10-31 10:58:01 1396

原创把C盘从huggingface的逆天缓存中解放出来！

仅针对windows添加环境变量V填自己想要保存的路径完事了保存重启生效。

2024-10-22 16:21:23 510

原创对Transformer的一些理解

Transformer学习笔记

2024-07-02 15:21:54 1624

原创格式化输出软件

输入文件名字，生成一个”当前时间+文件名“的格式化内容到剪贴板方便改名。主界面有个复选框，勾选后会生成”文件名+当前时间“的内容。一个给图片修改名字的小软件。

2024-06-26 13:30:30 252

原创基于附带Attention机制的seq2seq模型架构实现英译法的案例

基于Attention机制的英译法案例

2024-05-25 18:15:19 453 1

原创传统RNN网络及其案例--人名分类

先上图这图看起来莫名其妙，想拿着跟CNN对比着学第一眼看上去有点摸不着头脑，其实我们可以把每一个时刻的图展开来，如下其中，为了简化计算，我们默认每一个隐层参数相同，这样看来RNN的结构就比较简单了，相比较CNN来说，RNN引入了更多的时序信息。

2024-05-22 21:07:01 1412 3

原创提示工程概要

这篇博客是关于使用大型语言模型进行提示工程的指南。指南包括两大原则：编写清晰具体的说明和给模型足够的时间思考。其中，编写清晰具体的说明包括使用分隔符、要求结构化输出、检查条件是否满足以及提供少量样本提示等内容。给模型足够的时间思考则包括指定任务完成的步骤和指示模型在给出结论之前提出解决方案。此外，指南还提到了避免幻觉现象的重要性以及通过迭代改进提示的方法。除此之外，还介绍了使用大型语言模型进行摘要、推理、转换和扩展的方法，以及在创建聊天机器人时需要考虑的疑点解决方法。

2024-04-05 22:27:13 711 1

原创 P、NP、NP-hard、NP-complete

NP-complete问题：若一个问题同时属于NP问题也属于NP-hard问题，那么这个问题就是NP-complete类问题。NP-hard问题：所有的NP类问题都可以化约NP-hard问题，一般比NP问题难。NP问题：多项式时间内可以验证解的问题。P问题：多项式时间内可以解决的问题。

2024-03-23 13:11:45 281

原创更加适合CUDA11.2的pytorch显卡版本

【代码】更加适合CUDA11.2的pytorch显卡版本。

2024-01-07 16:27:20 2990 6

转载 DataNode无法启动的原因

datanode无法启动

2023-02-26 21:04:46 553

原创解决python命令行报错问题

可以看到主要的报错信息。的文件的第82行，加上。保存再次运行就没问题了。

2022-09-05 12:33:20 813

原创免费的云产品

免费云产品

2022-08-12 11:53:10 498 2

原创为给git设置代理

为git设置代理

2022-08-12 11:05:51 951

原创快速排序的C语言实现（严蔚敏教材版）

快速排序的C语言实现（严蔚敏教材版）#include<stdio.h>#define Elemtype int//一趟划分int Partition(Elemtype Array[], int low, int high){ Elemtype pivot = Array[low]; //将当前表中第一个元素设为枢纽，对表进行划分 while(low < high) { while(low < high && Array[hi

2022-05-17 23:17:29 431

原创软件工程实践—软件评测

IT 人士都会写文章，写技术文档，实验报告，等等。写博客谁都会，那么，哪家的博客编辑器最好？大家都听说了 Markdown 这种高效率的文档风格，优快云的 Markdown 编辑器好用么？它对于各种文件格式，插入图像，动画，表格，代码块的支持如何？你作为一个开始写博客的人，发现了什么问题？请写一个详细的博客描述你碰到的问题，以及改进的建议。目录第一部分调研，评测1.1 网页端博客编辑器调研（Markdown）1.1.1思否1.1.2 博客园1.1.3 掘金1.2 博客编辑器软件调研（Ma.

2022-04-22 14:34:43 724 2

原创基于单链表简单实现栈

#include<stdio.h>#include<stdlib.h>#define ElemType inttypedef struct LNode{ ElemType data; LNode *next;}LNode, *Linklist;bool init_linklist(Linklist &linklist);bool list_headInsert(Linklist &linklist, ElemType data);b

2022-03-17 23:45:04 708

原创单链表的基本操作

#include<stdio.h>#include<stdlib.h>#define ElemType inttypedef struct LNode{ ElemType data; LNode *next;}LNode, *Linklist;bool init(Linklist &linklist) { linklist->next = NULL; return true;}// 头插法bool list_hea

2022-03-16 23:35:29 478

原创 unp.h网络运行环境搭建

unp.h的安装以及第一个程序的运行源代码下载以及编译点击此处下载源代码解压到本地文件夹，如果访问不了GitHub的话就用我搬到gitee的仓库吧git clone https://gitee.com/Find-ing/unpv13e.git直接这样就不用解压了这里可以看看README按照README上的顺序首先执行./configure然后cd libmakecd ../libfreemakecd ../libroutemake如果出现了错误，就再来一次cd .

2022-03-02 23:56:38 992 1

原创 Linux创建新用户时遇到的问题记录

创建新用户命令：useradd -d "/home/guest" -m -s "/bin/bash" guest报错：useradd: cannot open /etc/passwd按照网上的解决方案：chattr -ia /etc/passwd此时/etc/passwd的属性：--------------e----- /etc/passwd继续执行：useradd -d "/home/guest" -m -s "/bin/bash" guest继续报错：useradd: c

2022-03-02 20:54:13 1081

原创 C语言自动编译执行脚本

C语言自动编译执行脚本在Linux上面用命令行写一些简单的C语言程序，总是遇到一个问题，代码写完后要先编译后运行，而且编译生成的可执行文件默认还是a.out，自己去加参数去改有觉得十分麻烦，所以干脆就写了个脚本来帮我把这些麻烦的事情做了#!/bin/bashfilename=$1location=$(pwd)cd $location# echo $locationgcc $filename -o ${filename/c/out}./${filename/c/out}随便新建一个文件我把

2022-03-01 22:21:00 2537

原创 Thymelef命名空间引入

2021-12-11 13:47:18 568

原创 SpringBoot打包maven仓库里面没有的包

SpringBoot打包maven仓库里面没有的包在遇到一些自定义的jar包，maven仓库里面没有这些包，但是发布线上时我们还是只想发布一个jar包，也就是我们想要把第三方包打在最后生成的大jar包里在根目录新建一个lib目录，把jar包放入lib目录在pom.xml里面先放入这段代码表示导入这个包，从根目录的lib文件夹里面导 <dependency> <groupId>com.arcsoft.face</groupI

2021-12-10 10:07:20 491

原创卷积神经网络中nn.Conv2d()和nn.MaxPool2d()以及卷积神经网络实现minist数据集分类

卷积神经网络中nn.Conv2d()和nn.MaxPool2d()卷积神经网络之Pythorch实现：nn.Conv2d()就是PyTorch中的卷积模块参数列表参数作用in_channels输入数据体的深度out_channels输出数据体的深度kernel_size滤波器（卷积核）的大小注1stride滑动的步长padding零填充的圈数注2bias是否启用偏置，默认是True，代表启用groups输出数据体深度上和输入

2021-12-03 23:18:47 2544

原创 LetNet、Alex、VggNet分析及其pytorch实现

简单分析一下主流的几种神经网络LeNetLetNet作为卷积神经网络中的HelloWorld,它的结构及其的简单，1998年由LeCun提出基本过程:可以看到LeNet-5跟现有的conv->pool->ReLU的套路不同，它使用的方式是conv1->pool->conv2->pool2再接全连接层，但是不变的是，卷积层后紧接池化层的模式依旧不变。代码：import torch.nn as nnimport torchclass LeNet(nn.M

2021-12-03 23:13:18 1130

原创 nn.Conv2d()中dilation参数的作用

nn.Conv2d()中dilation参数的作用下面这张图很好的描述了这个参数的作用好处：这样每次进行单次计算时覆盖的面积（感受域）增大，最开始时3*3 = 9 然后是5*5 = 25最后是7*7=49，增加了感受域却并未增加计算量，保留了更多的细节信息，对图像还原有明显的提升。...

2021-12-01 11:23:36 4617

原创全连接神经网络学习笔记

全连接神经网络前馈神经网络包含的层：线性层和卷积层：这两种层对输入进行线性计算。层内维护着线性运算的权重激活层：这层对数据进行非线性运算。非线性运算时可以逐元素非线性运算的，也可以是其它类习惯的非线性运算归一化层：根据输入的均值和方差对数据进行归一化，使得数据的范围在一个相对固定的范围内池化层和视觉层：这两种层和数据重采样有关，包括对数据进行下采样（就是隔几个数据采一个数据）、上采样（把一个数据复制出很多份）和重新排序。丢弃层：在输入中随机选择一些输出补齐层：采用循环补齐等方法让数据变多

2021-11-28 20:10:30 1223

原创线性回归学习学习笔记及其入门案例

线性回归最小二乘法使用torch.lstsq()求解线性回归问题两个重要推论与权值点乘X[i,:]⋅W=x[i,0]w[0]+x[i,1]w[1]+……+x[i,m−1]w[m−1]+x[i,m]w[m] X[i, :]·W = x[i, 0]w[0] + x[i, 1]w[1] + …… + x[i, m-1]w[m-1] + x[i, m]w[m] X[i,:]⋅W=x[i,0]w[0]+x[i,1]w[1]+……+x[i,m−1]w[m−1]+x[i,m]w[m]二范数的计算方法∣∣Y

2021-11-27 14:06:14 1336

原创数据库设置一个触发器记录最后一次更改时间

数据库设置一个触发器用于记录最后一次更改时间CREATE TRIGGER 触发器名BEFORE UPDATE ON表名 FOR EACH ROWBEGIN SET NEW.字段名=now();END

2021-11-20 14:44:26 932

原创一个Java发送邮件的案例

经常有些要发送邮件的需求，但是去网上拷代码老是拷不到能直接运行的，还经常要去以前的项目里面拷，今天直接发出来算了，免得每次都要去别的项目拷。（只支持发送简单的文本文件，发附件的稍微复杂一丢丢，这里就不贴出来了）依赖：<dependency> <groupId>javax.mail</groupId> <artifactId>mail</artifactId> <version>1.5.0-b01</v

2021-11-13 18:39:32 575

原创 KNN聚类

K-Means聚类算法代码：import pandas as pdimport random as rdimport matplotlib.pyplot as pltfrom matplotlib.pylab import styleiris_data = pd.read_csv("iris.csv", header=None, usecols=[0, 2, 4])iris_data[5] = -1# 设置初始距离iris_data[6] = 10000data = iris_dat

2021-11-08 20:18:39 696

原创数据库连接时遇到的专有名词解释

JdbcTemplate 、Mybatis、ORM 、Druid 、HikariCP 、Hibernate是什么？它们有什么关系？学完Spring和SpringMVC之后，就急于求成的开始学习起SpringBoot而暂时忽略了Mybatis，然后在SpringBoot的学习过程中就开始对这些框架感到非常的迷惑，主要集中于一下几个东西：JdbcTemplate、Mybatis、ORM、Druid、HikariCP、Hibernate以至于晕晕乎乎的看了很多博客之后连最开始学的jdbc是什么都有点迷惑了，

2021-11-07 13:32:58 362

一个自己编写的计时器程序

sqlyog数据库管理

空空如也