自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_48435461的博客

原创 Mac查看本机发出请求的IP地址

【代码】Mac查看本机发出请求的IP地址。

2025-10-11 10:33:29 412

原创 VScode通过跳板机连接内网服务器

内网服务器无法通过穿透暴露在公网，需要远程开发可以在内网环境中配置一个可以连接公网的跳板机，进行远程开发。

2025-09-29 19:21:25 263

原创 vscode命令行debug

一般命令行debug会在远程连服务器的时候用上，命令行debug的本质是在执行时暴露一个监听端口，通过进入这个端口，像本地调试一样进行。

2025-05-30 16:57:00 1032

原创 clamav服务器杀毒（Linux服务器断网状态下如何进行clamav安装、查杀）

clamav服务器杀毒，Linux版本杀毒软件，该文章介绍了如何在需要进行杀毒的服务器断网状态下，使用clamav进行杀毒

2025-03-21 20:47:57 869

原创 cudatoolkit安装（nvcc -V错误版本解决）

cudatoolkit安装，nvcc -V显示错误版本修改

2024-11-23 19:14:06 1548

原创 Linux服务器配置国内镜像，“暂时不能解析域名“报错解决

sudo apt镜像配置，“暂时不能解析域名”报错问题解决

2024-11-23 17:41:15 1038

原创 Linux服务器驱动安装

在服务器上安装显卡驱动，使得nvidia-smi可以读卡

2024-11-23 16:15:49 2004

原创 Adam优化器理解和代码实现

Adam优化器的公式理解和代码实现

2024-11-21 15:20:17 2003

原创模型训练中数据并行（DP）、模型并行（MP）、管道并行（PP）理解

在模型训练中，DP（Data Parallelism）、MP（Model Parallelism）、和 PP（Pipeline Parallelism）是三种常见的并行训练技术是三种常见的并行训练技术，主要用于分布式训练和大模型训练，以解决资源限制和训练效率问题。

2024-11-20 19:37:11 2031

原创 Linux光标快捷键

删除前后字符并移动光标。

2024-11-20 15:01:06 676

原创 frp内网穿透快速启动

将 `./frpc -c ./frpc.toml` 配置成 `systemd` 的服务脚本并设置开机自启动

2024-11-19 16:15:46 970

原创 docker启动训练容器教程

docker拉取镜像（配置代理）、启动容器（让容器识别GPU）、配置容器conda环境

2024-11-16 20:56:00 1254

原创 nvidia显卡打开、关闭图形界面

关闭、开启服务器图形显示Xorg；可以外接显示器

2024-11-12 09:05:25 1294

原创 ubuntu命令行调节风扇转速（不需要下载插件）

命令行调节服务器gpu风扇转速，无需额外下载其他插件

2024-11-10 17:09:05 2628

原创 MPC模型预测控制与RL强化学习的差异性

模型预测控制（MPC）与强化学习（RL）差异性调研

2024-10-28 22:37:24 1025

原创 Let‘s Verify Step by Step（openai-o1论文技术调研）

openai-o1技术论文调研，阅读笔记

2024-10-28 22:17:30 1654

原创 Don‘t Hallucinate,Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration（ACL杰出论文奖）

Don’t Hallucinate, Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration，ACL杰出论文奖获奖论文，阅读总结笔记

2024-10-18 16:21:22 1330

原创 Casual Estimation of Memorisation Profiles（ACL最佳论文）

Causal Estimation of Memorisation Profiles，ACL最佳论文获奖论文，阅读总结笔记

2024-10-18 15:20:34 926

原创 Linux查看当前目录中的文件大小

统计当前文件夹(目录)大小，并按文件大小排序。

2024-10-10 22:19:58 420 1

原创并发调用大模型API接口

对大模型API接口的并发调用，速度可以快一倍以上。

2024-08-16 11:12:10 1397

原创 ASR(Automatic Speech Recognition)调研，当前sota的架构

本文主要讲述nvidia和openai的模型架构，应为他们两家霸榜。小白也能阅读了解一下当前sota的asr架构是什么样的。

2024-08-05 16:20:02 2655

原创 TypeError Cannot read property ‘getUserMedia‘ of undefined

使用Chrome参数开启可以解决这个问题，在浏览器框中输入下述代码。将你需要访问的IP填入后重启浏览器，就能解决报错。所以直接访问ip地址会出现报错。localhost正常访问。

2024-08-01 09:07:09 667

原创完全移动huggingface模型仓库（不是简单mv）

我重新创建了新的映射文件到新的模型目录中，然后以此类推操作，将所有模型的权重都重新映射，则可以完全转移模型。路径一定要绝对路径，不要出现。可以看到粉色的条目就是映射路径。在你下载的模型目录中，输入。中，因此需要修改映射。然后加入新的映射路径。

2024-07-25 15:37:01 685

原创 vllm减小显存 | vllm小模型大显存问题

这也是为什么有时候你跑1.5b模型也会显存拉满。实际测试也是如此，我使用下述命令，会报错。vllm日志输出的内容，你可以设置。

2024-07-16 21:04:23 21278 5

原创 Qwen2本地web Demo

千问2前段时间发布了，个人觉得千问系列是我用过最好的中文开源大模型，所以这里基于streamlit进行一个千问2的web搭建，来进行模型的测试。

2024-06-24 13:14:45 4019

原创 embedding模型API启动

针对一些需要使用api调用的大模型框架，可以用该方法启动Embedding模型。环境问题不过多赘述，代码如下。上进行知识库的向量编码。

2024-05-29 14:06:40 1157

原创 PDF 转 word （优化版）

用pdf2docx批量将pdf文件转换为word文档

2024-05-29 13:57:45 589

原创对比表征学习（二）Setence Embedding

主要阐述Sentence Embedding。绝大部分视觉应用中的对比方法依赖于创造每个图像的增强版本，但是在句子扩增中会变得非常有挑战性。因为不同于图片，在扩增句子的同时非常容易改变句子本身的语义。

2024-05-27 20:57:41 1137

原创对比表征学习（一）Contrastive Representation Learning

主要参考翁莉莲的，本文主要聚焦于对比损失函数对比表示学习（Contrastive Representation Learning）可以用来优化嵌入空间，使相似的数据靠近，不相似的数据拉远。同时在面对无监督数据集时，对比学习是一种极其有效的自监督学习方式。

2024-05-27 14:25:25 1400

原创 UserWarningFound duplicate [‘libcudart.so‘, ‘libcudart.so.11.0‘, ‘libcudart.so.12.0‘]

出现此类报错代表环境中存在cuda版本冲突，路径在中在该路径下输入检查一下输出形式，出现下述情况会报错。

2024-05-17 20:16:06 332

原创 ollama pull Permission Denied 拉取Ollama模型时的权限问题

是你存放ollama模型的默认目录，如果你修改了环境变量的路径需要你实际存放ollama模型的路径。遇到ollama的权限问题一直报错，尝试重新给予权限。依次输入上述命令后再进行。

2024-05-14 22:07:42 4097

原创 ubuntu启动修复（BIOS无法找到GRUB | 引导加载器）

笔者的一台双系统主机，里面有两个硬盘，1T的硬盘装的是windows系统，2T硬盘装的是ubuntu20.04系统。因为长期使用ubuntu系统，所以选择格式化了1T的硬盘，但这导致我开机时bios无法识别启动项（循环进入bios不进系统），无法进入原先的ubuntu系统。如果你是双系统，需要考虑你的引导加载器在哪个盘，这对你后续处理硬盘很重要该方法对开机时无法找到硬盘引导加载器的Ubuntu系统适用。

2024-05-09 20:17:47 4304

原创 ubuntu挂载固态硬盘

ubuntu挂载ssd固态硬盘，分为两种情况：一、刚拆封的新硬盘；二、使用过的硬盘需要重新挂载

2024-05-09 15:41:39 2148

原创 Langchain快速上手

本文基于jupyter对langchain进行一个非常简单的入门教学，让大家对langchain有个初步概念。具体细节参考。

2024-05-07 14:43:55 1011

原创 DRL(Deep Reinforced Learning) PPO算法（Proximal Policy Optimization）

PPO(Proximal Policy Optimization)最好先看一下策略梯度优化，再看这篇文章，不然公式推不明白PPO是Openai默认的强化学习策略On-policy：学习的agent和与环境交互的agent是同一个∇Rˉθ=Eτ∼pθ(τ)[R(τ)∇log⁡pθ(τ)]\nabla \bar{R}_\theta = E_{\tau \sim p_\theta(\tau)}[R(\tau) \nabla \log p_\theta(\tau)]∇Rˉθ=Eτ∼pθ(τ)

2024-04-30 18:37:48 1172

原创 DRL(Deep Reinforced Learning) Policy Gradient 策略梯度优化

参考强化学习有三个基础的组成部分（坦克大战为例）env 和 reward function 是无法控制的调整actor中的policy，来获得最大的reward （控制坦克达成最大击杀）policy决定actor的行为， policy部分就是一个network（即下图的Actor就是一个网络，可以通过网络来算出aireward不是标量（scalar）而是随机变量（random variable）Trajectoryτs1a1s2a2sTaT。

2024-04-30 14:24:12 1020

原创 Pytorch手撸Attention

注释写的很详细了，对照着公式比较下更好理解，可以参考一下。

2024-04-16 20:04:51 2045

原创 FastGPT+ChatGLM3本地部署

FastGPT结合ChatGLM的本地部署

2024-04-15 20:22:47 2134 2

原创 frp内网穿透

内网穿透教程

2024-04-11 14:36:19 791 1

原创贝叶斯公式

对贝叶斯公式的理解和推导，对先验后验概率的解释

2024-04-11 09:12:52 2647

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄6年

66
原创

492
点赞

853
收藏

326
粉丝

关注

私信

热门文章

分类专栏

笔记 3篇

最新评论

vllm减小显存 | vllm小模型大显存问题
_illusion_: 啥乱七八糟的，lz自己都没搞明白就来误导人了。。
vllm减小显存 | vllm小模型大显存问题
weixin_56890967: max_num_seqs：一次推理最多能处理的sequences数量，默认值是256。max_num_seqs越大，能处理的请求数量就会越大，但提升也会有上限，不一定是越大越好
vllm减小显存 | vllm小模型大显存问题
萧瑟_天道酬勤: --max-num-seqs是每次迭代的最大序列数。更多的是和内存有关
解决java使用API连接HBase超时、连不上问题
与光同尘_y: 终于解决了，感谢博主。搞了两天了，Windows下的Java控制台没有输出一直都是连接上，但是表信息查不到。原因在于我使用的是内嵌的zookeeper，在虚拟机的hbase-site.xml里面没有配置quorum这一项，但是需要把它加入到java项目中
Linux查看当前目录中的文件大小
优快云-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/gml?utm_source=AI_act_gml

提示

确定要删除当前文章？

取消删除