自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 收藏
  • 关注

原创 clamav服务器杀毒(Linux服务器断网状态下如何进行clamav安装、查杀)

clamav服务器杀毒,Linux版本杀毒软件,该文章介绍了如何在需要进行杀毒的服务器断网状态下,使用clamav进行杀毒

2025-03-21 20:47:57 546

原创 cudatoolkit安装(nvcc -V错误版本解决)

cudatoolkit安装,nvcc -V显示错误版本修改

2024-11-23 19:14:06 822

原创 Linux服务器配置国内镜像,“暂时不能解析域名“报错解决

sudo apt镜像配置,“暂时不能解析域名”报错问题解决

2024-11-23 17:41:15 627

原创 Linux服务器驱动安装

在服务器上安装显卡驱动,使得nvidia-smi可以读卡

2024-11-23 16:15:49 1552

原创 Adam优化器理解和代码实现

Adam优化器的公式理解和代码实现

2024-11-21 15:20:17 1595

原创 模型训练中数据并行(DP)、模型并行(MP)、管道并行(PP)理解

在模型训练中,DP(Data Parallelism)、MP(Model Parallelism)、和 PP(Pipeline Parallelism)是三种常见的并行训练技术是三种常见的并行训练技术,主要用于分布式训练和大模型训练,以解决资源限制和训练效率问题。

2024-11-20 19:37:11 1163

原创 Linux光标快捷键

删除前后字符并移动光标。

2024-11-20 15:01:06 522

原创 frp内网穿透快速启动

将 `./frpc -c ./frpc.toml` 配置成 `systemd` 的服务脚本并设置开机自启动

2024-11-19 16:15:46 505

原创 docker启动训练容器教程

docker拉取镜像(配置代理)、启动容器(让容器识别GPU)、配置容器conda环境

2024-11-16 20:56:00 1062

原创 nvidia显卡打开、关闭图形界面

关闭、开启服务器图形显示Xorg;可以外接显示器

2024-11-12 09:05:25 693

原创 ubuntu命令行调节风扇转速(不需要下载插件)

命令行调节服务器gpu风扇转速,无需额外下载其他插件

2024-11-10 17:09:05 1337

原创 MPC模型预测控制与RL强化学习的差异性

模型预测控制(MPC)与强化学习(RL)差异性调研

2024-10-28 22:37:24 533

原创 Let‘s Verify Step by Step(openai-o1论文技术调研)

openai-o1技术论文调研,阅读笔记

2024-10-28 22:17:30 1477

原创 Don‘t Hallucinate,Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration(ACL杰出论文奖)

Don’t Hallucinate, Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration,ACL杰出论文奖获奖论文,阅读总结笔记

2024-10-18 16:21:22 1192

原创 Casual Estimation of Memorisation Profiles(ACL最佳论文)

Causal Estimation of Memorisation Profiles,ACL最佳论文获奖论文,阅读总结笔记

2024-10-18 15:20:34 819

原创 Linux查看当前目录中的文件大小

统计当前文件夹(目录)大小,并按文件大小排序。

2024-10-10 22:19:58 319 1

原创 并发调用大模型API接口

对大模型API接口的并发调用,速度可以快一倍以上。

2024-08-16 11:12:10 864

原创 ASR(Automatic Speech Recognition)调研,当前sota的架构

本文主要讲述nvidia和openai的模型架构,应为他们两家霸榜。小白也能阅读了解一下当前sota的asr架构是什么样的。

2024-08-05 16:20:02 1658

原创 TypeError Cannot read property ‘getUserMedia‘ of undefined

使用Chrome参数开启可以解决这个问题,在浏览器框中输入下述代码。将你需要访问的IP填入后重启浏览器,就能解决报错。所以直接访问ip地址会出现报错。localhost正常访问。

2024-08-01 09:07:09 510

原创 完全移动huggingface模型仓库(不是简单mv)

我重新创建了新的映射文件到新的模型目录中,然后以此类推操作,将所有模型的权重都重新映射,则可以完全转移模型。路径一定要绝对路径,不要出现。可以看到粉色的条目就是映射路径。在你下载的模型目录中,输入。中,因此需要修改映射。然后加入新的映射路径。

2024-07-25 15:37:01 473

原创 vllm减小显存 | vllm小模型大显存问题

这也是为什么有时候你跑1.5b模型也会显存拉满。实际测试也是如此,我使用下述命令,会报错。vllm日志输出的内容,你可以设置。

2024-07-16 21:04:23 10579 5

原创 Qwen2本地web Demo

千问2前段时间发布了,个人觉得千问系列是我用过最好的中文开源大模型,所以这里基于streamlit进行一个千问2的web搭建,来进行模型的测试。

2024-06-24 13:14:45 3179

原创 embedding模型API启动

针对一些需要使用api调用的大模型框架,可以用该方法启动Embedding模型。环境问题不过多赘述,代码如下。上进行知识库的向量编码。

2024-05-29 14:06:40 931

原创 PDF 转 word (优化版)

用pdf2docx批量将pdf文件转换为word文档

2024-05-29 13:57:45 501

原创 对比表征学习(二)Setence Embedding

主要阐述Sentence Embedding。绝大部分视觉应用中的对比方法依赖于创造每个图像的增强版本,但是在句子扩增中会变得非常有挑战性。因为不同于图片,在扩增句子的同时非常容易改变句子本身的语义。

2024-05-27 20:57:41 1032

原创 对比表征学习(一)Contrastive Representation Learning

主要参考翁莉莲的,本文主要聚焦于对比损失函数对比表示学习(Contrastive Representation Learning)可以用来优化嵌入空间,使相似的数据靠近,不相似的数据拉远。同时在面对无监督数据集时,对比学习是一种极其有效的自监督学习方式。

2024-05-27 14:25:25 1069

原创 UserWarningFound duplicate [‘libcudart.so‘, ‘libcudart.so.11.0‘, ‘libcudart.so.12.0‘]

出现此类报错代表环境中存在cuda版本冲突,路径在中在该路径下输入检查一下输出形式,出现下述情况会报错。

2024-05-17 20:16:06 264

原创 ollama pull Permission Denied 拉取Ollama模型时的权限问题

是你存放ollama模型的默认目录,如果你修改了环境变量的路径需要你实际存放ollama模型的路径。遇到ollama的权限问题一直报错,尝试重新给予权限。依次输入上述命令后再进行。

2024-05-14 22:07:42 3322

原创 ubuntu启动修复(BIOS无法找到GRUB | 引导加载器)

笔者的一台双系统主机,里面有两个硬盘,1T的硬盘装的是windows系统,2T硬盘装的是ubuntu20.04系统。因为长期使用ubuntu系统,所以选择格式化了1T的硬盘,但这导致我开机时bios无法识别启动项(循环进入bios不进系统),无法进入原先的ubuntu系统。如果你是双系统,需要考虑你的引导加载器在哪个盘,这对你后续处理硬盘很重要该方法对开机时无法找到硬盘引导加载器的Ubuntu系统适用。

2024-05-09 20:17:47 3218

原创 ubuntu挂载固态硬盘

ubuntu挂载ssd固态硬盘,分为两种情况:一、刚拆封的新硬盘;二、使用过的硬盘需要重新挂载

2024-05-09 15:41:39 1523

原创 Langchain快速上手

本文基于jupyter对langchain进行一个非常简单的入门教学,让大家对langchain有个初步概念。具体细节参考。

2024-05-07 14:43:55 708

原创 DRL(Deep Reinforced Learning) PPO算法(Proximal Policy Optimization)

PPO(Proximal Policy Optimization)最好先看一下策略梯度优化,再看这篇文章,不然公式推不明白PPO是Openai默认的强化学习策略On-policy:学习的agent和与环境交互的agent是同一个∇Rˉθ=Eτ∼pθ(τ)[R(τ)∇log⁡pθ(τ)]\nabla \bar{R}_\theta = E_{\tau \sim p_\theta(\tau)}[R(\tau) \nabla \log p_\theta(\tau)]∇Rˉθ​=Eτ∼pθ​(τ)

2024-04-30 18:37:48 1012

原创 DRL(Deep Reinforced Learning) Policy Gradient 策略梯度优化

参考强化学习有三个基础的组成部分 (坦克大战为例)env 和 reward function 是无法控制的调整actor中的policy,来获得最大的reward (控制坦克达成最大击杀)policy决定actor的行为, policy部分就是一个network(即下图的Actor就是一个网络,可以通过网络来算出ai​reward不是标量(scalar)而是随机变量(random variable)Trajectoryτs1​a1​s2​a2​sT​aT​。

2024-04-30 14:24:12 909

原创 Pytorch手撸Attention

注释写的很详细了,对照着公式比较下更好理解,可以参考一下。

2024-04-16 20:04:51 1706

原创 FastGPT+ChatGLM3本地部署

FastGPT结合ChatGLM的本地部署

2024-04-15 20:22:47 1912 2

原创 frp内网穿透

内网穿透教程

2024-04-11 14:36:19 692 1

原创 贝叶斯公式

对贝叶斯公式的理解和推导,对先验后验概率的解释

2024-04-11 09:12:52 2058

原创 Transformer_20问

关于transformer的20个问题,可以更深入理解transformer,查漏补缺

2024-04-11 09:09:57 1044

原创 Bert的相关疑问和理解

bert的一些疑问和理解

2024-04-11 09:08:19 937

原创 混淆矩阵 Confusion Matrix

混淆矩阵详解

2024-04-11 09:03:08 748

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除