- 博客(63)
- 收藏
- 关注
原创 clamav服务器杀毒(Linux服务器断网状态下如何进行clamav安装、查杀)
clamav服务器杀毒,Linux版本杀毒软件,该文章介绍了如何在需要进行杀毒的服务器断网状态下,使用clamav进行杀毒
2025-03-21 20:47:57
546
原创 模型训练中数据并行(DP)、模型并行(MP)、管道并行(PP)理解
在模型训练中,DP(Data Parallelism)、MP(Model Parallelism)、和 PP(Pipeline Parallelism)是三种常见的并行训练技术是三种常见的并行训练技术,主要用于分布式训练和大模型训练,以解决资源限制和训练效率问题。
2024-11-20 19:37:11
1163
原创 Don‘t Hallucinate,Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration(ACL杰出论文奖)
Don’t Hallucinate, Abstain:Identifying LLM Knowledge Gaps via Multi-LLM Collaboration,ACL杰出论文奖获奖论文,阅读总结笔记
2024-10-18 16:21:22
1192
原创 Casual Estimation of Memorisation Profiles(ACL最佳论文)
Causal Estimation of Memorisation Profiles,ACL最佳论文获奖论文,阅读总结笔记
2024-10-18 15:20:34
819
原创 ASR(Automatic Speech Recognition)调研,当前sota的架构
本文主要讲述nvidia和openai的模型架构,应为他们两家霸榜。小白也能阅读了解一下当前sota的asr架构是什么样的。
2024-08-05 16:20:02
1658
原创 TypeError Cannot read property ‘getUserMedia‘ of undefined
使用Chrome参数开启可以解决这个问题,在浏览器框中输入下述代码。将你需要访问的IP填入后重启浏览器,就能解决报错。所以直接访问ip地址会出现报错。localhost正常访问。
2024-08-01 09:07:09
510
原创 完全移动huggingface模型仓库(不是简单mv)
我重新创建了新的映射文件到新的模型目录中,然后以此类推操作,将所有模型的权重都重新映射,则可以完全转移模型。路径一定要绝对路径,不要出现。可以看到粉色的条目就是映射路径。在你下载的模型目录中,输入。中,因此需要修改映射。然后加入新的映射路径。
2024-07-25 15:37:01
473
原创 vllm减小显存 | vllm小模型大显存问题
这也是为什么有时候你跑1.5b模型也会显存拉满。实际测试也是如此,我使用下述命令,会报错。vllm日志输出的内容,你可以设置。
2024-07-16 21:04:23
10579
5
原创 Qwen2本地web Demo
千问2前段时间发布了,个人觉得千问系列是我用过最好的中文开源大模型,所以这里基于streamlit进行一个千问2的web搭建,来进行模型的测试。
2024-06-24 13:14:45
3179
原创 embedding模型API启动
针对一些需要使用api调用的大模型框架,可以用该方法启动Embedding模型。环境问题不过多赘述,代码如下。上进行知识库的向量编码。
2024-05-29 14:06:40
931
原创 对比表征学习(二)Setence Embedding
主要阐述Sentence Embedding。绝大部分视觉应用中的对比方法依赖于创造每个图像的增强版本,但是在句子扩增中会变得非常有挑战性。因为不同于图片,在扩增句子的同时非常容易改变句子本身的语义。
2024-05-27 20:57:41
1032
原创 对比表征学习(一)Contrastive Representation Learning
主要参考翁莉莲的,本文主要聚焦于对比损失函数对比表示学习(Contrastive Representation Learning)可以用来优化嵌入空间,使相似的数据靠近,不相似的数据拉远。同时在面对无监督数据集时,对比学习是一种极其有效的自监督学习方式。
2024-05-27 14:25:25
1069
原创 UserWarningFound duplicate [‘libcudart.so‘, ‘libcudart.so.11.0‘, ‘libcudart.so.12.0‘]
出现此类报错代表环境中存在cuda版本冲突,路径在中在该路径下输入检查一下输出形式,出现下述情况会报错。
2024-05-17 20:16:06
264
原创 ollama pull Permission Denied 拉取Ollama模型时的权限问题
是你存放ollama模型的默认目录,如果你修改了环境变量的路径需要你实际存放ollama模型的路径。遇到ollama的权限问题一直报错,尝试重新给予权限。依次输入上述命令后再进行。
2024-05-14 22:07:42
3322
原创 ubuntu启动修复(BIOS无法找到GRUB | 引导加载器)
笔者的一台双系统主机,里面有两个硬盘,1T的硬盘装的是windows系统,2T硬盘装的是ubuntu20.04系统。因为长期使用ubuntu系统,所以选择格式化了1T的硬盘,但这导致我开机时bios无法识别启动项(循环进入bios不进系统),无法进入原先的ubuntu系统。如果你是双系统,需要考虑你的引导加载器在哪个盘,这对你后续处理硬盘很重要该方法对开机时无法找到硬盘引导加载器的Ubuntu系统适用。
2024-05-09 20:17:47
3218
原创 Langchain快速上手
本文基于jupyter对langchain进行一个非常简单的入门教学,让大家对langchain有个初步概念。具体细节参考。
2024-05-07 14:43:55
708
原创 DRL(Deep Reinforced Learning) PPO算法(Proximal Policy Optimization)
PPO(Proximal Policy Optimization)最好先看一下策略梯度优化,再看这篇文章,不然公式推不明白PPO是Openai默认的强化学习策略On-policy:学习的agent和与环境交互的agent是同一个∇Rˉθ=Eτ∼pθ(τ)[R(τ)∇logpθ(τ)]\nabla \bar{R}_\theta = E_{\tau \sim p_\theta(\tau)}[R(\tau) \nabla \log p_\theta(\tau)]∇Rˉθ=Eτ∼pθ(τ)
2024-04-30 18:37:48
1012
原创 DRL(Deep Reinforced Learning) Policy Gradient 策略梯度优化
参考强化学习有三个基础的组成部分 (坦克大战为例)env 和 reward function 是无法控制的调整actor中的policy,来获得最大的reward (控制坦克达成最大击杀)policy决定actor的行为, policy部分就是一个network(即下图的Actor就是一个网络,可以通过网络来算出aireward不是标量(scalar)而是随机变量(random variable)Trajectoryτs1a1s2a2sTaT。
2024-04-30 14:24:12
909
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人