- 博客(31)
- 收藏
- 关注
原创 BPE分词算法逐步详解,超级简单易懂,草履虫都能看懂!
BPE(Byte-Pair Encoding,字节对编码)是一种NLP中常见的分词方法,核心思想是通过“找规律、合并重复”的方式,把经常一起出现的字符或小片段组合起来,逐步构建一个“词汇表”,然后用该词汇表来拆分任何文本。现在 “u n” 和 “n </w>” 并列最常见(16次),我们随便挑一个,比如合并 “u n” 成 “un”。初始词汇表:[“b”, “g”, “h”, “n”, “p”, “s”, “u”, “</w>”]最常见的字符对是 “u g”,出现了20次。
2025-04-10 10:58:51
640
原创 大模型量化是什么意思?量化的基本原理介绍
大模型量化是指将模型的参数(如权重和激活值)从高精度的数据类型(通常是浮点数,例如32位浮点数,FP32)转换为较低精度的数据类型(例如16位浮点数FP16、8位整数INT8甚至更低位整数)。这个过程旨在减少模型的计算复杂度和内存占用,从而提高推理速度并降低对硬件资源的需求。
2025-04-08 14:22:07
203
原创 在Ubuntu20.04开发Dify插件教程,部署Dify插件脚手架
当使用ubuntu20.04安装dify插件脚手架的时候,使用会报以下错误究其原因就是这里的 GLIBC_2.34 文件仅存在ubuntu22.04版本之上。于是天然就有一个解决办法,就是将系统更新至22.04版本以上就行了。但是有时候我们又不想更新系统,此时就可以借助了,具体解决步骤如下当在镜像中使用初始化了一个插件模板后,从镜像中退回到主机终端中,然后你会在上述指令的部分看到该插件模板代码目录,但是这里会有一个问题,只有root用户才能编辑该目录下的文件。
2025-04-02 11:07:32
511
原创 Typora在ubuntu上通过Picgo-core来进行Github图床上传(超详细)
至此设置完毕,可以愉快的使用Github图床啦~将以下内容复制进去,并按需求进行填写。
2024-11-01 11:05:05
449
原创 如何利用Samba跨平台分享Ubuntu文件夹
在上述红框处写上你被共享服务器的ip地址,点击连接后输入上述所创建用户名和密码即可。为用户名,输入完成后命令行会让你创建该用户的访问密码,按要求输入即可。编辑完成后按一下Esc按键后输入。打开文件,点击左侧的。
2024-09-14 10:26:39
585
原创 Ubuntu22.04安装colmap
其中CMAKE_CUDA_COMPILER是自己cuda的路径,如上所示,CMAKE_CUDA_ARCHITECTURES是自己GPU的计算能力,比如上图4090就是8.9,于是这里就输入89, 这俩都是按照自己的电脑来配置的。查看自己电脑GPU的CMAKE_CUDA_ARCHITECTURES。再接着在终端中逐步输入以下内容来部署colmap即可。终端输入以下内容安装预先的前置依赖。
2024-09-05 20:57:11
1473
2
转载 ubuntu为多用户安装anaconda环境
建议每个用户为不同的任务创建不同的虚拟环境,例如:运行PyTorch,创建一个环境,运行TensorFlow,创建另外一个虚拟环境,从而解决不同的框架使用不同的组件,版本依赖冲突等问题。这样,root创建的虚拟环境,就在/opt/anaconda3/envs中,而其他用户因为没有该文件夹的读写权限,就放在自己的home目录.conda/envs下。conda收录的包,主要集中在科学计算方面,如果需要的包没有,可以使用pip安装。此时,命令提示符前面会出现当前环境的名字,安装的软件,在当前虚拟环境下生效。
2024-09-02 11:20:22
892
3
原创 超详细安装jupyter!避免踩坑!Pycharm中也能正常使用jupyter环境!
【代码】超详细安装jupyter!避免踩坑!Pycharm中也能正常使用jupyter环境!
2024-07-25 17:11:56
2282
原创 嘎嘎详细的三维变换详细讲解,包括视图变换、投影变换等,超级通俗易懂!
三维空间中的齐次坐标从二维变换开始引申,可得到三维中的一个点的表达方式为(x,y,z,1)⊤(\mathbf{x}, \mathbf{y}, \mathbf{z}, 1)^{\top}(x,y,z,1)⊤,也就是w=1,而三维的向量则表达为(x,y,z,0)⊤(\mathbf{x}, \mathbf{y}, \mathbf{z}, 0)^{\top}(x,y,z,0)⊤,也就是w=0由于三维空间的一个点是上述格式的,若其中的w由于两点相加或者其他原因超过了1,则我们令这个点的xyz都除以w,那么w就会
2024-07-10 15:38:53
1081
原创 图形学各种二维基础变换,原来线性代数还能这么用,太牛了
若想将一个图形缩小0.5倍若x乘上缩放值s等于x撇,y同理,则x′sxy′sy,这样就表示了x缩小了s倍,y也是将其转为矩阵操作则是在前面乘上一个缩放矩阵x′y′s00sxy,根据矩阵乘法性质,其中的x撇和y撇最后乘出来就是上述的sx和sy。变换矩阵为s00s。
2024-07-09 09:10:13
1247
原创 如何计算文本之间的相似度?余弦相似度详解!带例子,嘎嘎通俗易懂~
计算公式cos(θ)=A⃗⋅B⃗∣∣A⃗∣∣×∣∣B⃗∣∣\cos (\theta) = \frac{\vec{A} \cdot \vec{B}}{||\vec{A}|| \times ||\vec{B}||}cos(θ)=∣∣A∣∣×∣∣B∣∣A⋅B其中 θ\thetaθ 是 余弦相似度.当cos(θ)\cos (\theta)cos(θ)越靠近1,则表示向量A和向量B在向量空间中的夹角越靠近0,意味着它们之间更相似。夹角等于0,则表示这俩向量相等。例子假如要计算两段文本之间的相
2024-05-18 16:30:25
1519
原创 SDKMAN详细使用教程,嘎嘎好用的java版本管理工具~
以上为SDKMAN的基本使用命令,如果想要更多指令,可以输入。然后根据需求新开一个终端或者输入右边的代码重置一下。直接复制官网里的安装指令到终端中执行即可。,如果有正常显示版本号,则表示安装成功了。来查看全部的指令内容。
2024-05-15 21:52:57
6091
1
原创 科研小trick,早停技巧,用过的都说好~,爸爸妈妈再也不怕我过拟合啦
Early stopping在我们训练神经网络的时候,若出现过拟合的情况下,如果我们将验证集的验证误差和训练集的训练误差画图出来,将呈现下图所示的情况可以看出,在过拟合的时候,验证误差随着迭代次数的增加一般呈现出先下降,然后再上升的一个趋势通过画出这么一个图后,我们就可以找到验证误差上升到那个点的迭代次数,然后只取迭代这么多次的参数来防止过拟合,这就是early stopping的主要思想有了这个思想呢,在你训练模型的时候,你就可以在代码中进行设置,若训练过程中x次(我一般设置为3次)在验证
2024-05-09 10:41:24
604
原创 深度学习常用优化算法笔记介绍,各种梯度下降法详细介绍
1002425...32vtβvt−11−βθtvtθtβv10.9∗01−0.9242.4vtvt1−βtvt1−βtβvt−11−βθtv1v11−0.910.9∗01−0.9∗2424tβtvdwβ1vdw1−β1dwvdbβ1vdb。
2024-05-08 17:00:35
1073
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人