uan_cs-优快云博客

原创 Conda 离线配置环境

适用于服务器无法连接外网的环境下，conda配置环境

2023-06-15 13:01:05 1615

window：window因为采用的doc系统中使用了' / '，所以文件路径默认使用了' \ '。在处理window数据时如果采用 ‘ \ ’连接，最好在字符串前加 ‘r’，以此来避免转义字符出现，linux：使用 ' / '连接即可，例如 /home/uan/test.txt。../../ 父目录的父目录。更好的写法,使用 '/'进行连接。或者使用os中的join进行连接。./ 当前目录下。../ 父目录。

2023-05-08 10:53:39 910

原创 vscode配置python环境，coderunner无法输出中文

首先点击vscode的文件/首选项/设置进入搜素设置搜素 code-runner: ExecutorMap。1，利用anaconda安装python环境，记得添加环境变量。3，code runner插件无法再输入栏输出中文，保存后即可，出现该现象应该和window编码格式有关。2，vscode建立工作区并选择python解释器。

2023-04-29 13:45:09 423

原创交叉熵和相对熵（KL散度）

P表示样本的真实分布，Q表示模型所预测的分布，那么KL散度就可以计算两个分布的差异，也就是Loss损失值。Q的分布越接近P（Q分布越拟合P），那么散度值越小，即损失值越小。有时会将KL散度称为KL距离，但它并不满足距离的性质：不对称；不满足三角不等式。...

2022-08-04 11:23:16 574

原创 linux 快速删除大量小文件（数十万级别）

当我们在linux系统中要删除数万或者数十万甚至数百万的文件时使用rm -rf *就不太好用，因为要等待很长一段时间。

2022-08-03 10:16:17 5141

原创详解PyTorch中加载数据的方法--Dataset、Dataloader、Sampler、collate_fn等

PyTorch中对于数据集的处理有三个非常重要的类：、、，它们均是包下的模块（类）。它们的关系可以这样理解：总的来说，定义了整个数据集，提供了取数据的机制，最后由取完成取数据的任务。本篇以一个最简单的例子为例，比如有一个文件夹（data-folder）中存储训练的数据（一共30张图片：0.png 到 29.png），他们对应的标签被写在了一个labels.txt文件中，第n行对应n-1.png的标签，是一个三分类问题，即0、1和2三种标签（虚构的数据集，不具有任何意义）。目录结构如下：另一个

2022-07-05 11:43:46 3299

原创文本生成评价指标

文本生成目前的一大瓶颈是如何客观，准确的评价机器生成文本的质量。一个好的评价指标（或者设置合理的损失函数）不仅能够高效的指导模型拟合数据分布，还能够客观的让人评估文本生成模型的质量，从而进一步推动text generation 商业化能力。然而由于语言天生的复杂性和目前技术限制，我们目前还没有一个完美的评价指标。本文就三方面对文本生成的评价指标介绍：介绍了以BLEU为代表的基于统计的文本评价指标就 data to text 和 image caption 进一步介绍了其特有的评价

2022-04-29 16:09:37 1743

原创 c++ 优先队列（priority_queue）

优先队列的本质是堆，但它具有队列的所有操作特性，与普通队列不同的地方就是出队的时候按照优先级顺序出队，这个优先级即最大堆或最小堆的规则（即大的为top优先出队或小的为top优先出队），在队列的基础上加了个堆排序。以O(log n) 的效率查找一个队列中的最大值或者最小值，其中是最大值还是最小值是根据创建的优先队列的性质来决定的。priority_queue的使用#include<queue>//头文件//使用的语法priority_queue<Type, Contain

2022-04-25 21:02:14 1453

原创 c++ map容器

1. map简介：map是STL的一个关联容器，它提供一对一（其中第一个可以称为关键字，每个关键字只能在map中出现一次，第二个可能称为该关键字的值）的数据处理能力，由于这个特性，它完成有可能在我们处理一对一数据的时候，在编程上提供快速通道。map内部自建一颗红黑树(一种非严格意义上的平衡二叉树)，这颗树具有对数据自动排序的功能，所以在map内部所有的数据都是有序的，后边我们会见识到有序的好处。map可以根据key值快速查找记录，复杂度在log(n)级别，如果有1000个记录，最多查找10次，1

2022-04-24 14:48:15 3279 1

原创 Transformer 使用 LayerNorm 不用 BatchNorm的原因

首先， Norm最开始被提出的时候是为了解决ICS(internal covariate shift，内部协变量转移)问题，但后来的研究发现，Norm起作用的本质是它平滑了Loss,保证了梯度下降过程中的稳定。Batch Normalization 1.1 背景 Batch Normalization（以下简称BN）的方法最早由Ioffe&Szegedy在2015年提出，主要用于解决在深度学习中产生的ICS（Internal Covariate Shift）的问题。若模型输入层..

2022-03-05 16:01:10 5060

原创 CondaValueError : prefix already exists: /**/anaconda3

condavalueerror : prefix already exists

2022-02-18 16:34:08 3527

原创 git 初始化仓库，将本地仓库备份github

git将本地代码同步备份至github git initgit remote add origin git@github.com:git add.git commit -m 'test'git push 第一个问题：warning: push.default is unset; its implicit value is changing inGit 2.0 from 'matching'...

2021-11-23 10:51:55 1224

原创 pytorch指定gpu序号不起作用

import osos.environ['CUDA_VISIBLE_DEVICES'] = '1'要放在 import torch 的前面TensorFlow 同理

2021-11-06 12:35:00 736

原创 conda安装的cudatoolkit, cudnn与在主机上安装的cuda, cudnn有何关系？

conda安装的cudatoolkit, cudnn与在主机上安装的cuda, cudnn有何关系？在conda创建的虚拟环境中安装tensorflow-gpu后，会自动安装cudatoolkit和cudnn。在这个虚拟环境中使用tensorflow时，如果涉及到GPU的计算，是不是会自动使用虚拟环境中安装的cudatoolkit和cudnn？与主机中安装的cuda及cudnn无关？回答anaconda 的 cudatoolkit 不包含完整安装cuda的全部文件，只是包含了用于 tensorf

2021-11-03 16:59:23 1653

原创 bert 的输出格式详解

输出是一个元组类型的数据，包含四部分，last hidden stateshape是(batch_size, sequence_length, hidden_size)，hidden_size=768,它是模型最后一层输出的隐藏状态pooler_output：shape是(batch_size, hidden_size)，这是序列的第一个token(classification token)的最后一层的隐藏状态，它是由线性层和Tanh激活函数进一步处理的，这个输出不是对输入的语义内容的一个很好的.

2021-11-03 16:53:29 18135 6

原创 vscode pytorch无法自动补全、无提示

文件->首选项->设置->搜索Python language server, 选项修改为pylint

2021-10-13 14:42:36 1123

原创 allennlp 版本关系

allennlp=1.1.0rc3 可以匹配 torch=1.6.0 allennlp=1.0.0rc1 可以匹配 torch=1.3.1 allennlp=0.9.0 可以匹配 torch=1.2.0

2021-05-26 21:03:36 1754

原创 tricks

https://mp.weixin.qq.com/s/8I61m3UAA-QaWId6OpLGjw 新手炼丹技巧

2021-05-25 15:58:38 124

原创非root用户解决/lib64/libstdc++.so.6: version `CXXABI_1.3.8‘ ，升级gcc

原因：集群gcc版本低，不包含CXXABI_1.3.8解决方法：在自己的用户目录下安装gcc,修改环境变量1：下载gcc wget http://ftp.gnu.org/gnu/gcc/gcc-9.2.0/gcc-9.2.0.tar.gz解压:tar –zxvf gcc-9.2.0.tar.gzcd gcc-9.2.0./contrib/download_prerequisites //执行脚本自动下载、安装依赖包网络不好的话离线下载依赖参考https://blog.csdn...

2021-05-23 14:42:24 1928

原创 qkv softmax

Query，Key，Value的概念取自于信息检索系统，举个简单的搜索的例子来说。当你在某电商平台搜索某件商品（年轻女士冬季穿的红色薄款羽绒服）时，你在搜索引擎上输入的内容便是Query，然后搜索引擎根据Query为你匹配Key（例如商品的种类，颜色，描述等），然后根据Query和Key的相似度得到匹配的内容（Value)。我们知道概率有两个性质：1）预测的概率为非负数；2）各种预测结果概率之和等于1。softmax就是将在负无穷到正无穷上的预测结果按照这两步转换为概率的。1）将预测结果.

2021-05-17 10:09:46 302

原创 pytorch nn.conv1d nn.conv2d 代码分析与使用

https://www.jianshu.com/p/45a26d278473本文主要介绍PyTorch中的nn.Conv1d和nn.Conv2d方法，并给出相应代码示例，加深理解。一维卷积nn.Conv1d一般来说，一维卷积nn.Conv1d用于文本数据，只对宽度进行卷积，对高度不卷积。通常，输入大小为word_embedding_dim * max_length，其中，word_embedding_dim为词向量的维度，max_length为句子的最大长度。卷积核窗口在句子长度的方向上滑动，进

2021-05-15 14:34:35 2548

原创 Chrome 下载文件出现已禁止

原因：IE的安全设定问题解决方法：win+s搜索Internet选项 -> 安全 -> 自定义级别 -> 其他 -> 加载应用程序和不安全文件 -> 提示(推荐)上面的勾选上然后点确定 -> 确定就搞定了。...

2021-05-15 10:43:31 10276 1

原创 vscode 配置管理github项目

1 在GitHub 主页头像 ->settings -> ssh and gpg keys 中添加本地ssh密钥 c:\users\.ssh\rsa.pub 实现在vscode中免密登录2 git bash 中配置用户名和邮箱git config --global user.name "用户名"git config --global user.email "用户邮箱"（邮箱和注册github时邮箱相同）ssh git@github.com 验证是否可以免密登录（如果不连接一次..

2021-05-04 19:45:29 583

原创 Stack

1 哈希map count函数返回key值出现的次数（1或者0）

2021-04-29 18:08:14 57

原创 Linux paddle2.0.2环境配置

pip 安装paddle2.0.2 python -m pip install paddlepaddle-gpu==2.0.2.post110 -f https://paddlepaddle.org.cn/whl/mkl/stable.html 安装cuda11.0 conda search cuda 搜索可用cuda版本 conda install cudatoolkit=11.0 安装cudnn8.1.0 conda search cudnn 确...

2021-04-19 16:17:26 541

原创 c++ vector容器

本文从以下几个方面介绍vector用法1，初始化定义空的vector vector<T>v1 T为数据类型定义固定长度的vector vector<T>v2(n) 定义一个vector的副本 vector<T>v3(v2) 定义固定长度的vector vector<T>v4(n,i) 长度为n且元素都为i ...

2020-07-08 20:32:15 314

暖树的博客

原创 LLM高效微调