- 博客(68)
- 收藏
- 关注
原创 RuntimeError: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at “../aten/src/ATen/cuda/CUDA
但我是实验跑到一半才报错,而且没法resume,查看了一下显卡,某一张卡的显存占用为零但利用率100%,使用命令。可能是驱动 or 显卡烧了的问题,这里提到了可能出现的问题。一看,果然某张显卡error了,(如下面的显卡5)首先重启看看是否能解决问题,如果不能就直接维修吧。网上有人说是因为设置了环境变量。
2024-12-03 11:42:27
353
原创 ValueError: bos_token_id has to be defined when no input_ids are provided.
的版本(一般情况下需要升级版本)
2024-12-02 17:45:04
144
原创 Focal Loss
表明该样本被分类正确的概率越大,易区分样本,则其对应的loss所占的权重更低,反之则是难分类样本其loss权重更大。偏差越大,KL散度值越大,当两者分布相等时,KL散度为零,同时目标分布确定时。也是确定的,因此通过KL散度进行优化等价于通过交叉熵进行优化。同理,接入对于一个三分类(多分类)任务,一个样本的预测值为。),监督学习的目标是尽可能使得。表示模型输出分布(可以理解为。以二分类为例:这里有1个样本,表示为目标分布(可以理解为。函数,通常在机器学习中,,从公式中可以看到,当。表示预测为1的概率值,
2024-10-17 02:00:59
708
1
原创 torch.distributed.elastic.multiprocessing.api: [ERROR] failed (exitcode: -9)
考虑降低workers数量或者其他节省内存的方法。并未有其他提示信息,原因大概率是。
2024-09-21 15:24:50
1215
原创 快速将字符串转换为python数据类型
会导致删除服务器上所有文件。函数,举例如下,我需要将大模型输出字符串转换为 numpy 数据类型。无法判断用户输入是否为恶意代码,比如用户输入。可以使用 python 中的。函数可以完成此功能,但由于。python中自带的。
2024-06-09 18:40:13
350
原创 Python使用多进程和多线程处理数据
多进程适合于计算密集型任务和需要大量计算资源的场景,而多线程适合于I/O密集型任务和需要快速上下文切换的场景。
2024-05-06 10:52:49
378
原创 拉普拉斯分布(Laplace Distribution)
且更适配与曼哈顿距离损失(Manhattan Distance Loss)函数。中,作者使用拉普拉斯分布建模地图元素的点(vertex),因为其。
2024-04-28 19:33:28
1475
1
原创 weight-tying探索
在一些领域,将嵌入层和输出层的权重绑定,以达到减少参数量并使得相同token保持统一的embedding空间的作用。可以看到,在这个例子中,使用 weight-tying 后 loss 收敛更快。的权重矩阵的尺寸是10*3,即。的权重矩阵大小相等。
2024-04-08 13:58:57
323
原创 轨迹预测后处理之非极大值抑制(NMS)
现在我们依次按照置信度高低选取轨迹,比如第一次选择排名第一的轨迹,后面再选择轨迹时需要跟已经选择的所有判断距离是否大于某个阈值,如果小于该阈值,说明存在已选的轨迹与当前要被选择的轨迹很类似,则放弃选择该轨迹。从图中6条轨迹中选择出3条,如果按照置信度来选,应该选择0.8,0.5,0.4的轨迹,但由于0.5和0.4两条轨迹靠的太近(小于某个阈值)因此最终选择的轨迹为0.8,0.5,0.3三条轨迹。首席按将轨迹按照置信度从高到低排序,即。这里随便举个例子,比如说我有 10 条轨迹,其置信度分别为。
2024-03-25 19:47:29
1107
原创 Python 闭包和装饰器
在计算机科学中,闭包(英语:Closure),又称词法闭包(Lexical Closure)或函数闭包(function closures),是在支持头等函数的编程语言中实现词法绑定的一种技术。闭包在实现上是一个结构体,它存储了一个函数(通常是其入口地址)和一个关联的环境(相当于一个符号查找表)。环境里是若干对符号和值的对应关系,它既要包括约束变量(该函数内部绑定的符号),也要包括自由变量(在函数外部定义但在函数内被引用),有些函数也可能没有自由变量。
2024-01-01 15:53:31
508
原创 Diffusion Model扩散模型 原理 代码 后续改进
Diffusion Model 分为两部分,前向扩散过程和后向生成过程,前向扩散过程从一张原始图像逐步加噪声变为一张纯噪声图像,后向生成过程则从随机噪声来逐步恢复出原图像。
2023-12-26 11:33:14
1200
原创 Linux常用长命令总结
程序意外终止,但进程还在占用资源,如何批量杀死多进程?可以先使用命令ps aux查看所有被启动进程的相同部分,使用grep是终端启动多进程的入口,上面语句的意思是找到所有由train.py启动的进程的id,然后使用kill -9强制杀死进程。
2023-12-15 13:25:09
470
原创 ERROR: Could not find a version that satisfies the requirement tensorflow==2.4.0 (from versions: non
python版本不对,该python版本下没有对应的tensorflow-2.4.0。官网和镜像库中明明有tensorflow-2.4.0,但就是装不了。
2023-12-12 13:11:16
2528
原创 Git 学习笔记
文件中,可以忽略托管,也不会放到开源仓库中,防止信息或隐私文件泄露。文件名可以使用正则表达式。首先需要创建一个仓库,在github主页右上角+号处点击。解决如何管理和保留历史操作版本和操作记录。将某些文件或文件夹放置在。
2023-12-08 01:24:55
1018
原创 Web学习笔记
Web学习笔记flask库前端基础超链接:空连接:图片:视频(音频):嵌套使用列表表格格式化表格input表单系列网络请求GET方式POST请求通过GET方式获取输入参数通过POST方式获取输入参数注册页面CSS三种使用方式行内式外联式内嵌式选择器1、类选择器2、id选择器3、标签选择器4、通配符选择器5、属性选择器6、后代选择器CSS样式高度与宽度字体和颜色MySQL基础SQL语言SQL分类DDLDMLDQL约束事务JDBCJavaSvript基础语法BOM对象DOM事件监听HTTPHTTP请求数据格式H
2023-11-29 10:05:52
1149
1
原创 shell学习笔记
环境变量可以在shell中临时创建,退出即丢失,想永久生效,可以添加到配置文件中。不创建子进程并执行后续命令,执行完程序后退出exit。在windows中脚本为。文件,Liunx脚本为。
2023-11-28 23:12:48
474
原创 leetcode刷题:15|三数之和
暴力循环容易超时,因此使用双指针(三指针),第一个指针遍历列表,第二三个指针从左从右遍历列表(都在第一个指针右边),时间复杂度为。
2023-10-07 21:13:14
71
原创 leetcode刷题:11|盛最多水的容器
这道题借鉴了别人的思路,比较左右指针所指元素的高度,并更新高度小的指针值,然后判断面积是否需要更新。目的是尽可能保留高边。这么简单的题搞了一个半小时!做题要自己观察,观察题目的特征才行!
2023-10-05 20:59:34
45
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人