- 博客(75)
- 资源 (3)
- 收藏
- 关注
原创 【deepseek学习】Top-k Top-p Temperature如何调整
在调整 Top-k、Top-p 和 Temperature 参数时,需要根据具体的任务需求和生成目标来灵活设置。
2025-02-18 16:54:21
1232
原创 【deepseek学习】- GRPO算法中的Rollout参数设计
rollout 参数主要用于控制策略模型在采样过程中的行为,具体来说,它决定了在每个问题上生成多少个候选输出(即 rollout 数量)。这些候选输出会被奖励模型(reward model)打分,并用于后续的策略更新。
2025-02-18 13:57:59
428
原创 安装langchain环境报错:ModuleNotFoundError: No module named ‘fastchat‘,解决方案
这个报错需要下载fschat包,没有fastchat包。
2023-12-19 14:09:15
1490
1
原创 查看显卡是否可用
命令行输入:nvidia-smi命令行输入:python3import torchtorch.cuda.is_available()
2022-05-05 19:42:52
360
原创 Points as Queries: Weakly Semi-supervised Object Detection by Points
CVPR 2021 文章阅读笔记
2022-04-28 00:30:19
772
原创 yolov5代码阅读笔记_参数与autoanchor
一些个人理解,不是专业术语~~code:https://github.com/ultralytics/yolov5参数设置:–rect:开启矩形训练–noautoanchor:触发关闭auto anchordef metric(k): # compute metric r = wh[:, None] / k[None] x = torch.min(r, 1 / r).min(2)[0] # ratio metric best = x.max(1
2022-04-08 17:48:21
1634
原创 使用阿里云进行pip install
如果想使用阿里云下载:pip install xxx -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
2022-04-01 21:09:21
2516
原创 model.eval()时测试结果远远低于model.train(),如何解决?
1. 检查输入数据(train与test)是否经过了归一化2. 设置model.eval()时,网络中所有bn层里超参 track_running_stats = False3. 尝试替换BN为LN或GN
2022-02-17 13:32:27
2218
原创 离线安装cmake错误
问题:Problem with the CMake installation, aborting build. CMake executable is cmake解决办法:首先安装scikit-build,再安装cmake,如果下载tar.gz安装有问题的话,直接下载.whl安装即可,亲测有效。注意pip install /绝对/路径/xxx.whl...
2022-02-10 16:51:06
1065
原创 json中label为中文,读入后需要以中文为依据做判断,如何编码?
# !/usr/bin/env python# -*- coding: utf-8 -*-import ioimport jsonf = "val.json"with io.open(f, "r", encoding="utf-8") as json_file: file_f = json.load(json_file) for box in file_f["shapes"]: if box["label"].encode('utf-8') ==
2021-12-08 19:30:49
248
原创 json文件生成时中文乱码与自动换行问题
with open(output_file_path, "w") as out_json: json.dump(output_json, out_json, indent=1)
2021-11-22 18:06:07
1568
原创 ubuntu18.04 安装 docker
https://docs.docker.com/engine/install/ubuntu/#install-from-a-package安装三个deb包的时候,注意顺序:sudo dpkg -i containerd.io_1.4.9-1_amd64.deb docker-ce-cli_20.10.9_3-0_ubuntu-bionic_amd64.debsudo dpkg -i docker-ce_20.10.9_3-0_ubuntu-bionic_amd64.deb特别注意前两个要一起装,不
2021-11-09 17:45:05
1002
原创 lr与batch_size设置原则
learning rate的设置应和batch_size的设置成正比,即所谓的线性缩放原则(linear scaling rule)解释见:https://zhuanlan.zhihu.com/p/364865720
2021-11-09 15:16:36
1026
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人