- 博客(23)
- 收藏
- 关注
原创 服务器部署cvat
通过以上步骤,你可以在 Alibaba Cloud Linux 8 上成功安装并运行 CVAT。如果遇到问题,可以参考 CVAT 的官方文档或 GitHub 仓库中的说明。cvat 老下载失败,添加这里面的镜像有用【标注工具】Ubuntu20.04 下 CVAT 的安装及使用教程-优快云博客docker compose 服务器上下载慢,可以在本地下载好后传到服务器上要在本地访问,需要修改两个地方为服务器的ip成功了。
2025-02-19 17:17:34
1065
原创 模型微调之process_func
用于微调指令跟随模型(Instruction-Following Models),如 InstructGPT。定义了输入序列的最大长度(这里是 256)。如果输入长度超出这个值,会进行截断,确保符合模型的输入限制。如 OpenAI 的 GPT 系列、ChatGPT、LLaMA 等模型。特别适用于基于对话的训练数据集。包括对话生成、问答系统、文本摘要等。可以根据模型的最大长度动态设置。以字典形式返回处理后的。
2024-12-26 15:58:16
506
原创 get_peft_model
是 PEFT (Parameter-Efficient Fine-Tuning) 框架中的一个核心函数,通常用于加载或创建一个可以高效微调的模型,尤其适合在低资源场景或小型数据集上进行模型微调。PEFT 框架支持的技术包括 LoRA (Low-Rank Adaptation)、Prefix Tuning、Prompt Tuning 等。下面是如何使用。
2024-12-26 15:57:26
690
原创 DataCollatorForSeq2Seq, TrainingArguments
per_device_train_batch_size 和 per_device_eval_batch_size:训练和评估时的批量大小。load_best_model_at_end=True, # 在训练结束时加载最佳模型。per_device_train_batch_size=8, # 训练时的批量大小。per_device_eval_batch_size=8, # 评估时的批量大小。load_best_model_at_end:是否在训练结束时加载最佳模型(基于评估结果)。
2024-12-26 15:34:34
473
原创 AutoTokenizer 这个模块主要要完成什么工作
AutoTokenizer 是 Hugging Face 的 transformers 库中的一个实用工具类,它主要用于自动加载与特定预训练模型相匹配的分词器(tokenizer)。自动识别和加载:根据用户提供的模型名称或路径,AutoTokenizer 能够自动识别出应该使用哪种类型的分词器,并加载对应的配置文件和词汇表。总之,AutoTokenizer 提供了一种简便的方法来处理自然语言数据,使得开发者可以专注于构建和训练模型,而不必担心底层文本处理的细节。
2024-12-26 15:17:55
420
原创 ANN(Approximate Nearest Neighbor,近似最近邻)
ANN 是在高维空间中平衡速度与精度的一种近似算法,其核心在于通过构建高效的数据结构,快速查找目标点的近邻。随着应用需求的增加和硬件性能的提升,ANN 技术将继续在大规模数据检索中扮演重要角色。是一种在高维空间中查找与目标点最接近的点的算法。它特别适合于处理大规模、高维数据集,能够在保证高检索精度的同时显著提高效率,因此被广泛应用于推荐系统、图像检索、语音识别等场景。如果有更具体的场景需要探讨,可以进一步细化!
2024-12-25 09:23:57
894
原创 因果关系的反馈
的重要基础,帮助我们理解系统中事物之间的相互影响及动态变化。反馈(Feedback)可以简单理解为:一个系统中某一部分的输出,又反过来影响系统输入的过程。通过认识和运用因果关系的反馈,我们可以更好地应对复杂系统的挑战,实现长期而健康的发展。在《第五项修炼》中,“因果关系的反馈”是。
2024-12-20 10:27:50
1087
原创 串口十六进制数据传输
的形式进行传输,但并不绝对。这取决于通信双方的约定以及实际应用场景。如果需要发送字符串形式的十六进制数据(如。在串口通信中,通常以。
2024-12-06 09:58:22
810
原创 什么是串口通信?
通过本教程,你应该已经掌握了 Qt 串口模块的基础用法。如果需要更复杂的功能(如自定义协议解析、数据流控制等),可以进一步学习串口协议和 Qt 的高级编程技巧!Qt 提供了一个独立的串口模块。确保你的 Qt 安装包中包含。,支持跨平台的串口通信功能。Qt 的串口模块通过信号。
2024-12-06 09:49:45
1253
原创 什么是感受野
感受野(Receptive Field) 是卷积神经网络(CNN)中的一个重要概念,它指的是网络中某一层的一个特定神经元能够接收到的输入图像的区域大小。而且,过大的感受野可能导致局部信息丢失,因为感受野越大,对输入图像的局部细节的敏感度就越低。在CNN中,通过卷积层和池化层的堆叠,感受野会逐渐增大,这意味着网络越深的层能够捕捉到更大的输入区域的信息,这对于检测图像中的较大模式或对象至关重要。随着网络深度的增加,参数的数量也会显著增加,这不仅增加了训练的难度,也提高了计算成本。
2024-11-12 09:16:18
307
原创 Certainly! Teaching English to young children can be a fun and engaging experience.
选择适合年龄的书籍,带有丰富的插图和简单的语言。: 最后,通过自己使用英语并表现出对一起学习语言的热情,成为你儿子的榜样。: 每天都用英语与你的儿子进行交流。谈论他的一天、他的玩具、他的兴趣等等。: 学习新语言需要时间,所以要耐心等待你的儿子,并提供大量的鼓励和赞美。跟着儿歌或易记的歌曲唱,可以帮助你的儿子学习新的词汇,改善发音。: 将英语融入到你儿子的游戏时间中,比如玩“我看见了什么”,记忆游戏,或者根据英语描述找到物品的寻宝游戏。记住,让学习体验对你的儿子来说是有趣和愉快的,他将能够掌握日常英语!
2024-03-15 11:06:27
1697
1
原创 论文-REid
instruct-ReID 是一种更通用的 ReID 设置,通过设计不同的指令,可以将现有的 6 个 ReID 任务视为特殊情况。模型在我们的 OmniReID 基准上进行训练,无需进行微调,可以将传统 ReID 在 Market1501、MSMT17、CUHK03 上的 mAP 提高 +0.5%、+0.6%、+7.7%、+6.4%、对于基于衣服模板的换衣 ReID,仅使用 RGB 图像时,COCAS+ real2 上的 mAP +24.9%对于我们新定义的语言指导的 ReID,+4.3%
2024-03-08 15:46:58
567
1
原创 VAE 代码实现
分布相似性损失函数:0.5 * sum(1 + log(sigma^2) - mu^2 - sigma^2),嵌入标签信息可以构造出CVAE模型,从而实现自主控制生成的数字。
2023-11-21 09:21:00
165
原创 公式检测与识别_流程
1、使用yolox在img上检测到目标公式的坐标yolox 公式检测2、在原始图片img上裁切子图3、对子图生成latex公式4、对子图重命名而进一步整理成可以生成pkl的样本5、对上一步的图片生成pkl样本。
2023-03-15 06:55:19
301
原创 opencv那些事_视频遮挡判别分析
摄像头遮挡如何进行判别,当然要具体情况具体分析。在我的场景里,正常情况下,图片变化差异较大。所以在我这可以试着基于该区域的像素方差进行计算,遮挡区域往往像素值接近,方差较小,而其他图像区域往往方差较大
2023-03-14 20:35:56
963
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人