- 博客(6)
- 收藏
- 关注
原创 对VLM和VLA的一点感想
对于大语言模型来说,数据集的构造以及Prompt的设计很重要。在LLaVA训练框架下,1. alignment需要尽可能的让text全面描述视觉特征,甚至于逐帧的描述。2. finetune时的prompt,也需要尽可能对当前的visual features进行描述。以显式的方式作为prompt提示给LLM,都有助于VLA实现连续控制的鲁棒性,提高推理的准确性。除了扩大数据集提升泛化性以及RAG的引入,其实还可以引入一些修正机制,来避免推理错误的动作API执行。2025年4月3日凌晨2:30。
2025-04-03 08:30:26
174
原创 HuggingFace下载模型
使用huggingface-cli下载支持断点下载。3. cli下载数据集。1. 首先安装这个库。2. cli下载模型。
2025-02-18 03:36:21
185
原创 研究生必备技能之git repository
本文旨在记录常用的git指令和步骤以及在github上的同步。vscode terminal中run,创建新的git 仓库。3). check远程仓库是否添加。可能需要在vscode配置github用户和账号。3). 推送代码到github。1). 将文件添加到暂存区。2). 关联github。2).提交到本地仓库。
2025-01-13 04:38:17
468
原创 通过SSH进行下载
从远程主机下载文件夹到本地host-->local。的远程文件传输工具。如果下载单独文件不需要加-r。,安全复制协议)是基于。
2025-01-11 23:41:39
726
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人