- 博客(66)
- 资源 (2)
- 收藏
- 关注
原创 Agent Demo初体验
交通查询 [done] -> 任务『提取出发地/目的地/时间进行交通规划:帮我规划下周去上海,预算3000,文艺风格』的结果:[{"type": "高铁", "price": 520, "duration": "5小时", "time": "进行交通规划:帮我规划下周去上海 09:00"}, {"type": "航班", "price": 860, "duration": "2小时", "time": "进行交通规划:帮我规划下周去上海 14:30"}]- 生成报告 [done] -> 旅行规划报告。
2025-11-04 16:14:34
238
原创 多模态BLIP2模型详解
BLIP-2模型采用两阶段训练策略实现高效的视觉-语言对齐。第一阶段通过冻结图像编码器(如CLIP ViT)和训练Q-Former适配器,建立基本的图像到文本映射能力;第二阶段针对具体任务(如VQA、图像描述)微调模型。与BLIP相比,BLIP-2通过冻结预训练组件和引入大语言模型显著提升生成能力。在多模态任务中,ITM(图像文本匹配)、ITC(图像文本对比)和ITG(图像文本生成)构成完整技术体系:ITM判断图文一致性,ITC学习模态间语义关系,ITG实现跨模态内容生成。这种分层方法既保留基础视觉特征,又
2025-10-11 17:31:59
463
原创 CLIP算法的应用场景
CLIP是一种多模态AI模型,通过对比学习将图像和文本映射到同一语义空间。其核心应用包括:图像检索(文本/图片搜索)、生成模型引导(AI绘画)、图像分类(自动打标签)、多模态问答、推荐系统、内容审核、教育辅助、移动端应用(实时图像理解)等。CLIP还可用于学术研究和小样本学习。该模型的优势在于强大的跨模态理解和生成能力,使其在电商、社交、教育、医疗等多个领域具有广泛应用前景。
2025-09-30 16:15:56
639
原创 ViT模型相关拓展总结
VisionTransformer(ViT)及其衍生算法已成为计算机视觉领域的重要突破。主要改进方向包括:1)架构优化(SwinTransformer的滑动窗口机制、PVT的金字塔结构);2)混合设计(CoAtNet结合CNN与Transformer);3)无注意力方案(MLP-Mixer);4)轻量化版本(MobileViT);5)自监督学习(DINOv2)。这些算法不仅提升了ViT在分类任务的表现,还拓展了其在检测、分割等密集预测任务的应用,同时探索了更高效的注意力机制和移动端部署方案。
2025-09-30 14:15:47
792
原创 大模型训练评估参数设置
这个错误表明你设置了 metric_for_best_model="eval_accuracy" ,但在评估过程中并没有计算 accuracy 指标。可用的评估指标只有: ['eval_loss', 'eval_runtime', 'eval_samples_per_second', 'eval_steps_per_second', 'epoch']。
2025-09-28 14:04:50
142
原创 按步数保存与按epoch保存的区别
这个错误表明你的训练参数配置存在冲突。load_best_model_at_end 要求保存策略和评估策略必须一致,但你设置了: 评估策略: steps (按步数评估) 保存策略: epoch (按周期保存)"steps" : 按步数评估(需配合 eval_steps )"steps" : 按步数保存(需配合 save_steps )save_strategy : 保存频率。"epoch" : 每个周期结束时评估。"epoch" : 每个周期结束时保存。"no" : 不评估。"no" : 不保存。
2025-09-28 13:55:30
134
原创 hugging face与modelscope下载模型与数据
方法1:使用 --cache-dir 指定下载目录方法2:使用 --local-dir 指定下载目录。
2025-08-19 17:29:41
540
原创 grpo初试
进一步分析为什么 --trace-ascii 能工作而 --raw 不能?...这个输出是正确的,只是没有换行,放在了下一个命令行前面...
2025-08-13 11:11:54
1032
原创 安装带GPU的docker环境
1.安装NVIDIA容器工具包先验证NVIDIA驱动安装(nvidia-smi)使用更新后的方法安装工具包(避免弃用的apt-key)配置Docker使用NVIDIA运行时2.解决依赖冲突彻底卸载旧版本Docker和containerd清理残留配置文件使用--fix-broken修复依赖关系3.优化配置修改Docker存储目录位置正确设置容器资源限制(CPU/GPU内存)调整容器命名和管理方式
2025-07-15 14:29:44
983
原创 Chatbox调用Fastapi服务实践
摘要:本文展示了如何用FastAPI部署一个模拟ChatGPT API的聊天服务。服务端代码实现了/v1/chat/completions接口,支持流式和非流式两种响应模式。配置允许跨域请求后,服务在8100端口启动。测试时,Chatbox向该接口发送包含对话历史的请求,服务端成功接收并返回预设的"你好"响应。日志显示完整的请求内容和200响应状态,验证了API的可用性。该实现可作为开发测试的简易替代方案,但实际应用中需扩展业务逻辑处理真实对话场景。
2025-07-07 11:29:18
281
原创 移动conda虚拟环境的安装目录
方法 | 适用场景 | 注意事项 || 重新创建环境 | 跨平台或需要彻底清理时 | 耗时较长 || 直接移动文件夹 | 同系统快速迁移 | 需修复路径和符号链接 || conda-pack | 大环境或网络受限时 | 需额外安装工具 |推荐优先级:方法 1 > 方法 3 > 方法 2如果环境较小或需跨平台,优先选择 重新创建;如果环境很大且网络差,用 conda-pack。
2025-07-02 14:09:06
678
原创 vllm推理实践
报错:仍然报GPU内存不足。 可以获得输出结果:完整代码2. vllm的chat模式推理报错如下:分析问题:修复1:使用 tokenizer.apply_chat_template 转换 messages将改为:成功输出:修复2:直接构造字符串 prompt(手动模板)将:改为:输出:
2025-07-01 09:54:19
515
原创 llama-cpp-python使用教程
llama-cpp-python使用教程摘要 本教程详细介绍了llama-cpp-python的安装、基础用法和高级功能。安装支持CPU、GPU(CUDA/Metal)及OpenBLAS加速,需配置对应环境。基础用法包括加载GGUF模型、文本生成和对话模式。高级功能涵盖GPU加速(设置n_gpu_layers)、多模态处理(图片描述生成)和流式输出。实用技巧包括模型量化(如Q4_K_M平衡性能与显存)、显存优化(内存映射)和性能调优(线程/批处理设置)。常见问题解决涉及CUDA路径配置、GCC升级等。适用于
2025-06-30 11:28:33
727
原创 安装llama-cpp-python踩坑记
安装报错,分析如下:这个错误是因为 LLAMA_CUBLAS 选项已经被弃用,建议使用 GGML_CUDA 替代。你需要修改安装命令中的 CMake 参数。
2025-06-30 11:04:45
985
原创 linux机器间无密码如何传输文件
本文介绍了Linux系统间文件传输的几种方法:1) SCP传输遇到密码验证问题,需输入正确密码;2) 详细对比了SCP、rsync、SFTP、nc等传输方式的特点与使用场景;3) 重点演示了使用nc(netcat)进行无密码传输的具体步骤,包括安装、文件发送/接收操作;4) 通过SHA256校验确认文件传输完整。最后总结nc传输的关键命令流程:接收端监听端口写入文件,发送端通过端口发送文件。nc适用于内网快速传输,但缺乏加密机制需谨慎使用。
2025-06-17 17:21:02
330
原创 关于deepseek训练tokenize设计的思考
文章摘要:本文探讨了对话系统中思考过程(tokenize)处理的优化方法。初始设计将思考过程(reason)错误地包含在指令(instruction)部分,导致其未被纳入训练目标。改进方案将思考过程作为助理(assistant)回复的一部分,包括在标签(labels)中以计算损失。修正后的代码结构分为三部分:1) 系统提示和用户问题(忽略损失);2) 助理完整回复(含思考过程和最终答案);3) EOS标记(均计算损失)。这种设计确保模型学习"思考-回答"的完整生成逻辑,与推理流程保持一致
2025-06-13 15:27:45
289
原创 webui无法注册如何配置
可以看到:允许用户注册,开关默认并未打开,打开开关并保存,普通用户注册就可以看到注册入口了。ADMIN_USERNAME=admin # 管理员账户(第一个注册用户)DISABLE_REGISTRATION :是否禁用注册(设为 false 以启用)。DISABLE_REGISTRATION=false # 确保为 false。普通用户登陆进来后,发现没有可用的模型。普通用户就看看到模型了。
2025-06-06 16:11:51
968
原创 ollama的若干实践
方法 1:手动检查最新版本并下载 访问 Ollama 的 GitHub Releases 页面:打开方法 2:使用官方安装脚本(推荐该脚本会自动检测系统架构并下载最新版本 安装完成后,运行 ollama pull llama3 测试方法 3:使用 AppImage(免安装)如果仍然无法下载,可以直接使用安装完成后查看ollama版本。
2025-04-27 10:51:23
1620
原创 docker 中将dpo后的模型转为ollama能够调用的gguf格式
将dpo后的模型路径/home/pretrained_model/output/ 映射到docker中的/output目录。
2025-04-21 14:04:03
1384
原创 运行pytorch时出现version `CXXABI_1.3.9‘ not found
发现问题:运行bert预测代码时出现如下错误。在命令行执行如下命令。
2023-09-27 18:30:22
910
1
原创 关闭pythcarm console运行
1. 点击pycharm顶部的run按钮2. 点击弹出框的 Edit Configurations3. 点击弹出对话框右下角的 Edit configuration templates4. 去掉 Run with Python Console的勾选====>5. 如果报有已存在的同名文件,可将相关文件夹排除6. 最后shift+F10就不会再pycharm console上运行了,而是在run上运行7. 参考文章...
2022-04-25 17:48:26
2302
原创 在windows上访问linux中的jupyter虚拟环境
1、在linux上激活虚拟环境-bash-4.2$ source activate py382、使用ipykernel为不同的虚拟环境配置不同名字(1) 安装ipykernel(py38) -bash-4.2$ conda install ipykernel(2) 配置虚拟环境的内核名称python-mipykernelinstall--user--name=你的环境名称--display-name"Python(环境名称)"(py3...
2021-09-06 20:03:08
752
原创 docker中neo4j知识图谱数据库创建指南
1 docker拉取neo4j镜像 (1)从景下源中找到合适的镜像 命令:docker search neo4j (2)拉取镜像源 命令:docker pull neo4j:版本号2 构建neo4j容器 命令:docker run --name qa_poi_container -d -it -p 7474:7474 -p 7687:7687 --mount type=bind,source=/home/neo4j/conf,tar...
2021-01-06 20:03:16
1019
原创 NER建立模型时出现concat tensors不匹配问题
1 问题描述 在建立NER识别模型时出现: TypeError: Tensors in list passed to 'values' of 'ConcatV2' Op have types [bool, float32] that don't all match. 2 分析问题 我们仔细看报错语句,可以看到真正报错的语句为:return tf.concat([to_dense(x) for x in tensors], axi...
2020-06-04 21:13:04
1569
1
原创 多字符集下CString string char* char[]之间相互转换
在每次用到这些字符串转换的时候,总是记得不是很清楚,查找这些资料也总是浪费了很多时间,在此总结一下,方便以后使用。准备工作: (1) 先将工程的字符集设置为多字节,否则会出现在字符拷贝时结尾为乱码。举个例子, CString pathStr("abc"); char path[200]; strcpy_s(pa
2020-05-29 19:16:46
780
原创 dataframe数据报NaN和infinite错误
问题描述:ValueError: Input contains NaN, infinity or a value too large for dtype('float64').分析问题: 开始以为是输入数据的问题,经过反复修改输入数据,发现问题依然存在。于是想看看报错处的数据长什么样: 发现输入数据确实存在nan值,进一...
2020-04-19 15:43:18
1414
原创 excel中文显示乱码
问题描述:linux系统生成的utf8编码的excel在linux系统下的windows虚拟机中显示正常,但在windows系统中就出现了乱码,如下:分析问题:实验1:改为ANSI编码实验2:改为大端编码实验3:改为utf8编码转换前后没有不同。修改字符集后:修改字符集后编码如上更加乱了。实验4:对ex...
2020-03-14 17:35:46
20263
1
原创 tensorflow2.0训练报数据输入错误Failed to find data adapter
1 问题描述:运行如下训练代码:import numpy as nphistory = classifier.fit(x_train, y_train, batch_size=10, epochs=100, validation_data=(x_test, ...
2020-01-19 19:45:01
18087
5
原创 Windows10下安装使用tensorflow2.0
1 下载Anaconda Anaconda3-2019.10-Windows-x86_642 点击Anaconda安装包进行安装3 手动将Anaconda添加到系统环境变量中 在安装目录中我们可以找到conda可执行文件的路径: 然后将conda所在的目录添加到环境变量的用户变量中:用户变量与系统变量的区别: (1) 用户变量为...
2019-12-27 18:30:30
1030
原创 jupyter运行远程云服务器的md文件
1 开放云服务器安全组的访问权限 如果未开放其它ip的访问权限会出现connect time out的问题。2 激活gluon环境 3 安装notedown插件 pip install https://github.com/mli/notedown/tarball/master 安装完成后显示成功: 4 配置好jupyt...
2019-08-12 22:42:16
396
原创 linux SCP免密传输文件
1 带密码的scp传输从client端传输文件到server端。client端发送文件到指定ip的目录下:输入密码后,查看server端是否接收到文件:2 在client端生成密钥对/usr/local/app/.ssh路径即为: ~/.ssh3 在client端将生成的公钥拷贝到server端的~/.ssh目录下如果~/.ssh目录不存在,则创建该目录拷贝前只有两个文件:拷贝文件:拷贝后serv...
2018-06-18 12:54:07
31120
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅