自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 资源 (2)
  • 收藏
  • 关注

原创 vscode远程服务器连接不上

经过排除发现是软件自动升级了,导致启动不了。

2025-11-26 17:42:36 271

原创 Agent Demo初体验

交通查询 [done] -> 任务『提取出发地/目的地/时间进行交通规划:帮我规划下周去上海,预算3000,文艺风格』的结果:[{"type": "高铁", "price": 520, "duration": "5小时", "time": "进行交通规划:帮我规划下周去上海 09:00"}, {"type": "航班", "price": 860, "duration": "2小时", "time": "进行交通规划:帮我规划下周去上海 14:30"}]- 生成报告 [done] -> 旅行规划报告。

2025-11-04 16:14:34 238

原创 unzip 中文乱码的替代方案

【代码】unzip 中文乱码的替代方案。

2025-10-29 17:38:58 147

原创 多模态BLIP2模型详解

BLIP-2模型采用两阶段训练策略实现高效的视觉-语言对齐。第一阶段通过冻结图像编码器(如CLIP ViT)和训练Q-Former适配器,建立基本的图像到文本映射能力;第二阶段针对具体任务(如VQA、图像描述)微调模型。与BLIP相比,BLIP-2通过冻结预训练组件和引入大语言模型显著提升生成能力。在多模态任务中,ITM(图像文本匹配)、ITC(图像文本对比)和ITG(图像文本生成)构成完整技术体系:ITM判断图文一致性,ITC学习模态间语义关系,ITG实现跨模态内容生成。这种分层方法既保留基础视觉特征,又

2025-10-11 17:31:59 461

原创 CLIP算法的应用场景

CLIP是一种多模态AI模型,通过对比学习将图像和文本映射到同一语义空间。其核心应用包括:图像检索(文本/图片搜索)、生成模型引导(AI绘画)、图像分类(自动打标签)、多模态问答、推荐系统、内容审核、教育辅助、移动端应用(实时图像理解)等。CLIP还可用于学术研究和小样本学习。该模型的优势在于强大的跨模态理解和生成能力,使其在电商、社交、教育、医疗等多个领域具有广泛应用前景。

2025-09-30 16:15:56 639

原创 ViT模型相关拓展总结

VisionTransformer(ViT)及其衍生算法已成为计算机视觉领域的重要突破。主要改进方向包括:1)架构优化(SwinTransformer的滑动窗口机制、PVT的金字塔结构);2)混合设计(CoAtNet结合CNN与Transformer);3)无注意力方案(MLP-Mixer);4)轻量化版本(MobileViT);5)自监督学习(DINOv2)。这些算法不仅提升了ViT在分类任务的表现,还拓展了其在检测、分割等密集预测任务的应用,同时探索了更高效的注意力机制和移动端部署方案。

2025-09-30 14:15:47 792

原创 大模型训练评估参数设置

这个错误表明你设置了 metric_for_best_model="eval_accuracy" ,但在评估过程中并没有计算 accuracy 指标。可用的评估指标只有: ['eval_loss', 'eval_runtime', 'eval_samples_per_second', 'eval_steps_per_second', 'epoch']。

2025-09-28 14:04:50 142

原创 按步数保存与按epoch保存的区别

这个错误表明你的训练参数配置存在冲突。load_best_model_at_end 要求保存策略和评估策略必须一致,但你设置了: 评估策略: steps (按步数评估) 保存策略: epoch (按周期保存)"steps" : 按步数评估(需配合 eval_steps )"steps" : 按步数保存(需配合 save_steps )save_strategy : 保存频率。"epoch" : 每个周期结束时评估。"epoch" : 每个周期结束时保存。"no" : 不评估。"no" : 不保存。

2025-09-28 13:55:30 134

原创 python文件import找不到其它目录的库解决方案

【代码】python文件import找不到其它目录的库解决方案。

2025-08-25 10:42:03 339

原创 hugging face与modelscope下载模型与数据

方法1:使用 --cache-dir 指定下载目录方法2:使用 --local-dir 指定下载目录。

2025-08-19 17:29:41 540

原创 grpo初试

进一步分析为什么 --trace-ascii 能工作而 --raw 不能?...这个输出是正确的,只是没有换行,放在了下一个命令行前面...

2025-08-13 11:11:54 1031

原创 GPU 驱动安装升级测试

也可以下载官方版本进行安装登录或访问。

2025-07-25 17:44:46 239

原创 安装带GPU的docker环境

1.安装NVIDIA容器工具包先验证NVIDIA驱动安装(nvidia-smi)使用更新后的方法安装工具包(避免弃用的apt-key)配置Docker使用NVIDIA运行时2.解决依赖冲突彻底卸载旧版本Docker和containerd清理残留配置文件使用--fix-broken修复依赖关系3.优化配置修改Docker存储目录位置正确设置容器资源限制(CPU/GPU内存)调整容器命名和管理方式

2025-07-15 14:29:44 983

原创 Chatbox调用Fastapi服务实践

摘要:本文展示了如何用FastAPI部署一个模拟ChatGPT API的聊天服务。服务端代码实现了/v1/chat/completions接口,支持流式和非流式两种响应模式。配置允许跨域请求后,服务在8100端口启动。测试时,Chatbox向该接口发送包含对话历史的请求,服务端成功接收并返回预设的"你好"响应。日志显示完整的请求内容和200响应状态,验证了API的可用性。该实现可作为开发测试的简易替代方案,但实际应用中需扩展业务逻辑处理真实对话场景。

2025-07-07 11:29:18 281

原创 移动conda虚拟环境的安装目录

方法 | 适用场景 | 注意事项 || 重新创建环境 | 跨平台或需要彻底清理时 | 耗时较长 || 直接移动文件夹 | 同系统快速迁移 | 需修复路径和符号链接 || conda-pack | 大环境或网络受限时 | 需额外安装工具 |推荐优先级:方法 1 > 方法 3 > 方法 2如果环境较小或需跨平台,优先选择 重新创建;如果环境很大且网络差,用 conda-pack。

2025-07-02 14:09:06 678

原创 vllm推理实践

报错:仍然报GPU内存不足。 可以获得输出结果:完整代码2. vllm的chat模式推理报错如下:分析问题:修复1:使用 tokenizer.apply_chat_template 转换 messages将改为:成功输出:修复2:直接构造字符串 prompt(手动模板)将:改为:输出:

2025-07-01 09:54:19 515

原创 llama-cpp-python使用教程

llama-cpp-python使用教程摘要 本教程详细介绍了llama-cpp-python的安装、基础用法和高级功能。安装支持CPU、GPU(CUDA/Metal)及OpenBLAS加速,需配置对应环境。基础用法包括加载GGUF模型、文本生成和对话模式。高级功能涵盖GPU加速(设置n_gpu_layers)、多模态处理(图片描述生成)和流式输出。实用技巧包括模型量化(如Q4_K_M平衡性能与显存)、显存优化(内存映射)和性能调优(线程/批处理设置)。常见问题解决涉及CUDA路径配置、GCC升级等。适用于

2025-06-30 11:28:33 726

原创 安装llama-cpp-python踩坑记

安装报错,分析如下:这个错误是因为 LLAMA_CUBLAS 选项已经被弃用,建议使用 GGML_CUDA 替代。你需要修改安装命令中的 CMake 参数。

2025-06-30 11:04:45 985

原创 csv追加写入的方法初探

该方法的缺点无法及时保存数据。

2025-06-24 13:45:48 217

原创 linux机器间无密码如何传输文件

本文介绍了Linux系统间文件传输的几种方法:1) SCP传输遇到密码验证问题,需输入正确密码;2) 详细对比了SCP、rsync、SFTP、nc等传输方式的特点与使用场景;3) 重点演示了使用nc(netcat)进行无密码传输的具体步骤,包括安装、文件发送/接收操作;4) 通过SHA256校验确认文件传输完整。最后总结nc传输的关键命令流程:接收端监听端口写入文件,发送端通过端口发送文件。nc适用于内网快速传输,但缺乏加密机制需谨慎使用。

2025-06-17 17:21:02 330

原创 关于deepseek训练tokenize设计的思考

文章摘要:本文探讨了对话系统中思考过程(tokenize)处理的优化方法。初始设计将思考过程(reason)错误地包含在指令(instruction)部分,导致其未被纳入训练目标。改进方案将思考过程作为助理(assistant)回复的一部分,包括在标签(labels)中以计算损失。修正后的代码结构分为三部分:1) 系统提示和用户问题(忽略损失);2) 助理完整回复(含思考过程和最终答案);3) EOS标记(均计算损失)。这种设计确保模型学习"思考-回答"的完整生成逻辑,与推理流程保持一致

2025-06-13 15:27:45 289

原创 webui无法注册如何配置

可以看到:允许用户注册,开关默认并未打开,打开开关并保存,普通用户注册就可以看到注册入口了。ADMIN_USERNAME=admin # 管理员账户(第一个注册用户)DISABLE_REGISTRATION :是否禁用注册(设为 false 以启用)。DISABLE_REGISTRATION=false # 确保为 false。普通用户登陆进来后,发现没有可用的模型。普通用户就看看到模型了。

2025-06-06 16:11:51 968

原创 lobechat调用ollama模型,服务连接失败

如果ollama服务中没有可用的模型,需要ollama run加载模型。

2025-04-27 15:50:40 464

原创 ollama的若干实践

方法 1:手动检查最新版本并下载 访问 Ollama 的 GitHub Releases 页面:打开方法 2:使用官方安装脚本(推荐该脚本会自动检测系统架构并下载最新版本 安装完成后,运行 ollama pull llama3 测试方法 3:使用 AppImage(免安装)如果仍然无法下载,可以直接使用安装完成后查看ollama版本。

2025-04-27 10:51:23 1620

原创 llama-webui docker实现界面部署

【代码】llama-webui docker实现界面部署。

2025-04-21 17:01:25 668 1

原创 docker 中将dpo后的模型转为ollama能够调用的gguf格式

将dpo后的模型路径/home/pretrained_model/output/ 映射到docker中的/output目录。

2025-04-21 14:04:03 1384

原创 chatchat+ollama+qwen搭建对话知识库

chatchat实现rag对话

2024-11-26 17:44:14 732

原创 运行pytorch时出现version `CXXABI_1.3.9‘ not found

发现问题:运行bert预测代码时出现如下错误。在命令行执行如下命令。

2023-09-27 18:30:22 910 1

原创 vscode配置linux私钥远程免密登录

vscode远程开发

2022-11-22 13:57:01 532

原创 关闭pythcarm console运行

1. 点击pycharm顶部的run按钮2. 点击弹出框的 Edit Configurations3. 点击弹出对话框右下角的 Edit configuration templates4. 去掉 Run with Python Console的勾选====>5. 如果报有已存在的同名文件,可将相关文件夹排除6. 最后shift+F10就不会再pycharm console上运行了,而是在run上运行7. 参考文章...

2022-04-25 17:48:26 2302

原创 在windows上访问linux中的jupyter虚拟环境

1、在linux上激活虚拟环境-bash-4.2$ source activate py382、使用ipykernel为不同的虚拟环境配置不同名字(1) 安装ipykernel(py38) -bash-4.2$ conda install ipykernel(2) 配置虚拟环境的内核名称python-mipykernelinstall--user--name=你的环境名称--display-name"Python(环境名称)"(py3...

2021-09-06 20:03:08 752

原创 docker中neo4j知识图谱数据库创建指南

1 docker拉取neo4j镜像 (1)从景下源中找到合适的镜像 命令:docker search neo4j (2)拉取镜像源 命令:docker pull neo4j:版本号2 构建neo4j容器 命令:docker run --name qa_poi_container -d -it -p 7474:7474 -p 7687:7687 --mount type=bind,source=/home/neo4j/conf,tar...

2021-01-06 20:03:16 1019

原创 NER建立模型时出现concat tensors不匹配问题

1 问题描述 在建立NER识别模型时出现: TypeError: Tensors in list passed to 'values' of 'ConcatV2' Op have types [bool, float32] that don't all match. 2 分析问题 我们仔细看报错语句,可以看到真正报错的语句为:return tf.concat([to_dense(x) for x in tensors], axi...

2020-06-04 21:13:04 1569 1

原创 多字符集下CString string char* char[]之间相互转换

在每次用到这些字符串转换的时候,总是记得不是很清楚,查找这些资料也总是浪费了很多时间,在此总结一下,方便以后使用。准备工作: (1) 先将工程的字符集设置为多字节,否则会出现在字符拷贝时结尾为乱码。举个例子, CString pathStr("abc"); char path[200]; strcpy_s(pa

2020-05-29 19:16:46 779

原创 dataframe数据报NaN和infinite错误

问题描述:ValueError: Input contains NaN, infinity or a value too large for dtype('float64').分析问题: 开始以为是输入数据的问题,经过反复修改输入数据,发现问题依然存在。于是想看看报错处的数据长什么样: 发现输入数据确实存在nan值,进一...

2020-04-19 15:43:18 1414

原创 excel中文显示乱码

问题描述:linux系统生成的utf8编码的excel在linux系统下的windows虚拟机中显示正常,但在windows系统中就出现了乱码,如下:分析问题:实验1:改为ANSI编码实验2:改为大端编码实验3:改为utf8编码转换前后没有不同。修改字符集后:修改字符集后编码如上更加乱了。实验4:对ex...

2020-03-14 17:35:46 20262 1

原创 tensorflow2.0训练报数据输入错误Failed to find data adapter

1 问题描述:运行如下训练代码:import numpy as nphistory = classifier.fit(x_train, y_train, batch_size=10, epochs=100, validation_data=(x_test, ...

2020-01-19 19:45:01 18087 5

原创 Windows10下安装使用tensorflow2.0

1 下载Anaconda Anaconda3-2019.10-Windows-x86_642 点击Anaconda安装包进行安装3 手动将Anaconda添加到系统环境变量中 在安装目录中我们可以找到conda可执行文件的路径: 然后将conda所在的目录添加到环境变量的用户变量中:用户变量与系统变量的区别: (1) 用户变量为...

2019-12-27 18:30:30 1029

原创 jupyter运行远程云服务器的md文件

1 开放云服务器安全组的访问权限 如果未开放其它ip的访问权限会出现connect time out的问题。2 激活gluon环境 3 安装notedown插件 pip install https://github.com/mli/notedown/tarball/master 安装完成后显示成功: 4 配置好jupyt...

2019-08-12 22:42:16 396

原创 linux SCP免密传输文件

1 带密码的scp传输从client端传输文件到server端。client端发送文件到指定ip的目录下:输入密码后,查看server端是否接收到文件:2 在client端生成密钥对/usr/local/app/.ssh路径即为: ~/.ssh3 在client端将生成的公钥拷贝到server端的~/.ssh目录下如果~/.ssh目录不存在,则创建该目录拷贝前只有两个文件:拷贝文件:拷贝后serv...

2018-06-18 12:54:07 31120

Bmp图像读取写入与转换

1、可以读取1位、8位、24位、32位的bmp文件; 2、将不同位的bmp图像转为24位bmp图像; 3、可以保存为黑白、256、真彩色图像。

2013-07-16

opencv二值化程序

可以运行的二值化程序,基于opencv。

2013-03-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除