自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 安装完Node.js后,在cmd命令提示符中没问题,在PowerShell中报错

使用 -Scope CurrentUser 不需要系统全局修改,也不影响其他用户,无需管理员权限也可以设置(但你已经用管理员打开了,没问题)。右键点击 “Windows PowerShell”,选择 “以管理员身份运行”你可能会看到 Restricted(这是默认值,禁止所有脚本)。步骤 5:关闭并重新打开普通 PowerShell(非管理员)✅ 推荐(较安全):仅允许本地脚本,不加载远程签名脚本。步骤 1:以管理员身份打开 PowerShell。步骤 3:设置允许本地脚本运行(推荐)

2025-11-22 16:11:12 419

原创 多模态RAG赛题实战之策略优化--Datawhale AI夏令营

每一个pdf文件按页来排序,每一页的内容包含text、table、image,上一个pdf最后一页结束之后,便是下一个pdf的第一页,以此类推直到最后一个pdf的最后一页。:按“页”分块过于粗暴,一个完整的表格或逻辑段落可能被硬生生切开,或者说当本来应检索的信息分布于前后两页之中时,便破坏了信息的上下文完整性。的检索方法——BM25 算法,它擅长匹配问题中出现的具体词语,即要将chunk中的content内容的每一个单词/字给分出来,再去做匹配。

2025-08-13 22:12:53 853

原创 多模态RAG赛题实战--Datawhale AI夏令营

参考自。

2025-08-09 23:18:42 1077 4

原创 uv工具使用记录(Linux系统)

这个命令会在当前目录下创建一个项目名为Demo的文件夹,并在这个文件夹里面自动生成三个文件——main.py、pyprojecy.toml、README.md。然后就可以使用如下命令安装相关项目依赖(如gradio库),不需要切换进虚拟环境,因为这个命令。cd进入项目文件夹,然后打开pyprojecy.toml文件,在最后添加如下代码,实现针对。直接在pycharm中打开Demo这个项目文件夹,可以使用命令查看当前可用的python版本。会自动创建.venv的虚拟环境。不需要指定解释器和环境。

2025-07-29 17:18:53 940

原创 Gradio入门

Gradio组件本质上是预制的UI元素,用于创建交互式机器学习模型界面。这些预制的可视化控件允许用户输入数据(如上传图片、输入文本),并展示模型处理后的输出结果(如显示图像分类标签、生成文本)。这些组件分为输入组件(如文本框、图像上传)、输出组件(如标签、图表)及布局/控制组件三类,共同构成可自定义的Web界面。

2025-07-28 18:36:09 1057

原创 端侧智能体开发

端侧智能体(Edge AI Agent)正成为AI应用的重要趋势。端侧部署不仅能够保护用户隐私,降低云端计算成本,还能提供更快的响应速度和更好的用户体验。:当医生需要处理患者病历,律师需要分析法律文档,研究人员需要处理敏感数据时,他们需要的是一个完全可信的AI助手,而不是一个可能泄露信息的云端服务;:一个野外科考队员,在没有网络的环境下仍然能够获得AI助手的帮助;经常需要坐飞机出差的人士,能够在飞行模式下继续处理工作文档;

2025-07-25 16:40:38 798

原创 RAG学习(class 5)

目标:流式部署——做一个流式输出的后端,然后让前端去捕获这个流式输出,并且在聊天界面中流式输出。

2025-07-23 23:30:47 399

原创 RAG学习(class 4)

答:在中,每一个切片(chunk)在构建索引时,都会被分配一个唯一的NodeID(节点 ID)。这个 ID 本质上是一个字符串,一般是通过生成的。

2025-07-23 21:42:30 259

原创 RAG学习(class 3)

一个好的索引要做到:准确表达原始语义(好 embedding 模型)合理切分文本结构(合适的 chunking)高效搜索相似语义(好用的向量搜索库)否则你就是“Garbage in, garbage out” —— 输入再好的问题,输出仍然不可靠。在 RAG 系统或文档检索系统中,元数据(metadata)指的是关于数据的数据,也就是对文档本身的描述信息,而不是文档内容本身 (page_content)。元数据是“描述文档的额外信息”;

2025-07-23 16:26:54 1078

原创 RAG学习(class 2)

可以通过翻阅源码,发现llama index 把OpenAI和OpenAIEmbedding的模型名称写死在代码里了,它会检查每个模型的输入上下文大小,如果模型没有在他的列表中,就会报错。所以我们可以重写一下llama_index的OpenAI类,通过新建一个NewOpenAI类,并继承OpenAI类,我们直接把输入上下文大小写死,不让它检查了,它就不报错了。@property# 创建一个新的LLMMetadata实例,只修改context_window2、用NewOpenAI类来配置llm。

2025-07-21 21:51:11 686

原创 OpenAI智能体框架

专门用于构建和运行基于LLM的智能代理系统,其中的Agent类是该框架的。方法二:使用custom_llm_provider提供参数,明确指定提供商。方法一:在chat_model前面加上 /openai。1、agents是一个Python智能体。,代表一个具有特定能力和目标的AI代理。

2025-07-21 14:21:35 256

原创 CAMEL框架下的Multi-Agent协同

1、先进入项目文件夹,再uv创建虚拟环境,再进入虚拟环境,再安装依赖库和包,注意这个顺序2、Jupyter notebook要在这个环境下重新安装,最后再进入。3、进入虚拟环境之后,可以直接pip install安装,dotenv库也要重新安装。

2025-07-16 17:47:13 396

原创 VSCode远程SSH连接阿里云服务器ECS实例

3、找到本地创建的密钥对的公钥和密钥,一般公钥会保存在"C:\Users\YIhuan wung\.ssh\id_rsa.pub",私钥会保存在"C:\Users\YIhuan wung\.ssh\id_rsa"点击进去,然后把本地创建的公钥内容打开复制进去,完成上传公钥和绑定,上图显示的是已经完成绑定vscode本地公钥了。2、在本地创建密钥对,直接cmd输入:邮箱替换成自己的邮箱,然后一路回车运行直至结束。1、首先创建好阿里云服务器ECS实例(这一步简单,直接跳过)

2025-07-16 01:35:37 515

原创 RAG入门 | 202507学习心得(class 1)

首先在网址中选择自己喜欢的模型,这里我选择的时GLM-Z1-Flash模型,然后在。

2025-07-15 22:56:17 396 2

原创 Linux下部署deepseek R1流程及问题记录

本文介绍了在Linux系统下载并部署7B参数deepseek-r1模型的两种方法:1)通过官网指令下载,但速度较慢时建议使用国内镜像源;2)手动下载对应版本(需根据CPU架构选择)。安装后需检查版本并启动服务,若端口冲突可修改端口号。最后通过ollama命令下载并运行deepseek-r1:7b模型,使用ollama list查看已下载模型,ollama run启动对话测试。文中提供了详细的错误处理方案和参考博客链接。

2025-06-17 13:11:42 413

原创 yolov11的onnx模型C++ 调用的问题记录

解决办法:imgsize不是400,不能把_netWidth 和_netHeight从原来的640修改成400,imgsize应该根据在onnx模型导出的时候可以看到。:imgsize是416,把400改成416就好了。

2025-05-30 16:34:04 411 1

原创 解决报错:RuntimeError: cuFFT error: CUFFT_INTERNAL_ERROR

解决方法:更换虚拟环境,

2025-05-17 12:31:19 604

原创 YOLO11实例分割实战

使用labelme,在里面配置SAM分割一切模型,辅助标注得到所有图像的json文件检查json格式文件,确保,表示多边形点坐标),避免是表示矩形框坐标宽高)

2025-05-13 17:41:40 1695

原创 LM Studio加载DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf本地模型不显示的问题

DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf在国内无法从无法下载后,转而在其镜像网站选择4位模型参数Q4完成了下载,但是在LM Studio的模型目录选项,点击右边路径设置,选择“在文件资源管理器中打开时”始终无法在文件目录下找到提前已经放在这的DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf?很奇怪!

2025-03-29 20:42:07 1562

原创 如何从噪声估计网络UNet理解扩散模型能够根据时间步嵌入信息以学习到区分不同加噪阶段的噪声特性?

在扩散模型中,时间步 t 是模型生成过程中的一个重要参数,代表了扩散过程所在的进展。对于每一个时间步 t ,模型需要知道当前扩散到了哪一步,去噪操作也是如此。但是我们不能简单地将 t 作为一个标量直接输入模型,而是需要通过Time Embedding(类似于Positional embeddings)进行嵌入处理,通过将 t 编码进网络中,更多的原因如下:1、模型可能难以从这个单一的标量数值中提取足够的特征。

2025-03-25 21:01:32 1065

原创 如何理解”由于U-Net 骨干特征的低频主导特性使得高频成分主要包含噪声,而下采样操作可以自然地滤除这些高频噪声“?

这种设计使U-Net在保留关键细节的同时,对输入噪声具有鲁棒性,尤其适合医学图像等噪声敏感场景。池化操作(如2×2最大池化)将局部区域的信息压缩为一个值,相当于对图像进行。U-Net的编码器(下采样路径)通过。U-Net的解码器通过。

2025-03-21 20:48:06 515

原创 如何理解DDPM反向去噪推导公式的方差不为0,而DDIM为0?

在 “DDIM (Denoising Diffusion Implicit Models)””中,方差等于0的概念实际上是指在生成过程中去除了噪声的随机性,或者说是生成过程中的 **隐式去噪**。这种情况出现在反向去噪的过程中特定的时刻,即反向过程的推理步骤不再依赖于传统的噪声模型中的随机噪声项,而是通过确定性地进行预测。为了更好地理解这个问题,我们需要深入了解DDIM和DDPM的反向过程的区别。1. DDIM的反向过程:DDIM改进了DDPM的反向过程,通过隐式去噪(Implicit Denoising

2025-03-13 23:39:00 1323

原创 DDPM与DDIM的区别与联系

上图中DDIM反向步骤公式详解:其中的和实际可以相隔多个迭代步数,其中DDPM中,而。

2025-03-13 22:33:03 568

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除