- 博客(52)
- 收藏
- 关注
原创 AI报错:HNSW索引加载失败解决指南
基本上是,属于向量数据库(Chroma / Milvus / Weaviate 等)或者 RAG 系统中的问题。
2025-11-24 18:38:36
310
原创 大模型中断修复
大模型生成中断的常见原因是max_new_tokens参数限制(如200个token)。解决方法是在prompt中明确要求"完整输出,不要中途停止",并将其加入generate_answer()函数。通过修改prompt指令而非仅调整参数,可确保模型输出完整内容。
2025-11-23 10:55:37
94
原创 前端报错:快速解决Django接口404问题
这说明:upload_file → 正常processFile(filename) → 已经调用但是 process_file 这个 Django 接口。
2025-11-23 10:37:05
255
原创 本地文档问答系统RAG全流程详解
本文介绍了一个基于Django的文档问答系统实现流程,包含四个核心阶段:1)文件上传与解析,支持PDF/DOCX/TXT格式;2)文档拆分与向量化,将文本分段并生成嵌入向量存储至ChromaDB;3)用户提问处理,通过语义搜索检索相关文档片段;4)答案生成,结合检索结果和大语言模型生成回答。系统实现了从文档上传到智能问答的完整流程,关键技术包括文本解析、向量检索和提示工程。目前需解决process_file调用问题以确保流程衔接。
2025-11-23 10:01:32
368
原创 collection.query不起作用
摘要: 当Collection未正确创建或连接时,调用query()可能返回空结果。可通过print(collection)检查对象类型,用collection.count()验证数据量(正常应>0)。若结果为0,需先插入文档,示例代码:collection.add(documents=["测试文档"], embeddings=[[0.1,0.2,...]], ids=["doc1"])。此操作确保集合存在有效数据后,查询才能返回预期结果。
2025-11-22 22:30:42
62
原创 无法联系上下文
文章摘要:研究发现AI问答系统中embedding模型匹配问题源于中文处理能力不足。测试显示,尽管存储和检索都使用相同的SentenceTransformer("all-MiniLM-L6-v2")模型,但该模型对中文支持较差。进一步检查发现文件读取函数失效,导致检索结果为空。建议改进中文embedding模型或修复文件读取功能以提升系统性能。(150字)
2025-11-22 21:47:49
83
原创 判断模型是否适合电脑的方法
摘要:GPU显存是运行AI模型的关键资源,存储模型参数和中间计算结果。模型大小估算公式为参数数量×参数精度(如10亿参数FP32模型约4GB),实际运行需额外20%显存(约5GB)。14B参数的FP32模型需67GB显存,远超家用电脑能力,需通过量化技术降低需求。显存不足会导致模型运行失败或性能下降。
2025-11-22 21:16:13
287
原创 分词器和模型在填充令牌上保持一致
当分词器未设置填充令牌时,代码将其设为结束令牌,并同步模型配置。这确保了填充处理的一致性:1)若缺省pad_token则使用eos_token;2)对齐分词器与模型的pad_token_id,避免批次处理时因ID不同导致错误。关键解决场景包括变长序列填充和生成任务中的令牌对齐问题。
2025-11-19 21:12:24
233
1
原创 ValueError: You are using a deprecated configuration of Chroma.
使用新的持久化客户端。
2025-11-18 17:54:34
258
原创 Django 项目设置流程
这是一个 Django 应用的 URL 路由配置文件。它定义了该应用中各个页面的网址路径和对应的处理函数。执行数据库迁移文件,真正创建或更新数据库中的表结构python manage.py migrate。根据你修改的 models.py,自动生成数据库迁移文件(SQL 变更脚本)这文件夹通常是用来存放模板文件,用来存放你们自己设计的前端代码。运行:python manage.py runserver。
2025-11-18 16:27:40
212
原创 Django 的配置文件 INSTALLED_APPS
Django 采用“模块化应用”结构,你的项目可以由多个 App 组成,比如:用户管理博客系统购物车AIbook(你自己写的 app)管理后台会话系统这些 App 都需要 Django 知道、加载并启用,才能正常运行。
2025-11-18 16:03:04
256
原创 Django 项目是什么
Django 是一个免费、开源、高级的后端 Web 开发框架,遵循 MVC(Model-View-Controller,但通常被描述为 MTV:Model-Template-View)设计模式,旨在帮助开发者快速、高效地构建安全、可扩展的 Web 应用程序。开发的 Web 应用程序。
2025-11-18 15:49:54
416
原创 AI绘画报错
提示输出验证失败:CheckpointLoaderSimple: - 值不在列表中:ckpt_name: 'v1-5-pruned-emaonly-fp16.safetensors' 不在 ['anything-v5-PrtRE.safetensors'] 中。现在你已经拥有运行所需的一切了。你最初生成的图片会很糟糕。但是继续尝试,很快你就能得到很棒的结果。点击同一行的小下载箭头。然后把文件放在:models/checkpoints文件夹里。这个文件放在:models/vae文件夹里。
2025-10-16 17:53:30
1155
原创 IntelllJ IDEA 打开别人项目没有自动配置导致运行按钮不能亮
在IntelliJ IDEA中运行按钮不可点击的常见原因包括:未识别构建工具、缺少运行配置、目录标记错误或依赖未加载。解决方案包括:检查并重新加载Maven/Gradle项目;手动创建运行配置;将源代码目录标记为SourcesRoot;检查JDK设置;安装必要插件或清除缓存。针对多模块或非标准结构的项目,需确保正确配置模块依赖。通过这些步骤通常可以恢复运行功能,若问题持续需检查项目类型和具体加载状态。
2025-06-21 20:42:38
607
原创 多头注意力机制中全连接函数
摘要:本文解析了Transformer多头注意力机制中的全连接层(nn.Linear)作用,指出其通过矩阵乘法加偏置实现线性变换。系统阐释了4个全连接层的分工:前3个分别处理Query、Key、Value,第4个负责多头输出的整合。重点说明输入输出维度d_model需保持一致的原因——确保注意力计算和残差连接的维度匹配。最后解释了clones函数的模块复制功能,强调这些全连接层是注意力机制的核心组件。
2025-06-21 18:07:48
478
原创 Dropout
本文介绍了神经网络中的Dropout正则化技术。Dropout通过在训练时随机丢弃部分神经元(概率p),防止模型过拟合和神经元共适应,提高泛化能力。测试时保留所有神经元但输出缩放(1-p)。PyTorch通过nn.Dropout实现,应用时需根据网络层类型选择合适p值(全连接层常用0.5,注意力机制0.1-0.2)。Dropout变体包括SpatialDropout、DropConnect等。该技术能有效提升模型性能,在Transformer等架构中广泛应用。
2025-06-21 17:56:25
571
原创 为什么要BRE
BPE(字节对编码)是自然语言处理中广泛使用的子词分词算法。其主要优势包括:1)通过子词组合解决未登录词问题;2)平衡词汇表大小与效率,减少参数量;3)捕捉词的形态结构和构词规则;4)提升模型泛化能力;5)适配GPT等大型预训练模型。BPE在控制词汇量、处理新词和提升模型性能方面表现突出,成为现代NLP的核心技术。
2025-06-21 17:08:02
700
原创 en解码成json
该Python脚本用于处理JSON格式的语料库文件,将训练集(train)、验证集(dev)和测试集(test)中的中英文文本分别提取并保存到两个单独的文件中。程序首先读取三个JSON文件,将中文内容(item[1])和英文内容(item[0])分别存入列表,然后以UTF-8编码写入到corpus.ch和corpus.en文件中。最终输出显示成功处理了252,777条中英文平行语料,并提示"Get Corpus!"完成信息。脚本特别处理了编码问题,确保非UTF-8字符不会导致写入失败。
2025-06-21 17:07:14
255
原创 基于Attention机制的模型。这使得它摆脱了RNN模型顺序读取序列的缺点,可以实现高度的并行化的理解
摘要:该模型完全基于注意力机制,摒弃了传统RNN的顺序计算结构,从而实现了高效的并行化。Attention机制直接计算序列中所有位置的关联关系,克服了RNN无法并行处理、长程依赖等问题。具体表现为:训练时可并行计算所有词表示,推理时内部计算仍保持并行。这种特性使Transformer等基于Attention的模型在性能上远超RNN,成为NLP主流架构的核心优势。
2025-06-21 16:08:49
1204
原创 TypeError: forward() missing 3 required positional arguments: ‘tgt‘, ‘src_mask‘, and ‘tgt_mask‘
摘要:该代码通过h.build_graph()可视化神经网络模型的计算图,其中第一个参数是PyTorch模型实例,第二个参数是模拟输入数据的零张量。示例使用的torch.zeros([1,1,28,28])对应单通道28x28灰度图像输入,其中1表示batch size。输入形状需与模型匹配,如RGB图像应为[1,3,224,224]。该虚拟输入用于追踪前向传播过程以构建计算图。
2025-06-20 18:25:10
262
原创 报错解决graphviz.backend.ExecutableNotFound: failed to execute [‘dot‘, ‘-Tpdf‘, ‘-O‘, ‘.\\demo1.png‘], m
摘要:本文介绍了如何解决PyTorch可视化工具torchviz报错问题,需先安装Graphviz程序并配置环境变量。示例代码展示了一个包含两个卷积层和全连接层的CNN网络,并使用torchviz的make_dot函数生成网络结构图。关键步骤包括:安装Graphviz、添加系统路径、定义网络结构、生成随机输入数据,最后将网络可视化输出为png格式的文件。该流程适用于深度学习模型的架构可视化需求。
2025-06-20 17:04:05
284
原创 为什么要使用MTD,之后还要使用 DataLoader
摘要:MTDataset和DataLoader采用职责分离设计原则,分别负责数据预处理和批量加载。MTDataset实现数据按需加载和标准化预处理,避免内存溢出;DataLoader提供批量生成、数据打乱和多进程并行加载功能,提升训练效率。这种设计具有三大优势:内存效率(动态加载)、训练加速(多进程预加载)和灵活批处理(支持不同批次大小)。通过单一职责划分,该架构有效解决了大数据处理、训练效率、模型泛化和代码复用等问题,特别适合大型数据集场景,符合软件工程最佳实践。
2025-06-20 09:12:43
364
原创 cv2.WINDOW_NORMAL不起作用
cv2.namedWindow('show_img',cv2.WINDOW_NORMAL)得在展示图片前面。
2024-11-24 15:02:12
208
原创 测试摄像头是连接到计算机的第几个接口
要测试摄像头是连接到计算机的第几个接口,你可以使用OpenCV来循环尝试打开不同的摄像头索引,并检查是否成功打开。
2024-11-21 16:26:05
164
原创 在使用OpenC显示过大的图片时,导致屏幕无法显示全的问题
使用`cv2.namedWindow()`函数的`cv2.WINDOW_AUTOSIZE`标志来创建窗口,并设置`cv2.imshow()`函数的第二个参数为`cv2.WINDOW_AUTOSIZE`。在调用`cv2.imshow()`之前,使用`cv2.namedWindow()`创建一个可以手动调整大小的窗口。这样,当图像大小大于窗口大小时,可以手动调整窗口大小以显示完整的图像。可以根据显示窗口的大小,将图像缩小到与窗口大小相同或稍大的尺寸。通过调整图像的尺寸,可以避免图像过大导致的显示问题。
2024-11-21 15:52:35
732
原创 什么是数据库
数据库(Database)是按照一定的数据模型组织、存储和管理数据的集合。它是用来高效地存储、检索、更新和管理数据的工具。数据库通常被用于信息系统中,以支持数据的持久化和高效访问。1. 数据的结构化:数据库中的数据是按照一定的结构或规则来组织的,例如表格形式。3. 高效性:数据库系统提供高效的数据操作方法,如查询、插入、更新和删除。2. 持久性:数据库中的数据可以长期存储,不会因程序关闭而丢失。简单来说,数据库是现代信息系统中核心的数据存储和管理工具。4. 并发性:支持多个用户同时访问和操作数据。
2024-11-19 08:54:24
287
原创 二值化图像反转
在这个示例中,我们首先读取一张输入图像并将其转换为灰度图。然后,我们使用`cv2.threshold`函数对图像进行二值化处理。接着,我们使用`cv2.bitwise_not`函数对二值化图像进行反转。最后,我们使用`cv2.imshow`函数显示原图、二值化图像和反转后的图像。二值化图像反转是一种图像处理技术,主要用于将二值化图像的像素值从0和1进行反转。在二值化图像中,像素值通常只有两个可能的值:0(黑色)和1(白色)。# 显示原图、二值化图像和反转后的图像。# 应用阈值处理,将图像二值化。
2024-10-23 19:15:13
686
原创 list index out of range
该报错是指你的列表索引值超过了列表的长度,检查一下你的常用读取序列的索引值。一直出现这个报错不知道什么情况。
2024-10-23 18:50:33
206
原创 什么是差动变压器的零点残余电压?产生的主要原因是什么?有哪些方法可以减少零点残余电压的影响?
(3)采用合适的补偿电路减少零点残余电压。一般可采用在变压器的二次侧串并联适当数值的电阻电容元件,适当调节这些元件,可以补偿零点残余电压。产生主要原因:零点残余电压主要是由传感器的两次级绕组的电气参数与几何尺寸不对称,以及磁性材料的非线性(铁磁饱和、磁滞损耗)等问题引起的。残余电压:当衔铁位于中心位置时, 差动变压器输出电压并不等于零, 我们把差动变压器在零位移时的输出电压称为零点残余电压。(1)尽可能保证传感器的两次级绕组的电气参数与几何尺寸不对称磁性材料经过处理,消除内部残余应力,使其内部均匀稳定。
2024-10-22 11:33:57
3822
原创 用直流电压激励会损坏差动变压器传感器,为什么
因为变压器初级直接接到了直流电压上,由于初级线圈的直流电阻很低,这样形成很大的直流电流,产生的热量如果足够大可能将初级线圈烧毁。
2024-10-22 11:30:55
897
原创 什么是图像增强
有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。
2024-10-22 09:47:21
188
原创 对图像进行傅立叶变换的目的是什么
1. 分析图像的频率成分:通过傅立叶变换,可以将图像从空间域转换到频率域,得到图像的频谱图。低频通常对应于图像中的平滑区域,而高频则对应于图像中的边缘和细节部分。通过低通滤波器可以去除图像中的高频噪声,而通过高通滤波器则可以增强图像的边缘信息。2. 提取图像特征:傅立叶变换可以用于提取图像的形状、纹理等特征。通过保留图像傅立叶系数中的低频部分并丢弃高频部分,可以实现对图像的有效压缩。综上所述,对图像进行傅立叶变换的主要目的是分析图像的频率成分、提取图像特征、实现图像增强与去噪、图像压缩以及利用卷积定理等。
2024-10-22 09:45:44
745
深度学习实验报告.doc
2025-05-31
基于MATLAB的二维图形绘制与数据可视化技术
2024-10-17
MATLAB程序设计实验:掌握M文件与流程控制
2024-10-17
MATLAB环境下的多项式与插值拟合数值运算实验指导
2024-10-17
MATLAB基础实验之向量、数组和字符串运算是如何掌握并应用于实践
2024-10-17
计算机科学实验教程:MATLAB入门与环境熟悉
2024-10-17
paesec远程控制软件
2024-05-09
极限存在准则与两个重要极限
2024-04-25
数据挖掘与分析实验课内容
2024-04-24
【自然语言处理】BPE算法原理与应用:基于SentencePiece的中英文分词及词表优化策略
2025-06-27
教育领域考试流程详细步骤解析:从打印准考证到完成各科考试的操作指南
2025-06-27
计算机二级考试Word操作要点:字体、段落、样式、表格等核心考点解析
2025-06-27
【数据库设计】B站用户与视频互动关系数据库设计:涵盖用户、视频、点赞、评论、关注、私信及投币功能的详细实现
2025-05-31
【数字图像处理】基于填空与选择题的数字图像基础知识点汇总:涵盖图像表示、噪声处理、边缘检测及压缩编码
2025-05-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅