自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(69)
  • 资源 (2)
  • 收藏
  • 关注

原创 英文单词集合

integration 整合,

2025-12-15 08:59:16 69

原创 mysql拒绝连接

出现 “1698 - Access denied for user 'root'@'192.168.10.52'” 错误,通常是因为 MySQL 的 root 用户默认采用了 “auth_socket” 认证方式,仅允许本地通过 socket 连接,不支持远程密码认证。

2025-10-17 09:50:29 231

原创 AI超级智能体学习笔记

📕:学习链接SpringAI+RAG+MCP+Agent,AI 智能体企业级实战(25年必学 - 编程导航 - 程序员编程学习交流社区涉及到的知识点:

2025-10-13 23:44:29 367

原创 软考刷题--数据库

但这里大家要注意,如果一个关系有多个不同的主码时,那么这些主码组合在一起就是候选码,也就是说一个关系的主码只能选一个,而候选码可以有多个,这就好选总统一样,候选人可以多个,但最终的总统只能有一个,当然也有些地方的候选人就只有一个,候选码也一样,也有可能只有一个,在这种情况下,候选码就是主码。,一个关系模式中的属性不是主属性就是非主属性。组成候选码的属性就是主属性,其它的就是非主属性,所以要判断关系模式中的属性是主属性还是非主属性,首先要求解出其候选码。所以该关系中的属性都是主属性,没有非主属性。

2025-10-13 23:11:16 152

原创 大模型基础

大模型应用与智能体系统研究摘要 本文探讨了大语言模型(LLM)的基础原理与应用实践。LLM通过海量数据训练,能够基于输入预测输出内容,其核心处理流程包括词表转换、概率计算和输出生成。针对现有模型的局限性,研究者提出了嵌入空间改进方案。智能体(Agent)作为自主决策系统,结合LLM实现任务推理与执行,但在实时训练、数据更新和外部交互等方面仍面临挑战。文章还分析了LoRA微调、矢量数据库等关键技术,并探讨了大模型时代的新型人机交互范式。

2025-10-12 20:50:15 414

原创 异步数据库基本代码实现

的完整逻辑(过滤、关联、分组等)封装成一个 “临时结果集”,然后基于这个结果集计数。数据库的查询、过滤和查询总数 total。2.添加过滤条件 使用 filter。构建查询 -> 执行任务 -> 获取结果。

2025-10-11 14:23:12 354

原创 操作系统第二章总结

同一进程中的线程切换,需要从用户态切换到核心态,系统开销较大,这是因为用户进程的线程运行在用户态,而线程调度和管理是在内核态实现的。同一进程中的线程切换,需要从用户态切换到核心态,系统开销较大,这是因为用户进程的线程运行在用户态,而线程调度和管理是在内核态实现的。克服了多对一模型并发度不高的缺点(一个阻塞,全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。⭐线程没有提高安全性,相反,线程共享进程的地址空间和资源,若一个线程出错,则可能影响整个进程的运行。高级调度,作业调度。

2025-10-07 11:09:20 939

原创 intel安装pytorch

选择的是安装everying ,这个好像需要先安装visual studio,我安装的2022。不知道为啥,一直说缺乏依赖包。然后把win11的自动更新开开了,更新完重启发现可以了。emmmm,可以了发现显存不够。安装完之后,在程序里执行。

2025-10-04 22:01:52 357

原创 操作系统 02 进程与线程

刷完题了,总结一下常考的地方。

2025-10-04 17:32:06 358

原创 操作系统第一章

C 计算机资源DDDB?对 B操作系统最基本的特征是并发和共享,两者互为存在条件。CB操作系统主要向用户提供命令接口和程序接口(系统调用)。B?系统调用是操作系统为应用程序使用内核功能所提供的接口。CAA?什么是联机用户接口 什么是脱机用户接口 什么是程序接口 什么是图形接口?按命令控制方式的不同,可分为联机用户接口和脱机用户接口。D单处理机 并行执行 处理机与设备 处理机与通道 设备与设备 D?A。

2025-10-04 15:00:14 656

原创 MinerU学习

定义:vlm 是 “视觉语言模型”(Visual-Language Model)的缩写,核心逻辑是 “让模型同时理解‘图像信息’和‘语言信息’”—— 它能直接把 “包含表格的页面” 当作一张 “图像”,结合对 “表格结构、文字含义” 的语言理解,一次性完成 “表格定位、内容提取、结构还原”,甚至跨页合并。具体工作流程(以表格解析为例)输入:页面图像 + 任务指令:把 “包含跨页表格的第 2 页” 图像输入模型,同时给出指令(如 “提取此页面的表格,并判断是否与上一页表格合并”);模型理解:视觉 + 语言。

2025-09-13 23:55:41 578

原创 db.refresh()的重复使用和db.rollback()

在 SQLAlchemy 中,用于从数据库中重新加载对象的状态,确保对象属性与数据库中的实际数据保持一致。下面详细介绍其使用场景和作用:1.获取数据库生成的值当数据库自动生成字段(如自增 ID、默认值、触发器计算的值)时,refresh。

2025-07-16 11:11:12 512

原创 数据库 N+1 问题

N+1问题是指:首先执行1次查询获取N条主记录然后对每条主记录执行1次查询获取关联数据总共需要执行N+1次查询(N次关联查询+1次主查询)

2025-07-10 10:02:38 414

原创 Python日志功能的使用

默认日志输出到控制台,可以配置将日志输出到文件中。日志级别用于控制日志的详细程度。

2025-05-20 14:36:12 430 1

原创 循环导入(Circular Import) 错误

ImportError: cannot import name 'event_type_data_tree' from partially initialized module 'routers.ticket' (most likely due to a circular import) (E:\ai12345\backend\app\routers\ticket.py) 这是什么错,中文回答。1.模块A 导入 模块B,同时模块B 又导入 模块A。:调整代码顺序,或者改用局部导入(在函数内部导入)。

2025-05-16 16:02:31 838

原创 pytorch|找不到 fbgemm.dll 问题

项目首页 - Dependencies:A rewrite of the old legacy software "depends.exe" in C# for Windows devs to troubleshoot dll load dependencies issues. - GitCode。下载某一个版本的dll文件,放到C:\Windows\System32中。下载完,解压,将这两个文件复制粘贴到C:\Windows\System32。在此处下载,下载完毕后,解压打开,然后运行。

2025-04-27 11:33:47 623

原创 使用geek卸载360之后,360仍存在且出现双击图标找不到应用程序的问题

问题的起因是下载一个软件,没看清误用了360管家的下载链接,然后就携带了一堆捆绑软件。使用geek卸载,geek的好处是可以删除用户注册表,删的干净,但这样的作法其实是以毒攻毒。使用geek卸载360之后,出现了程序面板和电脑管家的软件都不显示360,但是开机还是有360启动提示的问题。如图所示:但是桌面上仍然存在:离谱至极,并且出现了其它的错误,比如:第一个问题:双击文件夹,显示 找不到应用程序的问题。

2025-04-23 15:05:17 1767

原创 返回了 “空套件“(no tests ran) 和 退出代码 5(表示没有收集到测试)

这个报错信息是指,因此返回了和(表示没有收集到测试)。

2025-04-22 10:13:09 686

原创 小样本学习综述

小样本学习综述📕[1]潘雪玲,李国和,郑艺峰. 面向深度网络的小样本学习综述 [J]. 计算机应用研究, 2023, 40 (10): 2881-2888+2895. DOI:10.19734/j.issn.1001-3695.2023.02.0074.主要是该论文的一些摘要。背景:然而,标注数据的收集与获取需要消耗大量的人力与时间,并且在某些领域(例如医学、军事和金融等)中,由于隐私安全等问题无法获得充足的样本。研究人员提出小样本学习(few-shotlearning)。

2025-03-21 15:57:45 923 1

原创 神经网络的基本知识

它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。:全连接层将前一层的所有输出与当前层的每个神经元连接,能够整合前一层的局部或全局特征,生成新的特征表示。Softmax 通过指数运算放大高分值的类别,抑制低分值的类别,使得高分值的类别概率更接近 1,低分值的类别概率更接近 0。RNN不同于前向神经网络,它的层内、层与层之间的信息可以双向传递,更高效地存储信息,通常用于处理信息序列的任务。

2025-03-15 22:50:06 1373 1

原创 大模型后训练+微调

首先回顾大模型的训练流程。大模型的训练流程包括预训练和后训练。预训练是使用大规模的训练语料训练模型,主要是让模型获得先验知识,能够完成基本的补全任务(理解:让模型读书,让它学会一些基本预测。比如:第一个字是“中” 学会预测第二个词是“国”)后训练是经过指令微调和偏好优化,让模型的输出具有某些特定格式,能够满足人类偏好。什么是指令微调?指令微调就是用一些人工标注的数据去训练模型,让模型会做题,会根据问题输出正确的答案。

2025-03-15 18:36:06 993

原创 概率论的基本知识

逆概率还不懂,改天再想想。

2025-03-13 16:04:57 604

原创 线代的基本知识

仿射函数(Affine Function)是线性函数的推广形式,它由一个线性变换和一个平移组成。仿射函数在几何上表示为一个线性变换后加上一个常数偏移。

2025-03-13 15:24:03 307

原创 自然语言处理预训练模型的研究综述

第一个任务是Mask LM(MLM),为了解决GPT完全舍弃下文的问题,不再进行整个句子的预测而是对某个词去做预测,首先屏蔽一定百分比的词,然后通过模型实现对屏蔽词的预测,来进行训练。二是预测的是屏蔽掉的是词而非句子,会使整个句子预训练的收敛速度更慢。N-gram是自然语言处理领域中具有显著历史意义的特征处理模型,基本思想是将文本内容按照字节大小为N的滑动窗口进行操作,形成长度是N的字节片段序列,然后对所有的序列的出现频度进行统计,并且按照实现设定好的阈值进行过滤,形成了这个文本的特征向量空间。

2025-03-12 20:51:09 797

原创 BERT、T5、GPTs,Llama

(本系列是课程笔记)Encoder-only 架构的代表——BERT结构特点:只有编码器(1)编码器结构:每个编码器layer中包含一个多头自注意力(无mask)和FFN(2)双向:每个位置可以看到序列前后的位置(无mask)双向:每个位置可以看到序列前后的位置(无mask)BERT-base 包含 12 个 Transformer 层,每层中的多 头注意力机制 包含 12 个头, 隐状态的维度为 768,总参数 量约 110M,与 GPT 的参数量相当。

2025-03-08 13:55:58 1678

原创 Transformer的基本知识点

(本系列是课程笔记)背景:1.循环模型RNN、LSTM是当时序列模型的主流,但是循环模型需要序列化计算,难以并行,计算效率较差,并且难以捕捉长距离依赖关系。2.注意力机制,可以捕捉长距离依赖,聚焦关键信息,并行度较高。【总结思路:循环模型摒弃,seq2seq比较好保留,注意力机制也保留】(1)去掉了循环神经网络结构(效率低,无法并行训练)(2)遵循seq2seq结构,encoder+decoder(3)大量重复使用attention(attention is all you need)编码器。

2025-03-07 22:17:34 1470

原创 常见的模型结构

感觉,Q是当前关注的词的向量,K是这个句子里每个词的向量,Q和K分别计算一下相似度,就知道 【我要查的词】 和这个句子里的哪个词相似度最高了,这几个词的注意力得分最高,那么在这个句子里 它们和我要查找的东西最有关系,最后在加权求和,就能得到这个句子调整过注意力后,最终要输出的东西。⭐因为K 和V 是相同的,所以可以理解为:我先用V的分身去和Q计算一下相似度,我就知道应该关注V的哪一部分了,然后再用V的注意力权重 加权求和 ,最后得到output。Q是查询向量,K是关键向量,V代表数值向量。

2025-03-06 16:47:56 735

原创 大模型的基础知识

embedding(本系列是课程笔记)NLP中如何对文本进行预处理(将文本转换为训练数据)?词元化:分词,变成token 最后再嵌入转换变成训练数据三个基本概念:token(词元)、tokenization(词元化/分词)、词表。Subword Tokenization: Byte Pair Encoding (BPE,字节对编码)核心思路:不断将最频繁出现的一对词元合并成一个词元。刚开始每个字符为一个词元,然后找一直成对出现的将他们合并成新的词元,一直循环。

2025-03-06 12:26:24 1306

原创 大模型概述

在某些情况下,可能需要根据特定需求自定义损失函数。4. 优化器选择优化器用于更新模型参数以最小化损失函数。

2025-03-06 10:51:49 767

原创 大模型简介

大语言模型:拿到一个很复杂的数据集,然后用一个算法去压缩它,得到一个相对较小的模型,然后针对任务再用一点点数据集来调整。

2025-03-05 23:05:23 317

原创 anaconda配置pytorch

安装pytorch

2025-03-01 15:42:06 853

原创 大模型简介

刚开始是基于规则的,后期是基于概率的。然后呢,我们要把这些概率建模成条件概率,然后就知道这个词后边可能是哪个词了。理解:将概率,建模成条件概率,然后每次选概率最大的。理解为: Today后面出现is的可能性最大。图灵机(Turing Machine)是由英国数学家艾伦·图灵(Alan Turing)于1936年提出的一种抽象计算模型,用于严格定义“可计算性”的概念。它是计算机科学的理论基础,为现代计算机的设计和计算理论奠定了数学基础。图灵机的核心思想。

2025-02-06 19:46:59 323

原创 进程同步、互斥

P0先说自己想进,然后谦让让P1先进,但此时P1不想进,所以P0进入临界区,若此时⑥执行,那就是P1说他想进了,然后P1谦让让P0先进,P1循环检查时发现此时的条件是(P0想进,并且此时turn=0)所以P0继续访问,P1等待,直到P0访问完改成P0不想访问了,P1才能继续访问。P0说P0想进,然后P1说P1想进,然后P0说P1先进,然后P1说P0先进,最后turn=0,等到P0检查时条件为(P1想进,但turn=0,不等于1)所以P0先访问临界区。对临界资源的访问,必须互斥地进行。(就是无法实现互斥)。

2024-10-19 20:33:49 692 1

原创 机器字长、存储字长、指令字长;时钟周期、机器周期、指令周期、存取周期

机器字长、指令字长和存储字长,三者在数值上可以相等也可以不等,视不同机器而定。一个存储单元中的二进制代码的位数称为存储字长。存储字长等于MDR的位数,而数据字长是数据总线一次能并行传送信息的位数,它可以不等于MDR的位数。🌳🌳🌳前言:本文总结了计算机组成原理中的各种周期。目录时钟周期机器周期指令周期存取周期总结存取周期错题1.时钟周期也称节拍、T周期或CPU时钟周期,它是CPU操作的最基本单位2.一个机器周期又包含若干时钟周期。

2024-10-18 17:48:06 1750

原创 python基础知识——正则

正则表达式由需要匹配的字符串和一些特殊字符组成,可以在字符串当中匹配出需要查找的对象。

2024-10-18 16:41:00 210

原创 第六章 6.5 文件传送协议FTP+6.6电子邮件+6.7万维网WWW

HTTP定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器。

2024-09-30 16:57:47 732

原创 第六章 6.1应用层概述+6.2客户-服务器方式和P2P方式+6.3 动态主机配置协议DHCP+6.4域名系统

应用层:解决通过应用进程的交互来实现特定网络应用的问题应用层是计算机网络体系结构的最顶层,是设计和建立计算机网络的最终目的,也是计算机网络中发展最快的部分。

2024-09-30 15:48:00 806

原创 第五章 5.3传输控制协议 TCP报文段的首部格式+

TCP是面向字节流的,TCP的全部功能需要依靠其首部中的各字段来实现。

2024-09-30 15:03:10 762

原创 第五章 5.2 UDP和TCP的对比

必须使用“三报文”握手来建立TCP连接,TCP连接建立成功后,才能基于已建立好的TCP连接进行数据传输。接收方的TCP,一方面从所接收到的TCP报文段中取出数据载荷并存储在接收缓存中。TCP不保证接收方应用进程所接收到的数据块,与发送方应用进程所发出的应用层报文之间具有对应大小的关系。TCP根据发送策略,从发送缓存中提取一定数量的字节,构建TCP报文段并进行发送。UDP对应用进程交付下来的报文,既不合并也不拆分,而是保留这些报文的边界。(单播、多播、广播)TCP提供的是面向连接的可靠的数据传输服务。

2024-09-30 10:27:49 358

原创 第五章 运输层 5.1运输层概述

第2~4章依次介绍了计算机网络体系结构中的物理层、数据链路层和网络层,它们共同解决了将主机通过异构网络互联起来所面临的问题,实现了主机到主机的通信。然而在计算机网络中实际进行通信的真正实体,是位于通信两端主机中的进程。如何为运行在不同主机上的应用进程提供直接的逻辑通信服务,就是运输层的主要任务。运输层协议又称为端到端协议。主机A中的运输层使用不同的端口,对应不同的应用进程,然后通过网络层及其下层传输应用层报文。

2024-09-30 10:17:43 1010

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除