- 博客(39)
- 收藏
- 关注
原创 05-矩阵理论复习第五章 向量与矩阵范数
本文为研究生矩阵理论复习笔记,重点总结了向量与矩阵范数相关内容,包括向量的1范数、2范数和无穷范数,以及矩阵的1范数、2范数、无穷范数和F范数等概念,并涉及谱半径相关知识。相关PDF文档可在作者主页资源栏目免费获取。
2025-12-14 18:51:26
326
原创 04矩阵理论复习-矩阵的分解
本文介绍了矩阵的五种重要分解形式,包括满秩分解、正交三角分解、奇异值分解、极分解和谱分解,这些分解方法是研究生矩阵理论课程的核心内容。文章提示相关配套PDF资料可在个人主页资源栏目第四章获取,为学习者提供了系统的复习资料。
2025-12-10 15:40:19
207
原创 03矩阵理论复习-内积空间和正规矩阵
本文是研究生矩阵理论第三章《内积空间和正规矩阵》的学习笔记,涵盖内积空间的核心概念与方法,包括度量矩阵、共轭转置、Schmidt正交化与单位化过程、酉变换与正交变换的性质、正规矩阵的判定条件、正交矩阵的特征,以及H-二次型的相关内容。完整配套资料可在作者主页资源栏目获取。
2025-12-10 15:30:43
290
原创 02矩阵理论复习-λ矩阵,Jordan标准型,最小多项式
本节内容是研究生矩阵理论课程期末复习第二章、第六章部分内容,包括λ矩阵,不变因子,行列式子因子,初等因子,Jordan标准型,相似变换矩阵,最小多项式等知识内容
2025-12-02 16:41:13
126
原创 01矩阵理论复习-线性空间和线性变换
本文基于《矩阵分析第二版》教材内容,重点梳理了线性代数核心概念。主要内容包括:线性空间的定义与性质、维数与基的求法、基变换与坐标变换公式;子空间的概念、判别方法及交与和的运算;直和与补子空间的性质;线性映射的核与值域;矩阵对角化条件及特征值求解。学习要求涵盖从基础概念理解到具体计算应用的九个方面,强调对线性空间结构、线性变换性质以及矩阵相似对角化条件的系统掌握。
2025-11-30 17:35:12
492
原创 《最优化理论与方法》习题
本文是研究生最优化理论与方法课程学习中平时作业的答案,包含算法迭代格式、收敛性分析等理论要点。重点阐述了最速下降法、单纯形法等典型算法的原理与应用,探讨了凸优化的优势及惩罚函数法的适用条件。通过计算题详细演示了梯度、Hesse阵求解,以及罚函数法、共轭梯度法等数值实现过程。证明部分建立了正交向量组与共轭向量组的关系,验证了凸锥性质及牛顿法在二次规划中的高效性。全文涵盖线性规划、非线性规划、动态规划等多类问题,并提供了MATLAB求解方法,构成了一套完整的优化理论体系。
2025-11-27 20:54:24
432
原创 最优化理论与方法复习笔记(期末速通-不用看课也能懂)
本文主要展现了小编在学习最优化理论与方法课程中的笔记记录,适合有基本基础的同学,期末速通,看完之后,可以解决大部分内容,特别是计算题
2025-11-27 20:25:20
123
原创 研究生论文写作全攻略:从入门到精通———学闵帆老师课程有感
本文总结了《论文写作》课程的核心要点与个人体会。课程系统讲解了论文结构规范、英语写作技巧、Latex排版工具等内容,强调科研写作是逻辑训练与思想表达的过程。文章分享了实用工具如Overleaf、LaTeX公式编辑器等,并详细解析了标题、摘要、引言等关键部分的写作方法。个人体会指出,论文写作应尽早开始,通过写作推动研究;要注重逻辑性而非文采;图表与文字同等重要;参考文献管理体现学术严谨性。课程使我认识到,规范的学术写作不仅能提升论文质量,更能培养严谨的科研思维。
2025-10-28 21:01:46
948
原创 5.吴恩达机器学习—神经网络的基本使用
本文介绍了神经网络的基本概念及其在TensorFlow中的实现方法。主要内容包括:1)神经网络由输入层、隐藏层和输出层组成,通过前向传播和反向传播算法进行训练;2)TensorFlow中使用矩阵表示数据,相比Numpy更高效;3)详细讲解了使用TensorFlow实现线性回归和逻辑回归的方法,包括数据预处理、模型构建和参数设置;4)展示了如何手动实现神经网络层函数,包括密集层计算和矩阵运算优化;5)介绍了数据归一化处理和使用Keras构建神经网络模型的步骤。
2025-09-30 17:46:25
1292
原创 4.机器学习-正则化的线性回归和逻辑回归计算公式及代码
本文介绍了正则化在线性回归和逻辑回归中的应用。对于线性回归,成本函数加入L2正则项以控制权重,计算公式包含平方误差项和权重平方和的调节项。逻辑回归部分同样采用L2正则化,其成本函数结合了交叉熵损失和权重正则化项,并给出了对应的梯度计算函数,在梯度更新中加入了正则化导数项。两种模型都通过调节参数λ来平衡拟合效果与模型复杂度,防止过拟合。
2025-09-25 10:00:00
611
原创 3.吴恩达机器学习笔记week3(线性回归模型、逻辑回归模型和正则化)
本文介绍了逻辑回归模型及其关键实现要点。首先指出线性回归不适用于分类任务,提出逻辑回归使用sigmoid函数将输出映射到(0,1)区间,形成概率预测。详细阐述了决策边界的数学推导和可视化表现,包括线性/非线性边界的示例。重点讲解了逻辑回归的损失函数设计(解决非凸问题)及成本函数实现代码,并给出了梯度下降算法的具体实现。最后讨论了过拟合问题及其解决方案,特别是正则化方法,包括正则化成本函数和梯度下降的公式推导及代码实现(线性回归和逻辑回归两种版本)。
2025-09-24 10:00:00
796
原创 2.机器学习单(多)特征梯度下降函数,成本函数的实现代码
本文介绍了三个机器学习关键函数的实现:1)单/多特征成本函数计算,分别通过线性预测和向量点积实现;2)单/多特征梯度下降偏导计算,多特征版本需处理向量偏导;3)统一的梯度下降更新函数,支持单/多特征参数更新,记录训练过程中的成本值和参数变化。所有函数均采用numpy数组操作,确保代码简洁高效,适用于不同维度的特征数据。
2025-09-22 11:06:00
378
原创 1.吴恩达机器学习笔记week1-2(线性回归模型及Sklearn的使用)
本文介绍了线性回归中的关键概念和实现方法。主要内容包括:1) 成本函数(J)和预测函数(f)的数学定义及Python实现;2) 梯度下降算法的原理和代码实现;3) 特征缩放方法(均值归一化和Z分数归一化);4) 多特征线性回归的实现;5) 学习率选择策略;6) 特征工程方法;7) 多项式回归;8) 使用Scikit-learn框架实现线性回归(包括StandardScaler标准化和SGDRegressor梯度下降)。
2025-09-19 17:32:55
790
原创 LangChain学习笔记07——底层代码解析之RunnableWithMessageHistory
摘要:RunnableWithMessageHistory是用于管理对话历史记录的组件,它通过包装其他Runnable来实现对话上下文的持久化。核心功能包括:1)自动存储和检索对话历史;2)通过session_id隔离不同会话;3)支持字典输入/输出的键名配置。使用时需定义历史存储工厂函数,并配置输入/历史消息键名,调用时通过config传递会话ID。支持多参数会话配置,建议生产环境使用Redis等持久化存储替代内存实现。常见问题包括历史消息注入异常和会话混淆,可通过检查键名匹配和使用UUID解决。
2025-08-11 10:30:00
521
原创 Redis基础入门
Redis是一个高性能内存数据库,支持多种数据结构。虽然官方不再支持Windows,但tporadowski移植版本提供了稳定可用的Windows版本(最新5.0.14.1)。安装过程包括下载解压、启动服务端/客户端、使用RedisInsight图形工具。文章详细介绍了字符串、哈希、列表等数据结构的常用命令操作,以及消息队列、地理位置等高级功能的使用方法,包括命令示例和结果解析。
2025-08-11 10:30:00
1200
原创 LangChain学习笔记06——底层代码解析之ChatPromptTemplate和PromptTemplate
LangChain框架中的PromptTemplate和ChatPromptTemplate是两种不同的提示词构建工具。PromptTemplate适用于非聊天型模型(如text-davinci-003),生成单字符串提示;而ChatPromptTemplate专为聊天模型(如gpt-3.5-turbo)设计,能构建包含多角色消息的对话结构。关键区别在于:PromptTemplate输出字符串,适合简单问答;ChatPromptTemplate输出消息对象列表,支持系统指令、用户输入等多轮对话场景
2025-08-08 10:56:29
819
原创 LangChain学习笔记05——多模态开发与工具使用
本文介绍了多模态集成开发与LCEL工具使用指南。在多模态开发部分,重点讲解了如何通过LangChain实现图文问答功能,包括图像向量化、文本嵌入和多模态融合,并提供了调用通义千问多模态API的完整代码示例。在LCEL工具部分,详细说明了工具调用、动态工具选择、组合工具流、错误处理和流式输出等核心功能,展示了如何通过管道符组合链式组件来构建复杂工作流。文章还提供了工具绑定的关键技巧和最佳实践建议,包括命名规范、类型提示和性能优化等内容。
2025-08-08 10:50:58
567
原创 LangChain学习笔记04——example selectors&LangServe基本使用
本文介绍了LangChain中的Few-shot提示和示例选择器技术,以及LangServe库的应用。主要内容包括:1. Few-shot技术通过提供少量示例帮助大模型理解任务,显著提升翻译等任务的表现;2. LangChain提供的多种示例选择器(如语义相似度选择器)能动态选取最相关示例;3. 代码演示了静态示例和动态选择器的使用方法;4. 应用场景包括智能客服、知识库问答、信息抽取等;5. LangServe库能快速将LangChain应用部署为RESTful API,支持自动文档生成和异步响应。这两项
2025-07-31 16:04:48
1212
3
原创 Pycharm点击设置无反应,代码没办法纠错,插件页面打不开解决方案
摘要:本文针对PyCharm无法打开设置和插件功能的问题提供了两种解决方案。对于旧版本(如2023版),问题通常由汉化包引起,可通过移除resources_cn.jar文件修复;对于2025版,则可能是插件冲突导致,建议检查并删除报错插件(如ml-llm插件)。两种方法都需通过文件操作临时禁用相关组件进行故障排查。操作前请注意备份文件,以便恢复必要功能。
2025-07-31 16:03:03
740
原创 LangChain学习笔记03——多步链实现与上下文记忆
本文介绍了LangChain框架中多步链的实现和上下文记忆机制。多步链部分展示了如何通过串联多个处理步骤(关键词提取、短文生成)构建复杂任务流程,使用DeepSeek API作为模型后端。上下文记忆部分解释了对话记忆的重要性,包括维持连贯性、个性化交互等功能,并演示了如何通过ConversationBufferMemory实现多轮对话记忆,保留历史对话信息。技术实现涉及记忆存储组件、提示模板中的记忆占位符以及带记忆功能的对话链构建,最后通过示例验证了系统能正确记住用户信息。
2025-07-30 11:51:43
606
原创 LangChain学习笔记02——LangChain基本使用
本文介绍了LangChain的基本使用流程,包括安装配置和首个程序的实现。首先通过pip安装LangChain和OpenAI包,然后获取DeepSeek的APIKEY并配置环境变量。代码示例演示了如何使用PromptTemplate+LLMChain生成营销文案:导入必要组件后初始化ChatOpenAI模型,设置DeepSeek的API端点等参数,创建处理链并调用生成指定主题的小红书营销短文。最后展示了以康师傅绿茶为主题生成的文案结果。
2025-07-30 11:47:36
627
原创 LangChain学习笔记01——基本概念及使用
LangChain是一个开源框架,用于开发基于大语言模型(LLM)的应用程序。它提供六大核心模块:模型交互、提示模板、数据连接、对话记忆、工作流链和智能代理,支持与GPT、Llama等模型集成。通过PromptTemplate标准化提示词,Chains串联多个步骤,Memory实现多轮对话,RetrievalQA构建知识库问答系统。其优势在于灵活组合这些模块,可应用于企业知识库、自动化数据分析等场景,相比直接调用API能实现更复杂的业务逻辑和工作流。框架还支持高级功能如RAG增强生成、多智能体协作和结构化输
2025-07-29 11:12:55
686
原创 Docker入门基础使用
Docker 是一个开源容器化平台,可将应用及其依赖打包成轻量级容器,实现跨平台运行。核心组件包括镜像、容器、Dockerfile等,常用命令涉及镜像管理、容器操作、数据卷和网络配置。Dockerfile用于构建镜像,Docker Compose可管理多容器应用。建议使用轻量基础镜像、多阶段构建优化镜像体积。Windows用户推荐Docker Desktop,注意镜像路径和性能优化。常见问题包括镜像拉取慢、端口访问失败等,可通过配置国内源、检查端口映射解决。学习资源推荐官方文档和GitHub实例。
2025-07-29 11:10:02
479
原创 大模型开发学习笔记02
通过算法和大量的数据训练,NLP模型能够 从复杂的语言输入中提取有意义的信息,从而在自动化服务、数据分析、内容生成等多个领域发挥重要作用。1.分词化:将段落的句子分割为更小的分词(token)的过程,将一个句子分解成更小的、独立的部分可以帮助计算机理解句子的各个部分,以及它们在上下文中的作用,这对于进行大量上下文的分析尤其重要。NLP是人工智能和计算机科学的一个重要分支,皆在是计算机能够理解和解释生成人类语言,它结合了计算机科学、语言学和数据科学的元素,用于解决与语言相关的各种问题。
2025-07-22 17:14:46
1045
原创 大模型开发学习笔记01
检索增强生成,企业数据–向量数据库,增加大模型的能力,检索外部知识;模型回答:“基础蛋糕做法:1. 混合面粉、糖、鸡蛋…模型可能回答:“蛋糕是一种甜点,由面粉、糖和鸡蛋制成。需要两个大模型:文本向量化模型(Embeding),推理模型(文本生成模型LLM)分类:大语言模型(LLM),多模态模型(计算机视觉模型、音频 处理模型)模型回答:“基础蛋糕做法:1. 准备材料:面粉100g、糖80g…企业私有数据–LLM重新训练,增加大模型内化能力,让大模型本身就会。:教会模型遵循指令,生成有用、安全的回复。
2025-07-22 17:12:45
946
原创 FastAPI 中间件的使用
在 FastAPI 中,中间件是处理 HTTP 请求和响应的拦截器客户端 → 中间件 → 路由处理 → 中间件 → 客户端# 请求处理前逻辑app = FastAPI() @app . middleware("http") async def custom_middleware(request : Request , call_next) : # 请求处理前逻辑 start_time = time . time() print(f"Request started for {
2025-07-18 14:46:42
1213
原创 FastAPI依赖注入
FastAPI 的依赖注入系统是其最强大的功能之一,它允许你声明组件(依赖项),并让 FastAPI 自动处理它们的注入。
2025-07-18 09:02:50
1223
原创 ORM分层模型设计
为了规范模型的创建与使用,减少不必要的代码冗余,维护数据的安全性,进行模型设计时,设置基本模型,输入模型,输出模型以及数据库操作模型;
2025-07-17 11:45:11
1118
原创 FastAPI字段校验(pydantic的使用)
gt=0,"gt": "年龄必须大于0","type_error": "年龄必须是整数"8. 第三方扩展库。
2025-07-17 10:55:05
1042
原创 SQLAlchemy 常见问题笔记
这种设计模式遵循SQLAlchemy的"Unit of Work"模式,开发者只需操作Python对象,ORM自动处理表映射和SQL生成。:将对象加入会话的"待处理"列表。
2025-07-17 10:47:01
1138
1
原创 Flask-SQLAlchemy 与 原生SQLAlchemy 创建的 ORM 比较
项目类型推荐方式基于 Flask 的项目(即更通用、可独立运行的项目使用如果你正在构建一个更偏企业级、模块化的系统(如 FastAPI 项目、Flask 服务+后台任务共用模型等),推荐使用原生 SQLAlchemy 模式,因为它更灵活,便于测试、解耦和重用模型。
2025-07-16 10:02:00
466
原创 Tortoise ORM 与 SQLAlchemy ORM对比
特性基类直接继承Model字段定义使用Column使用Field元数据通过指定表名通过类属性或自动生成关系定义使用ForeignKey使用维度SQLAlchemy定位全能型同步/异步 ORM + SQL 工具包专注异步的轻量级 ORM(类似 Django 风格)推荐场景- 复杂查询/事务- 混合使用 SQL 与 ORM- 同步项目- 纯异步项目(FastAPI/Sanic)- 简单 CRUD 场景核心优势灵活性高、功能全面、生态成熟异步友好、API 简洁、学习成本低需要复杂查询或。
2025-07-15 17:17:11
1438
原创 人工智能——机器学习算法分类
一般指通过训练多层网络结构对未知数据进行分类或回归有监督的学习方法–深度前馈网络、卷积神经网络口、循环神经网络等无监督学习方法–深度信念网、深度玻尔兹曼机,深度自编码器等。强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
2025-07-14 09:34:39
337
原创 常见4种主流ORM介绍与基本使用(Peewee ORM、Django ORM、SQLAlchemy ORM、Tortoise ORM)
对象关系映射(Object Relational Mapping,简称ORM)是一种程序设计技术,用于在面向对象编程语言和关系数据库之间进行数据转换。ORM的核心思想是通过创建一个“虚拟对象数据库”,使开发者可以使用面向对象的方式操作数据库,而不需要直接编写复杂的SQL语句。
2025-07-10 19:21:49
1751
【矩阵理论第五章 向量与矩阵范数】向量与矩阵范数理论及性质应用:非负性齐次性三角不等式验证与谱范数计算方法研究
2025-12-14
【第三章《内积空间和正规矩阵》】内积空间与正规矩阵理论:欧氏空间度量矩阵构建及Hermite二次型正定性分析
2025-12-10
【矩阵理论 第四章 矩阵的五种分解形式】矩阵五种分解形式解析:满秩分解、QR分解、奇异值分解、极分解与谱分解理论及应用
2025-12-10
矩阵理论复习笔记 第一章 线性空间和线性变换 数学线性空间与线性变换基础理论:矩阵表示、基变换及特征值分析在高维向量空间中的应用研究
2025-11-30
矩阵理论复习第二章、第六章 矩阵理论基于Smith标准形与初等因子的Jordan标准形分解:矩阵相似性分析与最小多项式应用研究
2025-12-02
【最优化理论与方法习题答案】经典算法迭代格式与收敛性分析:涵盖梯度法、单纯形法及罚函数法在各类数学规划中的应用研究
2025-11-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅