柠石榴-优快云博客

原创【笔记——李沐动手学深度学习】3.1 线性回归

本文介绍了线性回归模型的基础知识。主要内容包括：线性模型是最基础的神经网络模型，构建过程完整且架构简单，适合作为学习复杂模型的基础；使用平方损失函数衡量预测误差；参数学习通过最小化损失函数实现；线性模型具有显示解且损失函数是凸函数；基础优化算法采用梯度下降和小批量随机梯度下降，其中学习率和批量大小是两个关键超参数。文章还通过房价预测案例展示了线性模型的应用，并解释了梯度下降算法中选择合适学习率的重要性。

2025-07-29 10:23:01 412

原创【笔记——李沐动手学深度学习】2.4 微积分 2.5 自动微分

本文介绍了PyTorch中的自动微分机制，重点讲解了梯度计算的基本原理和使用方法。主要内容包括：1) 通过一个向量求导示例演示了梯度追踪、反向传播和梯度验证的完整流程；2) 解释了非标量反向传播的两种处理方法；3) 说明了如何通过detach()分离计算；4) 强调了PyTorch能够处理包含控制流的复杂计算图的梯度计算。这些自动微分功能为深度学习优化算法提供了核心支持，使开发者能够高效地计算各种复杂函数的梯度。

2025-06-29 14:30:57 364

原创【笔记——李沐动手学深度学习】2.3 线性代数

下面的代码将实例化两个标量，并执行一些熟悉的算术运算，即加法、减、乘法、除法和指数。将张量乘以或加上一个标量不会改变张量的形状，其中张量的每个元素都将与标量相加或相乘。将两个相同形状的矩阵相加，会在这两个矩阵上执行元素加法。一般来说，张量可以具有任意长度，取决于机器的内存限制。可以通过执行按元素乘法，然后进行求和来表示两个向量的点积。则代表多维（>2），但是张量也可以代表标量/向量/矩阵。来引用向量的任一元素，例如可以通过。调用函数来实例化张量时，我们可以[，可以表示任意形状张量的元素和。

2025-06-25 22:41:01 706

原创【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》

本文提出开源语言模型系列CodeS（1B-15B参数）以解决Text-to-SQL任务依赖闭源大模型的问题。通过增量预训练21.5GB SQL语料，结合模式链接优化和双向数据增强技术，CodeS在Spider、BIRD等9个基准上取得SOTA结果，参数规模缩小10-100倍。创新点包括：1）填补开源Text-to-SQL模型空白；2）增量预训练提升SQL能力；3）双向数据增强增强领域适应。实验显示CodeS在准确性和鲁棒性上优于GPT-4等方法，同时开源模型降低了部署成本。不足在于15B模型可能存在过拟合，

2025-06-18 15:33:20 938 1

原创【笔记——李沐动手学深度学习】2.2 数据预处理

摘要本文介绍了使用pandas进行数据预处理的全过程：(1)通过read_csv读取CSV格式的房屋数据集，包含房间数、巷子类型和价格三列；(2)处理缺失值时，对数值列采用均值插值，对类别型变量进行独热编码；(3)最终将处理后的数据转换为张量格式。文章特别指出在实现过程中遇到的类型转换问题及解决方案，包括对字符串列的特殊处理和布尔值转整数的方法。作者总结提出需要系统记录不熟悉的函数用法，以巩固数据处理的基础知识。整个预处理流程展示了pandas与深度学习张量的兼容性，以及处理缺失数据的两种主要方法：插值法

2025-06-17 22:25:27 249

原创【笔记——李沐动手学深度学习】2.1 数据操作

摘要本文介绍了机器学习中N维数组的基本概念与数据操作实现。N维数组是机器学习和神经网络的核心数据结构，从标量(0维)到视频批量(5维)有不同应用场景。文章详细讲解了张量(tensor)的操作方法，包括创建数组、形状变换、初始化、运算、索引切片等技术要点。通过PyTorch示例展示了如何高效处理张量数据，涵盖广播机制、内存优化等关键技巧。最后简要提及数据预处理中CSV文件的读取方法。全文提供了从理论到实践的完整数据操作指南，适合机器学习初学者掌握基础数据结构处理方法。

2025-06-17 22:19:17 870

原创【论文阅读笔记】《Few-shot Text-to-SQL Translation using Structure and Content Prompt Learning》

《少样本Text-to-SQL翻译的结构与内容提示学习》提出SC-Prompt框架，通过分阶段处理SQL结构和内容生成，结合混合提示策略与约束解码机制，显著提升了在训练数据有限场景下的模型性能。该方法采用T5预训练语言模型，在Spider等基准测试中仅用5%训练数据就超越现有最佳方法约5%准确率。研究创新性地降低了任务复杂度，减少了对大量标注数据的依赖，但尚需验证在其他语义解析任务上的适用性。未来将探索该方法在更复杂数据库场景的应用，为低资源环境下的自然语言数据库查询提供实用解决方案。

2025-06-17 16:35:00 495 1

原创《机器学习》（周志华）第二章模型评估与选择

AUC 越大，证明排序的质量越好，AUC 为 1 时，证明所有正例排在了负例的前面，AUC 为 0 时，所有的负例排在了正例的前面。显然，我们希望得到的是在新样本上表现得很好的学习器，即泛化误差小的学习器。，设定一个阈值，大于阈值为正例，小于阈值为负例，因此这个实值的好坏直接决定了学习器的泛化性能，若将这些实值排序，则。上面的方法中，将学习器的犯错同等对待，但在现实生活中，将正例预测成假例与将假例预测成正例的代价常常是不一样的。在非均等错误代价下，我们希望的是最小化“总体代价”，这样。

2025-06-09 16:35:07 1086

原创【论文阅读笔记】《A survey on deep learning approaches for text-to-SQL》

《A survey on deep learning approaches for text-to-SQL》阅读笔记

2025-06-07 11:30:16 956 1

原创《机器学习》（周志华）第一章绪论

其所研究的主要内容，是关于在计算机上从数据中产生“模型”(model)的算法，即“学习算法”(learning algorithm)。分类中又可分为二分类与多分类任务，二分类顾名思义，只需分2类，一般分别称为“正类”与“反类”，且一般正类用“1”表示，反类用“0”表示。信息，计算机需要自行寻找特征，将这些数据分为几个簇，然后将陌生的数据分到计算机自己划分的几个簇中的过程。信息，计算机通过学习这些训练数据，将未出现在训练样本中的陌生的数据分到已有的类别中的过程。一批关于某种事物的数据的集合称为一个。

2025-06-07 09:29:01 946 1

原创【论文阅读笔记】Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation

本文系统评估了基于大型语言模型（LLM）的Text-to-SQL技术，提出新型框架DAIL-SQL，在Spider数据集上创下86.6%的执行准确率新纪录。研究比较了多种提示工程方法，包括问题表示和示例选择策略，并验证了开源LLM（如LLaMA、Vicuna）通过监督微调可达到与商用模型相当的性能。作者特别强调提示工程的token效率优化，指出当前研究在SQL生成正确性优先于查询效率、大规模数据库适应性等方面的局限。未来工作将探索更多规则提示、扩展训练数据，并研究高效SQL生成方法。

2025-06-04 18:01:52 1205 2

原创【论文阅读】HEXGEN-TEXT2SQL: Optimizing LLM Inference Request Scheduling for Agentic Text-to-SQL Workflows

HEXGEN-TEXT2SQL: 异构GPU集群上优化多阶段Text-to-SQL工作流的LLM推理调度框架本文提出HEXGEN-TEXT2SQL框架，针对异构GPU集群中多阶段LLM驱动的Text-to-SQL工作流调度问题。通过分层调度方法（全局负载均衡+局部紧急性优先级队列）和轻量级仿真优化超参数，系统显著提升资源利用率并降低SLO违规率。实验显示，相比vLLM基线，该框架将延迟缩短1.41倍，吞吐量提升1.65倍。不足在于复杂查询优化和多租户公平性保障有待改进，未来可结合查询分析和动态资源分配进一

2025-06-02 16:00:53 924 1

原创 5.28 孔老师 nlp讲座

本次讲座系统介绍了语言模型的发展与应用。内容涵盖：语言模型的起源（源于语音识别中的统计模型）与基本概念；N元语言模型及平滑技术解决零概率问题；神经网络在语言建模中的演进，从词向量到RNN；预训练模型（如GPT、BERT）及其跨领域应用。特别强调学生需掌握预训练模型基础以参与实验研究，并安排后续NLP应用分享。会议待办包括调整讲解时间及入学前知识准备要求。讲座展现了语言模型从传统统计方法到深度学习的技术演进脉络。

2025-05-29 11:43:37 684

原创《深度学习入门》第 3 章神经网络

神经网络基础与实现摘要本章介绍了从感知机到神经网络的发展过程，重点阐述了激活函数的作用和神经网络的实现原理。主要内容包括：神经网络基本结构：输入层、隐藏层和输出层，通过激活函数处理输入信号的总和常用激活函数及其实现：阶跃函数：简单二值输出 sigmoid函数：平滑输出(0,1)，利于神经网络学习 ReLU函数：max(0,x)，目前广泛使用多维数组运算：使用np.dot()实现矩阵乘法，高效计算神经网络各层间传递 3层神经网络实现示例：通过权重矩阵和偏置向量实现层间信号传递使用sigmoid作

2025-05-29 11:14:46 724

原创《深度学习入门》第2章感知机

感知机是一种简单的二分类模型，通过权重和偏置对输入进行线性组合，并根据阈值判断输出。本文介绍了感知机的基本概念及其在逻辑电路中的应用，如与门、与非门和或门的实现。通过Python代码展示了如何用感知机实现这些逻辑门，并讨论了感知机的局限性，特别是无法直接实现异或门的问题。最后，通过组合多个感知机，构建了多层感知机，成功实现了异或门，展示了感知机在非线性问题中的扩展能力。

2025-05-21 10:23:34 464

原创《深度学习入门》第1章

本文主要介绍了Python中NumPy和Matplotlib库的基本用法。NumPy部分涵盖了数组的生成、算术运算、多维数组的操作、广播功能以及元素的访问。Matplotlib部分则介绍了如何绘制简单图形、使用pyplot功能以及显示图像。通过这些基础操作，用户可以高效处理数值数据并进行可视化展示。文章还提供了相关代码示例和图片描述，帮助读者更好地理解和使用这些工具。

2025-05-21 10:23:09 301

原创【研0学习计划表】

研0学习计划

2025-05-16 15:43:15 638

原创【python编程从入门到到实践】第九章类

本文介绍了Python中类的创建、使用、继承、导入以及编程风格。首先，类名应首字母大写，使用双下划线定义__init__方法。通过类可以创建实例，访问属性和调用方法。类可以继承父类，子类可以定义新属性和方法，并重写父类方法。类可以从模块中导入，支持导入单个类、多个类或整个模块。Python标准库提供了丰富的功能，如random模块的randint()函数。编程风格上，类名应首字母大写且不使用下划线，实例名和模块名应全小写并使用下划线，每个类定义后应添加文档字符串。

2025-05-16 15:40:39 643

原创【python编程从入门到到实践】第十章文件和异常

此时，将每行左端的空格也加入了字符串。

2025-05-16 15:39:23 428

原创【python编程从入门到到实践】第八章函数

本文介绍了Python中函数的基本使用和高级特性。首先，通过定义简单的函数greet_user展示了函数的基本结构。接着，讲解了如何向函数传递信息，并通过位置实参、关键字实参和默认值的方式传递参数。文章还介绍了函数的返回值，包括返回简单值、可选参数、字典以及结合while循环的使用。此外，讨论了如何传递列表，并避免函数修改原列表。最后，介绍了如何传递任意数量的实参，以及将函数存储在模块中并通过导入模块或特定函数来调用。这些内容涵盖了Python函数的基础和进阶用法，帮助读者更好地理解和使用函数。

2025-05-14 15:05:36 404

原创【python编程从入门到到实践】第七章用户输入和while循环

本文介绍了Python中input()函数和while循环的基本用法。首先，input()函数用于获取用户输入，可以通过添加提示信息和使用int()函数将输入转换为数值。其次，while循环用于重复执行代码块，可以通过条件判断、标志变量、break和continue语句来控制循环的执行。此外，文章还展示了如何在while循环中处理列表和字典，包括移动列表元素、删除特定值的元素以及使用用户输入填充字典。这些技巧有助于编写更灵活和交互性强的Python程序。

2025-05-14 15:04:49 162

原创【python编程从入门到到实践】第六章字典

【python编程从入门到到实践】第六章字典

2025-05-11 17:01:56 447

原创如何读论文【论文精读】李沐老师视频笔记

李沐老师在视频《如何读论文【论文精读·1】》中分享了他高效阅读学术论文的方法。论文通常包括标题、摘要、导言、方法、实验和结论六个部分。李沐建议分三遍阅读论文：第一遍通过标题、摘要、结论和实验部分快速判断论文的相关性和质量；第二遍略读全文，关注关键图表和文献引用，理解论文的主要内容和结构；第三遍进行精读，深入理解每一句话和段落，思考如何应用或改进作者的方法。这种方法帮助读者快速筛选并深入理解学术论文，提高研究效率。

2025-05-11 17:00:56 406

原创【python编程从入门到到实践】第五章 if 语句

【代码】【python编程从入门到到实践】第五章 if 语句。

2025-04-21 09:21:50 175

原创【python编程从入门到到实践】第四章操作列表

分别表示列表中的元素和列表，如。

2025-04-20 20:18:24 512

原创【python编程从入门到到实践】第三章列表简介

【代码】【python编程从入门到到实践】第三章列表简介。

2025-04-20 09:28:15 124

原创【python编程从入门到到实践】第二章变量和简单的数据类型

只要有一个数为浮点数，最终结果就为浮点数。_下划线划分数字，易清晰阅读。

2025-04-19 10:18:08 140

原创 C语言【输出字符串中的大写字母】

输出字符串中的大写字母。

2025-04-09 21:01:04 261

原创 C语言【模仿strcpy】

注意需要在复制的字符串结尾加。

2025-04-09 21:00:41 263

原创 C语言【字符串转整型】

模仿 C 库函数 atoi（ASCII 到整数），编写一个函数，接收一个字符串，然后尝试将其解析并转换为整数。函数常用于需要在字符串中查找特定字符集合首次出现位置的场景，比如在解析文本时跳过不包含某些特定字符的部分。可以直接用atoi，或手动，如下。

2025-04-07 09:45:52 335

原创 C语言【冒泡排序】

注意for的边界条件，可以加标志位提前终止循环。

2025-04-07 09:45:31 197

原创 C语言【删除前导空格】

【代码】C语言【删除前导空格】

2025-04-06 12:08:10 466 1

原创【回文数的判断】

找到1000~9999之间的所有回文数，每行最多10个数；

2025-04-06 11:26:07 167

原创【练习】PAT 乙 1088 三人行

本题给定甲、乙、丙三个人的能力值关系为：甲的能力值确定是 2 位正整数；把甲的能力值的 2 个数字调换位置就是乙的能力值；甲乙两人能力差是丙的能力值的 X 倍；乙的能力值是丙的 Y 倍。请你指出谁比你强应“从之”，谁比你弱应“改之”。在一行中首先输出甲的能力值，随后依次输出甲、乙、丙三人与你的关系：如果其比你强，输出 Cong；比你弱则输出 Gai。输入在一行中给出三个数，依次为：M（你自己的能力值）、X 和 Y。注意：如果解不唯一，则以甲的最大解为准进行判断；子曰：“三人行，必有我师焉。

2025-03-27 17:59:53 217

原创【练习】PAT 乙 1087 有多少不同的值

当自然数 n 依次取 1、2、3、……、N 时，算式 ⌊n/2⌋+⌊n/3⌋+⌊n/5⌋ 有多少个不同的值？（注：⌊x⌋ 为取整函数，表示不超过 x 的最大自然数，即 x 的整数部分。输入给出一个正整数 N（2≤N≤10 4 ）。在一行中输出题面中算式取到的不同值的个数。初始化一个大数组用来标记值是否已出现过。

2025-03-26 09:22:32 579

原创【练习】PAT 乙 1086 就不告诉你

做作业的时候，邻座的小盆友问你：“五乘以七等于多少？”你应该不失礼貌地围笑着告诉他：“五十三。”本题就要求你，对任何一对给定的正整数，倒着输出它们的乘积。输入在第一行给出两个不超过 1000 的正整数 A 和 B，其间以空格分隔。在一行中倒着输出 A 和 B 的乘积。将结果转为字符串，逆置，再转回整型。

2025-03-25 16:23:42 534

原创【练习】PAT 乙 1083 是否存在相等的差

给定 N 张卡片，正面分别写上 1、2、……、N，然后全部翻面，洗牌，在背面分别写上 1、2、……将每张牌的正反两面数字相减（大减小），得到 N 个非负差值，其中是否存在相等的差？输入第一行给出一个正整数 N（2 ≤ N ≤ 10 000），随后一行给出 1 到 N 的一个洗牌后的排列，第 i 个数表示正面写了 i 的那张卡片背面的数字。按照“差值重复次数”的格式从大到小输出重复的差值及其重复的次数，每行输出一个结果。然后用哈希表映射按键值逆序存放。

2025-03-24 10:43:51 549

原创【练习】PAT 乙 1082 射击比赛

ID x y 其中 ID 是运动员的编号（由 4 位数字组成）；x 和 y 是其打出的弹洞的平面坐标(x,y)，均为整数，且 0 ≤ |x|, |y| ≤ 100。题目保证每个运动员的编号不重复，且每人只打 1 枪。本题目给出的射击比赛的规则非常简单，谁打的弹洞距离靶心最近，谁就是冠军；谁差得最远，谁就是菜鸟。本题给出一系列弹洞的平面坐标(x,y)，请你编写程序找出冠军和菜鸟。输入在第一行中给出一个正整数 N（≤ 10 000）。输出冠军和菜鸟的编号，中间空 1 格。题目保证他们是唯一的。

2025-03-20 18:38:29 409

原创【练习】PAT 乙 1081 检查密码

输入第一行给出一个正整数 N（<=100），随后 N 行，每行给出一个用户设置的密码，为不超过80个字符的非空字符串，以回车结束。如果密码长度合法，但存在不合法字符，则输出“Your password is tai luan le.”；如果密码长度合法，但只有字母没有数字，则输出“Your password needs shu zi.”；如果密码长度合法，但只有数字没有字母，则输出“Your password needs zi mu.”。（题目只说了字符串不会是空的，但是没有说不会有空格。

2025-03-19 16:14:58 292

原创【练习】PAT 乙 1079. 延迟的回文数 (20)

首先将该数字逆转，再将逆转数与该数相加，如果和还不是一个回文数，就重复这个逆转再相加的操作，直到一个回文数出现。如果一个非回文数可以变出回文数，就称这个数为延迟的回文数。其中A是原始的数字，B是A的逆转数，C是它们的和。A从输入的整数开始。重复操作直到C在10步以内变成回文数，这时在一行中输出“C is a palindromic number.”；或者如果10步都没能得到回文数，最后就在一行中输出“Not found in 10 iterations.”。对给定的整数，一行一行输出其变出回文数的过程。

2025-03-18 15:43:49 618

空空如也

空空如也