自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(217)
  • 收藏
  • 关注

原创 【笔记——李沐动手学深度学习】3.1 线性回归

本文介绍了线性回归模型的基础知识。主要内容包括:线性模型是最基础的神经网络模型,构建过程完整且架构简单,适合作为学习复杂模型的基础;使用平方损失函数衡量预测误差;参数学习通过最小化损失函数实现;线性模型具有显示解且损失函数是凸函数;基础优化算法采用梯度下降和小批量随机梯度下降,其中学习率和批量大小是两个关键超参数。文章还通过房价预测案例展示了线性模型的应用,并解释了梯度下降算法中选择合适学习率的重要性。

2025-07-29 10:23:01 412

原创 【笔记——李沐动手学深度学习】2.4 微积分 2.5 自动微分

本文介绍了PyTorch中的自动微分机制,重点讲解了梯度计算的基本原理和使用方法。主要内容包括:1) 通过一个向量求导示例演示了梯度追踪、反向传播和梯度验证的完整流程;2) 解释了非标量反向传播的两种处理方法;3) 说明了如何通过detach()分离计算;4) 强调了PyTorch能够处理包含控制流的复杂计算图的梯度计算。这些自动微分功能为深度学习优化算法提供了核心支持,使开发者能够高效地计算各种复杂函数的梯度。

2025-06-29 14:30:57 364

原创 【笔记——李沐动手学深度学习】2.3 线性代数

下面的代码将实例化两个标量,并执行一些熟悉的算术运算,即加法、减、乘法、除法和指数。将张量乘以或加上一个标量不会改变张量的形状,其中张量的每个元素都将与标量相加或相乘。将两个相同形状的矩阵相加,会在这两个矩阵上执行元素加法。一般来说,张量可以具有任意长度,取决于机器的内存限制。可以通过执行按元素乘法,然后进行求和来表示两个向量的点积。则代表多维(>2),但是张量也可以代表标量/向量/矩阵。来引用向量的任一元素,例如可以通过。调用函数来实例化张量时,我们可以[, 可以表示任意形状张量的元素和。

2025-06-25 22:41:01 706

原创 【论文阅读笔记】《CodeS: Towards Building Open-source Language Models for Text-to-SQL 》

本文提出开源语言模型系列CodeS(1B-15B参数)以解决Text-to-SQL任务依赖闭源大模型的问题。通过增量预训练21.5GB SQL语料,结合模式链接优化和双向数据增强技术,CodeS在Spider、BIRD等9个基准上取得SOTA结果,参数规模缩小10-100倍。创新点包括:1)填补开源Text-to-SQL模型空白;2)增量预训练提升SQL能力;3)双向数据增强增强领域适应。实验显示CodeS在准确性和鲁棒性上优于GPT-4等方法,同时开源模型降低了部署成本。不足在于15B模型可能存在过拟合,

2025-06-18 15:33:20 938 1

原创 【笔记——李沐动手学深度学习】2.2 数据预处理

摘要 本文介绍了使用pandas进行数据预处理的全过程:(1)通过read_csv读取CSV格式的房屋数据集,包含房间数、巷子类型和价格三列;(2)处理缺失值时,对数值列采用均值插值,对类别型变量进行独热编码;(3)最终将处理后的数据转换为张量格式。文章特别指出在实现过程中遇到的类型转换问题及解决方案,包括对字符串列的特殊处理和布尔值转整数的方法。作者总结提出需要系统记录不熟悉的函数用法,以巩固数据处理的基础知识。整个预处理流程展示了pandas与深度学习张量的兼容性,以及处理缺失数据的两种主要方法:插值法

2025-06-17 22:25:27 249

原创 【笔记——李沐动手学深度学习】2.1 数据操作

摘要 本文介绍了机器学习中N维数组的基本概念与数据操作实现。N维数组是机器学习和神经网络的核心数据结构,从标量(0维)到视频批量(5维)有不同应用场景。文章详细讲解了张量(tensor)的操作方法,包括创建数组、形状变换、初始化、运算、索引切片等技术要点。通过PyTorch示例展示了如何高效处理张量数据,涵盖广播机制、内存优化等关键技巧。最后简要提及数据预处理中CSV文件的读取方法。全文提供了从理论到实践的完整数据操作指南,适合机器学习初学者掌握基础数据结构处理方法。

2025-06-17 22:19:17 870

原创 【论文阅读笔记】《Few-shot Text-to-SQL Translation using Structure and Content Prompt Learning》

《少样本Text-to-SQL翻译的结构与内容提示学习》提出SC-Prompt框架,通过分阶段处理SQL结构和内容生成,结合混合提示策略与约束解码机制,显著提升了在训练数据有限场景下的模型性能。该方法采用T5预训练语言模型,在Spider等基准测试中仅用5%训练数据就超越现有最佳方法约5%准确率。研究创新性地降低了任务复杂度,减少了对大量标注数据的依赖,但尚需验证在其他语义解析任务上的适用性。未来将探索该方法在更复杂数据库场景的应用,为低资源环境下的自然语言数据库查询提供实用解决方案。

2025-06-17 16:35:00 495 1

原创 《机器学习》(周志华)第二章 模型评估与选择

AUC 越大,证明排序的质量越好,AUC 为 1 时,证明所有正例排在了负例的前面,AUC 为 0 时,所有的负例排在了正例的前面。显然,我们希望得到的是在新样本上表现得很好的学习器,即泛化误差小的学习器。,设定一个阈值,大于阈值为正例,小于阈值为负例,因此这个实值的好坏直接决定了学习器的泛化性能,若将这些实值排序,则。上面的方法中,将学习器的犯错同等对待,但在现实生活中,将正例预测成假例与将假例预测成正例的代价常常是不一样的。在非均等错误代价下,我们希望的是最小化“总体代价”,这样。

2025-06-09 16:35:07 1086

原创 【论文阅读笔记】《A survey on deep learning approaches for text-to-SQL》

《A survey on deep learning approaches for text-to-SQL》阅读笔记

2025-06-07 11:30:16 956 1

原创 《机器学习》(周志华)第一章 绪论

其所研究的主要内容,是关于在计算机上从数据中产生“模型”(model)的算法,即“学习算法”(learning algorithm)。分类中又可分为二分类与多分类任务,二分类顾名思义,只需分2类,一般分别称为“正类”与“反类”,且一般正类用“1”表示,反类用“0”表示。信息,计算机需要自行寻找特征,将这些数据分为几个簇,然后将陌生的数据分到计算机自己划分的几个簇中的过程。信息,计算机通过学习这些训练数据,将未出现在训练样本中的陌生的数据分到已有的类别中的过程。一批关于某种事物的数据的集合称为一个。

2025-06-07 09:29:01 946 1

原创 【论文阅读笔记】Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation

本文系统评估了基于大型语言模型(LLM)的Text-to-SQL技术,提出新型框架DAIL-SQL,在Spider数据集上创下86.6%的执行准确率新纪录。研究比较了多种提示工程方法,包括问题表示和示例选择策略,并验证了开源LLM(如LLaMA、Vicuna)通过监督微调可达到与商用模型相当的性能。作者特别强调提示工程的token效率优化,指出当前研究在SQL生成正确性优先于查询效率、大规模数据库适应性等方面的局限。未来工作将探索更多规则提示、扩展训练数据,并研究高效SQL生成方法。

2025-06-04 18:01:52 1205 2

原创 【论文阅读】HEXGEN-TEXT2SQL: Optimizing LLM Inference Request Scheduling for Agentic Text-to-SQL Workflows

HEXGEN-TEXT2SQL: 异构GPU集群上优化多阶段Text-to-SQL工作流的LLM推理调度框架 本文提出HEXGEN-TEXT2SQL框架,针对异构GPU集群中多阶段LLM驱动的Text-to-SQL工作流调度问题。通过分层调度方法(全局负载均衡+局部紧急性优先级队列)和轻量级仿真优化超参数,系统显著提升资源利用率并降低SLO违规率。实验显示,相比vLLM基线,该框架将延迟缩短1.41倍,吞吐量提升1.65倍。不足在于复杂查询优化和多租户公平性保障有待改进,未来可结合查询分析和动态资源分配进一

2025-06-02 16:00:53 924 1

原创 5.28 孔老师 nlp讲座

本次讲座系统介绍了语言模型的发展与应用。内容涵盖:语言模型的起源(源于语音识别中的统计模型)与基本概念;N元语言模型及平滑技术解决零概率问题;神经网络在语言建模中的演进,从词向量到RNN;预训练模型(如GPT、BERT)及其跨领域应用。特别强调学生需掌握预训练模型基础以参与实验研究,并安排后续NLP应用分享。会议待办包括调整讲解时间及入学前知识准备要求。讲座展现了语言模型从传统统计方法到深度学习的技术演进脉络。

2025-05-29 11:43:37 684

原创 《深度学习入门》第 3 章 神经网络

神经网络基础与实现摘要 本章介绍了从感知机到神经网络的发展过程,重点阐述了激活函数的作用和神经网络的实现原理。主要内容包括: 神经网络基本结构:输入层、隐藏层和输出层,通过激活函数处理输入信号的总和 常用激活函数及其实现: 阶跃函数:简单二值输出 sigmoid函数:平滑输出(0,1),利于神经网络学习 ReLU函数:max(0,x),目前广泛使用 多维数组运算:使用np.dot()实现矩阵乘法,高效计算神经网络各层间传递 3层神经网络实现示例: 通过权重矩阵和偏置向量实现层间信号传递 使用sigmoid作

2025-05-29 11:14:46 724

原创 《深度学习入门》第2章 感知机

感知机是一种简单的二分类模型,通过权重和偏置对输入进行线性组合,并根据阈值判断输出。本文介绍了感知机的基本概念及其在逻辑电路中的应用,如与门、与非门和或门的实现。通过Python代码展示了如何用感知机实现这些逻辑门,并讨论了感知机的局限性,特别是无法直接实现异或门的问题。最后,通过组合多个感知机,构建了多层感知机,成功实现了异或门,展示了感知机在非线性问题中的扩展能力。

2025-05-21 10:23:34 464

原创 《深度学习入门》第1章

本文主要介绍了Python中NumPy和Matplotlib库的基本用法。NumPy部分涵盖了数组的生成、算术运算、多维数组的操作、广播功能以及元素的访问。Matplotlib部分则介绍了如何绘制简单图形、使用pyplot功能以及显示图像。通过这些基础操作,用户可以高效处理数值数据并进行可视化展示。文章还提供了相关代码示例和图片描述,帮助读者更好地理解和使用这些工具。

2025-05-21 10:23:09 301

原创 【研0学习计划表】

研0学习计划

2025-05-16 15:43:15 638

原创 【python编程从入门到到实践】第九章类

本文介绍了Python中类的创建、使用、继承、导入以及编程风格。首先,类名应首字母大写,使用双下划线定义__init__方法。通过类可以创建实例,访问属性和调用方法。类可以继承父类,子类可以定义新属性和方法,并重写父类方法。类可以从模块中导入,支持导入单个类、多个类或整个模块。Python标准库提供了丰富的功能,如random模块的randint()函数。编程风格上,类名应首字母大写且不使用下划线,实例名和模块名应全小写并使用下划线,每个类定义后应添加文档字符串。

2025-05-16 15:40:39 643

原创 【python编程从入门到到实践】第十章 文件和异常

此时,将每行左端的空格也加入了字符串。

2025-05-16 15:39:23 428

原创 【python编程从入门到到实践】第八章 函数

本文介绍了Python中函数的基本使用和高级特性。首先,通过定义简单的函数greet_user展示了函数的基本结构。接着,讲解了如何向函数传递信息,并通过位置实参、关键字实参和默认值的方式传递参数。文章还介绍了函数的返回值,包括返回简单值、可选参数、字典以及结合while循环的使用。此外,讨论了如何传递列表,并避免函数修改原列表。最后,介绍了如何传递任意数量的实参,以及将函数存储在模块中并通过导入模块或特定函数来调用。这些内容涵盖了Python函数的基础和进阶用法,帮助读者更好地理解和使用函数。

2025-05-14 15:05:36 404

原创 【python编程从入门到到实践】第七章用户输入和while循环

本文介绍了Python中input()函数和while循环的基本用法。首先,input()函数用于获取用户输入,可以通过添加提示信息和使用int()函数将输入转换为数值。其次,while循环用于重复执行代码块,可以通过条件判断、标志变量、break和continue语句来控制循环的执行。此外,文章还展示了如何在while循环中处理列表和字典,包括移动列表元素、删除特定值的元素以及使用用户输入填充字典。这些技巧有助于编写更灵活和交互性强的Python程序。

2025-05-14 15:04:49 162

原创 【python编程从入门到到实践】第六章 字典

【python编程从入门到到实践】第六章 字典

2025-05-11 17:01:56 447

原创 如何读论文【论文精读】李沐老师视频笔记

李沐老师在视频《如何读论文【论文精读·1】》中分享了他高效阅读学术论文的方法。论文通常包括标题、摘要、导言、方法、实验和结论六个部分。李沐建议分三遍阅读论文:第一遍通过标题、摘要、结论和实验部分快速判断论文的相关性和质量;第二遍略读全文,关注关键图表和文献引用,理解论文的主要内容和结构;第三遍进行精读,深入理解每一句话和段落,思考如何应用或改进作者的方法。这种方法帮助读者快速筛选并深入理解学术论文,提高研究效率。

2025-05-11 17:00:56 406

原创 【python编程从入门到到实践】第五章 if 语句

【代码】【python编程从入门到到实践】第五章 if 语句。

2025-04-21 09:21:50 175

原创 【python编程从入门到到实践】第四章 操作列表

分别表示列表中的元素和列表,如。

2025-04-20 20:18:24 512

原创 【python编程从入门到到实践】第三章 列表简介

【代码】【python编程从入门到到实践】第三章 列表简介。

2025-04-20 09:28:15 124

原创 【python编程从入门到到实践】第二章 变量和简单的数据类型

只要有一个数为浮点数,最终结果就为浮点数。_下划线划分数字,易清晰阅读。

2025-04-19 10:18:08 140

原创 C语言【输出字符串中的大写字母】

输出字符串中的大写字母。

2025-04-09 21:01:04 261

原创 C语言【模仿strcpy】

注意需要在复制的字符串结尾加。

2025-04-09 21:00:41 263

原创 C语言【字符串转整型】

模仿 C 库函数 atoi(ASCII 到整数),编写一个函数,接收一个字符串,然后尝试将其解析并转换为整数。函数常用于需要在字符串中查找特定字符集合首次出现位置的场景,比如在解析文本时跳过不包含某些特定字符的部分。可以直接用atoi,或手动,如下。

2025-04-07 09:45:52 335

原创 C语言【冒泡排序】

注意for的边界条件,可以加标志位提前终止循环。

2025-04-07 09:45:31 197

原创 C语言【删除前导空格】

【代码】C语言【删除前导空格】

2025-04-06 12:08:10 466 1

原创 【回文数的判断】

找到1000~9999之间的所有回文数,每行最多10个数;

2025-04-06 11:26:07 167

原创 【练习】PAT 乙 1088 三人行

本题给定甲、乙、丙三个人的能力值关系为:甲的能力值确定是 2 位正整数;把甲的能力值的 2 个数字调换位置就是乙的能力值;甲乙两人能力差是丙的能力值的 X 倍;乙的能力值是丙的 Y 倍。请你指出谁比你强应“从之”,谁比你弱应“改之”。在一行中首先输出甲的能力值,随后依次输出甲、乙、丙三人与你的关系:如果其比你强,输出 Cong;比你弱则输出 Gai。输入在一行中给出三个数,依次为:M(你自己的能力值)、X 和 Y。注意:如果解不唯一,则以甲的最大解为准进行判断;子曰:“三人行,必有我师焉。

2025-03-27 17:59:53 217

原创 【练习】PAT 乙 1087 有多少不同的值

当自然数 n 依次取 1、2、3、……、N 时,算式 ⌊n/2⌋+⌊n/3⌋+⌊n/5⌋ 有多少个不同的值?(注:⌊x⌋ 为取整函数,表示不超过 x 的最大自然数,即 x 的整数部分。输入给出一个正整数 N(2≤N≤10 4 )。在一行中输出题面中算式取到的不同值的个数。初始化一个大数组用来标记值是否已出现过。

2025-03-26 09:22:32 579

原创 【练习】PAT 乙 1086 就不告诉你

做作业的时候,邻座的小盆友问你:“五乘以七等于多少?”你应该不失礼貌地围笑着告诉他:“五十三。”本题就要求你,对任何一对给定的正整数,倒着输出它们的乘积。输入在第一行给出两个不超过 1000 的正整数 A 和 B,其间以空格分隔。在一行中倒着输出 A 和 B 的乘积。将结果转为字符串,逆置,再转回整型。

2025-03-25 16:23:42 534

原创 【练习】PAT 乙 1083 是否存在相等的差

给定 N 张卡片,正面分别写上 1、2、……、N,然后全部翻面,洗牌,在背面分别写上 1、2、……将每张牌的正反两面数字相减(大减小),得到 N 个非负差值,其中是否存在相等的差?输入第一行给出一个正整数 N(2 ≤ N ≤ 10 000),随后一行给出 1 到 N 的一个洗牌后的排列,第 i 个数表示正面写了 i 的那张卡片背面的数字。按照“差值 重复次数”的格式从大到小输出重复的差值及其重复的次数,每行输出一个结果。然后用哈希表映射按键值逆序存放。

2025-03-24 10:43:51 549

原创 【练习】PAT 乙 1082 射击比赛

ID x y 其中 ID 是运动员的编号(由 4 位数字组成);x 和 y 是其打出的弹洞的平面坐标(x,y),均为整数,且 0 ≤ |x|, |y| ≤ 100。题目保证每个运动员的编号不重复,且每人只打 1 枪。本题目给出的射击比赛的规则非常简单,谁打的弹洞距离靶心最近,谁就是冠军;谁差得最远,谁就是菜鸟。本题给出一系列弹洞的平面坐标(x,y),请你编写程序找出冠军和菜鸟。输入在第一行中给出一个正整数 N(≤ 10 000)。输出冠军和菜鸟的编号,中间空 1 格。题目保证他们是唯一的。

2025-03-20 18:38:29 409

原创 【练习】PAT 乙 1081 检查密码

输入第一行给出一个正整数 N(<=100),随后 N 行,每行给出一个用户设置的密码,为不超过80个字符的非空字符串,以回车结束。如果密码长度合法,但存在不合法字符,则输出“Your password is tai luan le.”;如果密码长度合法,但只有字母没有数字,则输出“Your password needs shu zi.”;如果密码长度合法,但只有数字没有字母,则输出“Your password needs zi mu.”。(题目只说了字符串不会是空的,但是没有说不会有空格。

2025-03-19 16:14:58 292

原创 【练习】PAT 乙 1079. 延迟的回文数 (20)

首先将该数字逆转,再将逆转数与该数相加,如果和还不是一个回文数,就重复这个逆转再相加的操作,直到一个回文数出现。如果一个非回文数可以变出回文数,就称这个数为延迟的回文数。其中A是原始的数字,B是A的逆转数,C是它们的和。A从输入的整数开始。重复操作直到C在10步以内变成回文数,这时在一行中输出“C is a palindromic number.”;或者如果10步都没能得到回文数,最后就在一行中输出“Not found in 10 iterations.”。对给定的整数,一行一行输出其变出回文数的过程。

2025-03-18 15:43:49 618

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除