python
文章平均质量分 75
A抽子
zzu->tju。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hf transformers库中generate函数解读
本文介绍了Hugging Face Transformers库(版本4.37.1)中generate函数的参数配置和返回值格式。该函数主要用于文本生成任务,支持多种自定义参数:包括输入张量、生成配置、logits处理器、停止条件、前缀约束函数、多GPU同步开关、辅助模型加速、流式处理以及负面提示等。返回值格式根据return_dict_in_generate参数决定,可返回包含生成序列、分数、注意力权重等信息的结构化ModelOutput对象(分为GenerateDecoderOnlyOutput和Gene原创 2025-11-10 11:41:56 · 451 阅读 · 0 评论 -
hf中transformers库中generate的greedy_search
本文介绍了greedy_search方法的参数、返回值及核心代码逻辑。该方法接收input_ids、logits_processor等参数,控制文本生成过程。返回值根据return_dict_in_generate决定返回格式。代码初始化处理参数后,在循环中进行模型推理,通过logits_processor处理得分,并记录生成状态。支持批处理不同序列的独立终止判断,以及多GPU同步生成场景的处理。整个过程实现了基于贪心算法的文本生成功能。原创 2025-11-10 11:37:05 · 960 阅读 · 0 评论 -
hf transformers KV cache
KV cache显存计算涉及公式:2×精度×层数×embed维度×最大序列长度×批次大小。在HuggingFace Transformers中,past_key_values存储KV缓存,其格式为多层(key, value)元组,每个key/value的维度为(batch_size, num_heads, seq_len, head_dim)。实验显示,使用缓存时,随着解码步数增加,past_key_values的序列长度会逐步扩展(如从6增至7),验证了KV缓存的动态增长特性。通过对比完整生成与逐步解码过原创 2025-11-04 13:11:36 · 338 阅读 · 0 评论 -
Stanford CS336 assignment1 | Training a Transformer LM
本文介绍了训练Transformer语言模型的关键组件实现,主要包括交叉熵损失函数和优化器(SGD和AdamW)。交叉熵损失函数通过softmax计算概率分布并实现数值稳定技巧。SGD优化器使用学习率衰减策略,而AdamW优化器实现了自适应学习率调整和权重衰减功能。两种优化器都支持参数分组和状态跟踪,其中AdamW通过原地操作优化显存和计算效率。这些组件为Transformer语言模型的训练提供了基础支持。原创 2025-10-05 14:33:35 · 1015 阅读 · 0 评论 -
Jetson Xavier NX踩坑
本文介绍了在Jetson Xavier NX开发板上安装中文输入法、查看硬件配置、换源以及查看JetPack版本的全过程。主要内容包括:1) 通过apt安装fcitx拼音输入法框架并配置环境变量;2) 使用命令行工具查看系统信息、CPU、内存等硬件参数;3) 将apt源更换为华为云ARM64镜像以提升下载速度;4) 检查JetPack版本及CUDA环境配置,并安装jetson-stats监控工具。这些操作为后续开发环境搭建奠定了基础,特别针对ARM架构的Jetson平台进行了优化配置。原创 2025-09-27 22:14:57 · 762 阅读 · 0 评论 -
Python中yield和yield from
本文介绍了Python中yield和yield from的用法。yield用于创建生成器函数,实现暂停执行和返回值的功能,适用于惰性求值和大数据集处理。yield from则是yield的扩展语法,用于简化生成器的嵌套调用,可直接从其他可迭代对象或生成器中返回值。通过示例代码演示了二者的基本使用场景和区别,展示了如何利用这些特性实现更高效的迭代操作。原创 2025-08-04 11:31:23 · 385 阅读 · 0 评论 -
Python文件路径处理pathlib模块
摘要:Python的pathlib模块是3.4版本引入的标准库,提供面向对象的文件路径处理方式,旨在替代传统的os.path模块。核心功能包括:使用Path类进行路径拼接(支持/操作符)、获取路径各部分属性(parent/name等)、解析相对路径为绝对路径、检查路径状态(exists/is_file等)、目录遍历(iterdir/glob方法)、创建/删除目录和文件等操作。相比os.path,pathlib采用更直观的面向对象风格,支持链式调用,代码更简洁易读。特别适合与__file__变量配合使用获取当原创 2025-08-01 13:15:09 · 1528 阅读 · 0 评论 -
Python多进程并行multiprocess基础
Python多进程编程可以通过multiprocess模块实现,它能够绕过CPython的GIL限制,适合CPU密集型任务。核心组件包括: Process类:用于创建和管理子进程,通过target指定执行函数,args传递参数。子进程独立运行,需要进程间通信(IPC)共享数据。 Pool进程池:管理一组进程,避免频繁创建销毁的开销。主要方法: map():并行执行单参数函数 starmap():支持多参数 apply()/apply_async():同步/异步执行任务 map_async():异步版map原创 2025-07-30 18:40:33 · 1214 阅读 · 0 评论 -
Python中二进制文件操作
本文介绍了Python中二进制文件操作的基本方法。主要内容包括:1. 二进制文件的打开方式,必须使用"rb"、"wb"等带"b"的模式;2. 常用操作函数:read()读取数据、write()写入数据、seek()移动文件指针位置、tell()获取当前指针位置;3. 字节数据相关知识,包括bytes对象的不可变特性以及与字符串的相互转换方法。文章通过代码示例展示了各操作的具体用法,特别说明了seek()函数的参数含义和使用场景。原创 2025-07-29 18:14:16 · 534 阅读 · 0 评论 -
Python中assert的使用
Python中的assert是一种断言机制,用于在运行时验证条件是否为真。其语法为assert condition, error_message,当条件为假时会抛出AssertionError并显示错误信息。assert常用于函数参数检查(如验证输入类型和长度)和调试代码逻辑正确性,是一种有效的程序调试工具。通过断言可以在开发阶段快速发现并定位问题,但生产环境中应谨慎使用。原创 2025-07-29 17:19:21 · 540 阅读 · 0 评论 -
python基础知识pip配置pip.conf文件
摘要:pip.conf是pip的配置文件,采用INI格式编写,包含节、键值对和注释。配置文件分为三个级别:全局(/etc/pip.conf)、用户(~/.pip/pip.conf)和虚拟环境($VIRTUAL_ENV/pip.conf)。加载顺序为全局→用户→站点→PIP_CONFIG_FILE,后加载的配置会覆盖前者。常用配置示例是设置清华大学镜像源,包含[global]节中的index-url和[install]节中的trusted-host参数,用于加速包安装并跳过SSL验证。原创 2025-07-13 23:41:49 · 701 阅读 · 0 评论 -
python基础类型转换
int:整数类型float:浮点数str:字符串类型bool:布尔类型python是弱类型语言,如果向获取一个数据的类型可以用type()函数操作。原创 2025-04-13 16:33:24 · 325 阅读 · 0 评论 -
python输入输出
python的输出依赖于python的内置函数print,下面是print函数的语法sependfileflush。原创 2025-04-13 16:11:00 · 177 阅读 · 0 评论 -
python判断文件是否存在
判断文件或文件夹是否存在。如果只判断文件是否存在。原创 2024-12-29 21:43:26 · 162 阅读 · 0 评论 -
python中math模块常用函数
math模块是python标准库的一部分,提供了对于浮点数相关的数学运算,下面是常用的一些function。原创 2024-12-15 23:15:53 · 476 阅读 · 0 评论 -
余弦相似度Cosine Sim
余弦相似度是一种用于度量向量相似性的metric。原创 2024-12-15 22:39:26 · 542 阅读 · 0 评论 -
python内置函数permutations
permutations是python的itertools模块的一个函数,可以用来求可迭代对象的全排列后面r的作用解释一下,加入iterable中元素有n个,r=m,就相当于先在n中选m个,再对m个进行全排列也就是Cnm结果可见下面这段代码C5360所有list的长度为60。原创 2024-12-15 00:58:33 · 559 阅读 · 0 评论 -
python内置函数map
map是python提供的一个内置函数,用于对一个序列中每个元素,或者对多个序列中对应元素进行操作。原创 2024-12-15 00:39:49 · 735 阅读 · 0 评论 -
Python中定义抽象基类
python中定义可以定义抽象类,和Java中的抽象类是一样的,不能被直接实例化,而是作为一个基类,主要用于定义一组接口规范,接口的实现在继承其的子类中完成,并且要求子类必须实现定义的所有接口,和Java一样如何子类未完全实现父类中的所有接口,那么这个子类也会被定义成为一个抽象类,不能直接实例化。原创 2024-12-14 21:52:44 · 522 阅读 · 0 评论 -
python正则表达式
正则表达式,又称规则表达式(Regular Expression),是使用单个字符串来描述、匹配某个句法规则的字符串,常被用来检索、替换那些符合某个模式(规则)的文本。比如,验证一个字符串是是否符合条件的电子邮箱地址,只需要配置好正则规则,即可匹配任意邮箱。(如果开头都不匹配那就直接失败)进行匹配,匹配成功返回匹配对象,匹配不成功返回空。python正则表达式,使用re模块,并且基于re模块中三个基础方法来做正则匹配。简单来说,正则表达式就是使用:字符串定义规则,并通过规则去验证字符串是否匹配。原创 2024-12-06 23:49:57 · 759 阅读 · 0 评论 -
python大数据入门
map中传递一个函数,并且将rdd中的每一个元素都传递给这个函数去计算,这个函数需要返回一个元素,函数需要根据具体逻辑。:map算子是将RDD的数据一条条处理(处理逻辑基于map算子中接收到的处理函数),返回新的RDD。pyspark的数据计算都是基于RDD对象来进行的,更具体地是依赖于RDD对象内置丰富的。功能:将RDD各个分区内的数据,同意收集到Driver中,形成一个List对象。pyspark支持多种数据的输入,再输入完成后,都会得到一个RDD对象。功能:对RDD数据进行去重,返回新的RDD。原创 2024-12-06 23:01:14 · 765 阅读 · 0 评论 -
python类与对象
一旦复写父类成员,那么类对象调用成员的时候,就会调用复写后的新成员,如果需要使用被复写的父类的成员,需要特殊的调用方式。多态,指的是:多种状态,即完成某个行为时,使用不同的对象会得到不同的状态。子类继承父类的成员属性和成员方法后,如果对其不满意,那么可以进行复写。抽象类就好比定义一个标准,包含了一些抽象的方法,要求子类必须实现。虽然类对象无法使用,但是私有成员可以被类中的其他成员使用。就是其中之一,这些内置的类方法,各自有各自特殊的功能。关键字是成员方法定义的时候,必须填写的。# type: 类型。原创 2024-12-06 15:41:05 · 668 阅读 · 0 评论 -
python异常、模块和包
异常就是程序运行过程中出现了错误下面上运行上面这段代码的结果自定义模块就是自己写个python文件需要用的时候按照模块的导入正常导入就可以了注意当导入多个模块的时候,并且模块内有同名功能,后导入的模块会覆盖前面的可以用来测试模块,同时保证我们在别的python文件中导入模块的时候if条件里面的内容不会执行。为什么可以呢?# module.py文件当我们运行module.py这个文件的时候,这时候python的内置变量__name__就会成为’main。原创 2024-12-06 12:09:52 · 1166 阅读 · 0 评论 -
python文件操作
如果以“r+”模式打开,但是先写后读,那么写入的内容会覆盖原内容,读取时从写结束位置开始读。如果原文档内容小于新写入的,那么全部被覆盖,读到的为空。如果原文档内容大于新写入的,那么读到的内容为原文档剩下的内容。打开文档即清空原内容,从文档开头写起,写完后光标自动移到文档末尾,此时进行读取,内容为空。追加在原文档末尾,不会清空原内容,写完后光标移到文档末尾,此时进行读取,内容为空。如果以“a+”模式打开,先进行读操作,读到的内容也是为空,因为打开即把光标定位在文档末尾。清空原文档,光标自动定位到文档末尾。原创 2024-12-06 01:59:32 · 1017 阅读 · 0 评论 -
python函数进阶
缺省参数:也叫默认参数,用于定义函数,为参数提供默认值,调用函数时可不传该默认值。接受,并组成字典,kwargs和args只是习惯上命名,可以用其他标识符。注意:参数是”键=值“形式的形式的情况下,所有的”键=值“都会被。作用:当调用函数时不确定参数个数时,可以使用不定长参数。作用:可以让函数更加清晰、容易使用,同时也。调用函数时根据定义函数的位置来传递参数。收集,它会根据传进参数的位置合并为一个。无名称的匿名函数,只可临时使用一次。不定长参数:也叫可变参数,用于。注意:传进的所有参数都会被。原创 2024-12-06 01:14:13 · 374 阅读 · 0 评论 -
python中的容器(container)
python中的数据容器:是一种可以容纳多份数据的数据类型,容纳的每一份数据称之为1个元素,每一个元素,可以是任意类型的数据,如字符串、数字、布尔等。列表(list)元组(tuple)字符串(str)集合(set)字典(dict)# 字面量[元素1, 元素2, 元素3, 元素4, 元素5, ...]# 定义变量# 定义空列表变量名称 = []变量名称 = list()列表中的元素的数据类型可以是不同的数据类型,并且列表支持嵌套元组定义:使用小括号,并且使用逗号。原创 2024-12-06 00:41:00 · 1608 阅读 · 0 评论 -
深度学习入门基于python的理论与实现-第五章误差反向传播法(个人向笔记)
计算图是一种图形化表示计算过程的方法,通常用于机器学习和深度学习中。在计算图中,节点代表操作(例如加法、乘法等),边代表数据流动(即操作的输入和输出)。通过计算图,可以清晰地展示计算过程中各个操作之间的依赖关系。链式法则是微积分中的一个基本定理,用于求解复合函数的导数。它描述了如果一个函数由另一个函数所组成,而这两个函数都是可微的,那么复合函数的导数可以通过这两个函数的导数的乘积来计算。计算图中各个结点只需要处理和自己有关的计算,也就是计算图可以集中精力于局部计算。原创 2024-03-17 17:50:42 · 861 阅读 · 0 评论 -
深度学习入门基于python的理论与实现-第四章神经网络的学习(个人向笔记)
监督学习包括分类和回归等任务,其中分类任务的标签是离散的,而回归任务的标签是连续的。与训练数据类似,测试数据也包括输入数据和相应的标签,但这些数据是模型在训练过程中未曾见过的。在监督学习中,训练数据通常包括输入数据(特征)和相应的标签(目标),模型通过观察这些数据并调整参数来学习输入与输出之间的关系。训练数据是模型学习的主要来源,其目标是使模型能够对新的、未见过的数据做出准确的预测或分类。当模型过于复杂或过度拟合训练数据时,它可能会学习到训练数据中的噪声或不相关的特征,导致在新数据上的泛化能力下降。原创 2024-03-16 17:19:46 · 1870 阅读 · 0 评论 -
Python语法糖
是 NumPy 提供的一种,用于对多维数组进行迭代操作。它可以替代传统的嵌套循环,在处理多维数组时更加方便和高效。迭代器可以按照遍历数组的元素,也可以控制迭代器的和长。在处理多维数组时,特别是需要对数组的每个元素进行操作时,使用 nditer 迭代器可以大大简化代码。第二个参数如何使用第三个参数如何使用原创 2024-03-16 16:45:29 · 1408 阅读 · 2 评论 -
python爬虫基础
爬虫爬的好牢饭吃的早,爬虫启动!本博客为记录b站尚硅谷爬虫的一些笔记和代码1、首先我们需要知道爬虫是什么?爬虫实际上是一段程序,我们可以通过这段程序从互联网上获取到我们想要的数据,这里还有另外一种解释是我们使用程序来模拟浏览器向服务器发送请求,来获取响应信息2、爬虫的核心:(1)、爬取网页:爬取整个网页,包含网页中的所有内容(2)、解析数据:将网页中我们得到的数据解析,因为网页中有众多数据我们只想要我们期望得到的数据,解析也就是得到我们期望数据的过程(3)、难点:爬虫与反爬虫之间的博弈。原创 2023-07-31 01:18:20 · 1399 阅读 · 0 评论 -
python基础
如何字符串本身包含单引号或者双引号,我们可以用与包含相反的方式去定义,也可以使用转移字符1、列表由一系列按特定顺序排列的元素组成。2、列表中通常包含多个元素,因此给列表指定一个表示复数的名称比较好3、python中用[]来表示列表。原创 2023-07-28 22:31:36 · 6683 阅读 · 2 评论
分享