- 博客(171)
- 资源 (3)
- 收藏
- 关注
原创 PyTorch 中的一个函数 —— torch.argmax
输入:input:输入张量。dim(可选):指定沿哪个维度查找最大值。如果为 None,则在整个张量中查找。keepdim(可选):是否保持输出张量的维度与输入一致(默认为 False)。输出:一个张量,包含最大值所在的索引torch.argmax 是一个高效的工具,广泛应用于分类模型预测、指标计算等场景。理解其 dim 和 keepdim 参数的行为,可以灵活处理不同维度的数据。
2025-04-03 14:25:48
180
原创 在模型中tokenizer 相关讲解
在Hugging Face Transformers库中,Tokenizer 是将原始文本转换为模型输入格式的核心工具。
2025-04-03 11:33:35
434
原创 算法与数据结构面试题
简单地说,数据结构是以某种特定的布局方式存储数据的容器。这种“布局方式”决定了数据结构对于某些操作是高效的,而对于其他操作则是低效的。首先我们需要理解各种数据结构,才能在处理实际问题时选取最合适的数据结构。树,二叉树:有左右子树的区分和度不超过2.二叉排序树:左子树均小于根,根均小于右节点。。线索二叉树:设置两个标识标记左右指针指向的是孩子还是前躯节点。平衡二叉树:左右子树高度差绝对值小于等于1。哈夫曼树:压缩用的。权值大小排列。完全二叉树:只能从右边为空。
2025-04-02 23:01:31
499
原创 PyTorch 核心详解
PyTorch 是一个基于 Python 的开源深度学习框架,由 Facebook 的 AI 研究团队开发。动态计算图:实时构建计算图,适合调试和复杂模型。GPU 加速:无缝支持 CUDA,可高效利用 GPU。模块化设计:通过torch.nn等模块快速搭建模型。self.fc1 = nn.Linear(10, 50) # 全连接层。
2025-04-02 22:58:48
1294
原创 向量库(Vector Database)概述
向量库是AI基础设施的核心组件,通过高效的ANN搜索赋能推荐、搜索、风控等场景。选型需权衡数据规模、延迟、精度和运维成本,未来在多模态与硬件优化方向潜力显著。
2025-04-01 22:41:39
409
原创 PyTorch中知识蒸馏浅讲
在 PyTorch 中,使用 teacher_model.eval() 和冻结教师模型参数是知识蒸馏(Knowledge Distillation)中的关键步骤。
2025-04-01 21:23:38
437
原创 学习率调度器工具函数(get_scheduler)补充讲解
get_scheduler 的核心价值在于灵活实现学习率动态调整,帮助模型在不同训练阶段保持高效优化。通过选择合适的策略,可以显著提升模型性能,是深度学习训练流程中不可或缺的组件。
2025-03-30 21:27:47
1047
原创 pyproj 库中 Geod 类讲解
前向方位角 (forward_azimuth):从第一个点出发,指向第二个点的方向角度。0° 表示正北方向,90° 为正东,180° 为正南,270° 为正西。后向方位角 (back_azimuth):从第二个点返回第一个点的方向角度,与前向方位角互补(±180°)功能:geod.inv 是地理空间分析的核心工具,用于计算两点间的方位角和测地距离。适用场景:导航系统、路径规划、地理围栏、距离估算等。精度保障:使用合适的椭球模型(如 WGS84)可确保高精度结果。
2025-03-30 21:25:40
383
原创 浏览器缓存浅讲
如果某些文件 在 1 秒钟以内,被修改多次的话,那么文件已将改变了但是 Last-Modified 却没有改变,这样会造成缓存命中的不准确。(2)因为 Last-Modified 的这种可能发生的不准确性,http 中提供了另外一种方式,那就是 Etag 属性。服务器在返回资源的时候,在头信息中添加了 Etag 属性,这个属性是资源生成的唯一标识符,当资源发生改变的时候,这个值也会发生改变。
2025-03-24 17:03:12
682
原创 学习率调度器工具函数-get_scheduler
get_scheduler 的核心价值在于灵活实现学习率动态调整,帮助模型在不同训练阶段保持高效优化。通过选择合适的策略,可以显著提升模型性能,是深度学习训练流程中不可或缺的组件。
2025-03-24 16:21:10
834
原创 Splice、Split、Slice 用法讲解
注意:slice 字符串和数组两个都有,slice 两个参数,返回新数组,不改变原数组splice n 个参数,前面两个和 slice 相同,返回新数组,改变原数组字符串slice 提取字符串的一部分,并返回一个新的字符串,且不会改动原字符串。split 分割字符串 返回一个分割的数组,且不会改动原字符串。
2025-03-22 22:14:27
909
原创 web客户端存储,IndexDB相关讲解
IndexedDB 是浏览器提供的一种底层 API,用于在客户端存储大量结构化数据。相比 Web Storage(localStorage/sessionStorage),它支持更复杂的数据结构、事务处理、索引查询等高级功能。
2025-03-22 22:03:29
1361
原创 Python生成requirements.txt的两种方法
使用为使用utf8编码,避免编码报错--force强制执行覆盖生成目录下的requirements.txt。
2025-03-19 23:03:42
585
原创 python单链表浅讲
{% block content %} 是Python Web开发中模板继承的核心语法,通过分离公共结构和可变内容,大幅提升代码复用和维护效率。掌握这一机制能有效简化前端页面开发。
2025-03-17 21:21:50
243
原创 Flask 模版引擎的语法
{% block content %} 是Python Web开发中模板继承的核心语法,通过分离公共结构和可变内容,大幅提升代码复用和维护效率。掌握这一机制能有效简化前端页面开发。
2025-03-17 21:18:40
1309
原创 python函数式编程
函数式编程就是一种抽象程度很高的编程范式,纯粹的函数式编程语言编写的函数没有变量,因此,任意一个函数,只要输入是确定的,输出就是确定的,这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言,由于函数内部的变量状态不确定,同样的输入,可能得到不同的输出,因此,这种函数是有副作用的。🔊 函数式编程的一个特点就是,允许把函数本身作为参数传入另一个函数,还允许返回一个函数!Python 对函数式编程提供部分支持。由于 Python 允许使用变量,因此,Python 不是纯函数式编程语言。
2025-03-15 22:20:30
1201
原创 python高级特性
掌握了 Python 的数据类型、语句和函数,基本上就可以编写出很多有用的程序了。比如构造一个🔍 使用取 list 的前一半的元素,也可以通过循环实现。但是在 Python 中,代码不是越多越好,而是越少越好。代码不是越复杂越好,而是越简单越好。基于这一思想,我们来介绍 Python 中非常有用的高级特性,**1 行代码能实现的功能,决不写 5 行代码。**请始终牢记,代码越少,开发效率越高。
2025-03-15 22:19:20
237
原创 python中函数的使用
在Python中,定义一个函数要使用def语句,依次写出函数名、括号、括号中的参数和冒号,然后,在缩进块中编写函数体,函数的返回值用return语句返回。我们以自定义一个求绝对值的my_absif x >= 0:return xelse:return -x!> 请注意,函数体内部的语句在执行时,一旦执行到return时,函数就执行完毕,并将结果返回。因此,函数内部通过条件判断和循环可以实现非常复杂的逻辑。如果没有return语句,函数执行完毕后也会返回结果,只是结果为None。可以简写为。
2025-03-15 22:18:11
1002
原创 python基础
Python 非常适合初学者用来进入计算机编程领域。Python 属于非常高级的语言,掌握了这门高级语言,就对计算机编程的核心思想——抽象有了初步理解。如果希望继续深入学习计算机编程,可以学习 Java、C、JavaScript、Lisp 等不同类型的语言,只有多掌握不同领域的语言,有比较才更有收获。
2025-03-15 22:16:40
635
原创 Google的S2库浅讲
S2生成的单元格是混合层级的,根据区域形状和配置参数自动选择最优组合。单元格层级通过四叉树分解关联,高层级单元格是低层级的子集。合理配置minLevel、maxLevel和maxCells,可在精度和性能间取得平衡。
2025-03-15 16:49:56
291
原创 python相关语法的学习文档1
tqdm 是 Python 中一个非常流行的进度条库,可以实时显示循环或任务的进度。它简单易用,支持多种场景(如循环、文件处理、多线程/进程等)。
2025-03-15 16:05:41
880
原创 PerceptronLexicalAnalyzer浅讲
PerceptronLexicalAnalyzer是HanLP工具包中基于感知机(Perceptron)机器学习模型的分词器,专为中文等非空格分隔语言设计。它结合了分词、词性标注、命名实体识别(NER)等任务,是一个高效且灵活的自然语言处理工具。以下是其核心原理、功能及使用方法的详细解析。
2025-03-09 15:13:22
329
原创 google s2部分浅讲
S2生成的单元格是混合层级的,根据区域形状和配置参数自动选择最优组合。单元格层级通过四叉树分解关联,高层级单元格是低层级的子集。合理配置minLevel、maxLevel和maxCells,可在精度和性能间取得平衡。
2025-03-09 15:09:19
155
原创 postgres数据库中_varchar的数组存储方法如何查找
子查询:SELECT 1 FROM unnest(data) AS element WHERE element IN (‘value1’, ‘value2’, ‘value3’) 展开数组 data,并检查是否至少有一个元素包含在 ‘value1’、‘value2’ 或 ‘value3’ 之中。EXISTS:如果子查询返回至少一行数据,表示 data 数组中至少包含 ‘value1’、‘value2’ 或 ‘value3’ 中的一个值,那么主查询会返回对应的行。
2025-01-15 21:17:11
503
原创 使用node实现sql文件数据导入到postgres数据库
对于数据量较大的sql文件,无法直接放到控制台执行。这时候有很多方法:如文件分拆、程序读取等方式。
2025-01-15 21:07:41
283
原创 RBush 知识点详细讲解
RBush 是一种高效的二维矩形空间索引数据结构,尤其适用于需要快速插入、查询和更新大量矩形数据的应用。它通过平衡树结构、空间裁剪和批量插入等技术,显著提升了查询效率和内存使用,广泛应用于 GIS、碰撞检测、数据可视化等领域。
2025-01-02 16:46:30
873
原创 接口请求中调试可以看到Origin,其具体的作用
接口请求中带 Origin 是浏览器在跨域请求时自动添加的一个 HTTP 请求头,用于标识请求的来源(源)。Origin 头的主要作用是支持跨域资源共享(CORS)和增强安全性。当用户在一个站点登录后,如果第三方恶意站点伪造请求(如通过表单提交),Origin 头可以帮助服务器判断请求是否来自可信源。如果你在开发接口或调试请求,看到 Origin 头,通常意味着浏览器检测到了跨域,并向服务器声明了来源。当浏览器检测到请求跨域(即源与目标服务器不同),会自动添加 Origin 头,以告知服务器请求来源。
2024-12-25 21:34:27
838
在eclipse中关于arcgis for Android的配置
2017-02-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人