coyote_xujie-优快云博客

原创 KV 缓存与分页注意力机制解析

随着大型语言模型规模和复杂性的持续增长，高效推理的重要性日益凸显。KV（键值）缓存与分页注意力是两种优化LLM推理的关键技术。本文将深入剖析这些概念，阐述其重要性，并探讨它们在、decoder-only 模型中的工作原理。

2025-06-27 15:11:42 1124

原创 Mindspore 初学教程 - 5. 网络构建

当我们定义神经网络时，可以继承nn.Cell类，在__init__方法中进行子 Cell 的实例化和状态管理，在construct方法中实现 Tensor 操作。construct意为神经网络（计算图）构建，相关内容详见使用静态图加速。这里将通过一个简单的神经网络模型说明某型层中每一层的意义，以及相关的模型参数。# model.py。

2025-06-27 15:10:55 694

原创使用 MindSpore 训练 DeepSeek-V3 模型

MindeSpore 已经适配 DeepSeek-V3 的训练推理啦，下面是使用 MindSpore 对DeepSeek-V3做训练的过程。

2025-02-16 18:20:52 693

从网络构建中加载代码，构建一个神经网络模型。nn.ReLU(),nn.ReLU(),超参（Hyperparameters）是可以调整的参数，可以控制模型训练优化的过程，不同的超参数值可能会影响模型训练和收敛速度。wt1wt−η1n∑x∈B∇lxwtwt1wt−ηn1x∈B∑∇lxwt公式中，nnn是批量大小（batch size），ηηη是学习率（learning rate）。另外，wtw_{t}w。

2024-11-04 22:27:30 1075

原创 Mindspore 初学教程 - 6. 函数式自动微分

神经网络的训练主要使用反向传播算法，模型预测值（）与正确标签（）送入损失函数（）获得，然后进行反向传播计算，求得梯度（），最终更新至模型参数（自动微分能够计算可导函数在某点处的导数值，是反向传播算法的一般化。自动微分主要解决的问题是将一个复杂的数学运算分解为一系列简单的基本运算，该功能对用户屏蔽了大量的求导细节和过程，大大降低了框架的使用门槛。MindSpore 使用函数式自动微分的设计理念，提供更接近于数学语义的自动微分接口grad和。下面我们使用一个简单的单层线性变换模型进行介绍。

2024-10-14 22:34:36 1149

原创 Mindspore 初学教程 - 4. 数据集 Dataset

模块提供了一些常用的公开数据集和标准格式数据集的加载 API。对于 MindSpore 来说，暂不支持直接加载的数据集，可以构造自定义数据加载类或自定义数据集生成函数的方式来生成数据集，然后通过接口实现自定义方式的数据集加载。支持通过可随机访问数据集对象、可迭代数据集对象和生成器(generator)构造自定义数据集，下面分别对其进行介绍。

2024-09-05 20:44:35 1659

原创 Mindspore 初学教程 - 3. Tensor 张量

张量（Tensor）是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数，这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在n维空间内，有nr个分量的一种量，其中每个分量都是坐标的函数，而在坐标变换时，这些分量也依照某些规则作线性变换。r称为该张量的秩或阶（与矩阵的秩和阶均无关系）。张量是一种特殊的数据结构，与数组和矩阵非常相似。张量（）是MindSpore 网络运算中的基本数据结构。

2024-09-05 20:43:47 1110

原创 Mindspore 初学教程 - 2. 快速入门

这里我们使用 map 对图像数据及标签进行变换处理，然后将处理好的数据集打包为大小为64的batch。打印每一轮的loss值和预测准确率（Accuracy），可以看到loss在不断下降，Accuracy在不断提高。若想要深入了解 MindSpore 的使用方法，请参阅各节最后提供的参考链接。在本教程中，我们使用Mnist数据集，自动下载完成后，使用。类是构建所有网络的基类，也是网络的基本单元。打印数据集中包含的数据列名，用于 dataset 的预处理。除训练外，我们定义测试函数，用来评估模型的性能。

2024-09-05 20:42:34 1443

原创 ollma 本地部署大模型

因为我本地是 windows 的系统，所以这里直接写的是通过 docker 来实现本地大模型的部署。windows 下 WSl 的安装这里就不做重复，详见。

2024-08-25 17:05:06 3353 1

原创 windows 部署 mindspore GPU 开发环境（WSL）

确保已经安装 WSL在微软应用商店搜索时务必输入全名，并安装应用商店默认的 Ubuntu 版本号已经更新至 24.04，目前发现，改变24.04的安装位置可能导致虚拟机无法启动）自定义位置安装过程与C盘安装教程相似。最大区别在于，我们按照教程或官方文档从微软商店下载Ubuntu之后，不要点击启动，而是要将安装包复制到我们想要的位置，之后 Ubuntu 就会被安装到该位置。具体步骤如下。

2024-08-04 21:19:50 1751

原创 OpenShift3.11 社区版搭建

使用宿主机浏览器访问：https://master.lab.unicom.com:8443/使用用户名密码（admin/redhat）访问即可。注意：需要提前为宿主机设置hosts。注意：需要提前为宿主机设置hosts。安装包，解压后文件夹重命名。确保所有的节点都已经开启。标签，因为它也是计算节点。

2024-07-10 10:16:31 1193

原创香橙派 AIpro 根据心情生成专属音乐

香橙派 AIpro

2024-07-04 17:38:54 1213

原创 Elasticsearch 认证模拟题 - 24

（因为这个需要部署共享文件，所以这个我就在虚拟机上简单操作一下）用图形化界面真的很方便，这里是索引通过快照生命周期管理快照。生成快照，或快照生命周期。中共有 10 条数据。

2024-06-18 21:44:13 535

原创 Elasticsearch 8.1官网文档梳理 - 十一、Ingest pipelines（管道）

管道（Ingest pipelines）由一系列处理器（processors）组成，每个处理器都是一个可配置的任务。在管道（Ingest pipelines）中每个处理器（processors）按顺序运行，对接收到的文档（doc）进行特定更改。处理器（processors）运行后，Elasticsearch 会将转换后的文档（doc）添加到数据流（data stream）或索引（index）中。例如可以利用管道删除文档（doc）的字段、或从文本中提取数据、丰富文档（doc）的字段等其他操作。

2024-06-16 17:01:13 1003

原创 Elasticsearch 认证模拟题 - 23

参数可以用，结果美观了很多。索引按月分桶，并且对。

2024-06-16 16:37:51 300

原创 Elasticsearch 认证模拟题 - 22

重建索引，重建后的索引新增一个字段。

2024-06-16 13:24:37 464

原创 Elasticsearch 认证模拟题 - 21

这 4 个字段中至少两个以上。字段上算分的总和，同时要求对。写一个查询，要求查询。

2024-06-15 15:57:39 519

原创 Elasticsearch 认证模拟题 - 20

索引中的文档增加一个新的字段。

2024-06-15 15:56:53 442

原创 Elasticsearch 认证模拟题 - 19

【代码】Elasticsearch 认证模拟题 - 19。

2024-06-15 15:56:28 487

原创 Elasticsearch 认证模拟题 - 18

为一个索引，按要求设置以下 dynamic Mapping。索引设定一个别名，默认查询只返回。

2024-06-15 15:56:03 413

原创 Elasticsearch 认证模拟题 - 17

这两道题目非常具有代表性，分别是跨集群复制和跨集群检索，需要相应的这里在虚拟机上搭建集群完成这两道题目。

2024-06-09 14:32:29 820 2

原创 Elasticsearch 认证模拟题 - 16

字段的平均值，并返回 2022 年的数据。查询，并且用指定的格式高亮，并排序。创建一个搜索模版，要求。

2024-06-08 22:46:02 624 2

原创 Elasticsearch 认证模拟题 - 15

可以查出 1200 篇文档。单词，不能匹配到任何文档。

2024-06-08 19:06:39 733

原创 Elasticsearch 认证模拟题 - 14

能够保持特征数组中对象和值之间的关系。并将上述两个文档写入到。，不知道为什么，特征数组的类型和值对象之间的关系丢失了。此时上面两个文档都应该不在你的查询范围内。注意查询语句的查询结果，尽管它们的。现有以下文档，请编写一个名为。中，然后编写一个查询。

2024-06-08 18:25:57 643

原创 Elasticsearch 认证模拟题 - 13

的查询结果是 1 条。查询结构是 4 条，使用。

2024-06-08 17:50:54 871

原创 Elasticsearch 认证模拟题 - 12

索引中包含了过去11个月的地震信息，请通过一句查询，获取以下信息。

2024-06-08 16:44:58 658

原创 Elasticsearch 认证模拟题 - 11

仔细看题，似乎并不需要索引模板，但是我在官网没找到不适用模板就建立数据流的方法。2. 聚合a值小于-2的文档。3. 聚合-5到5之间的文档。按照上述要求建立数据流。4. 聚合大于5的文档。

2024-06-08 16:08:48 613

原创 Elasticsearch 认证模拟题 - 8

讲真的，刚看这个题属实懵了，印象中确实有这个知识点，但是死活找不到！，能够保持特征数组中对象和值之间的关系。并将上述两个文档写入到。，不知道为什么，特征数组的类型和值对象之间的关系丢失了。这里我认为直接看 enrich 的三个例子是最快能理解的。此时上面两个文档都应该不在你的查询范围内。注意查询语句的查询结果，尽管它们的。中，然后编写一个查询。总共有4个用户数据。

2024-06-07 20:45:00 696

原创 Elasticsearch 认证模拟题 - 10

使用查询模板查询 2018年6月1日到现在的数据，中，写出满足以下条件的查询。

2024-06-07 19:16:44 873

原创 Elasticsearch 认证模拟题 - 9

中共有 10 条数据。

2024-06-07 17:46:06 641

原创 Elasticsearch 认证模拟题 - 7

根据以上信息创建模板，并创建一个数据流，名为。写一个查询满足以下要求。，并向数据流中插入一条数据。

2024-06-02 11:39:31 554

原创 Elasticsearch 认证模拟题 - 4

（因为这个需要部署共享文件，所以这个我就在虚拟机上简单操作一下）倒排，然后用这个模板去查询索引。字段用标签高亮，然后按。生成快照，或快照生命周期。定义一个搜索模板，查询。

2024-06-01 17:53:35 584

原创 Elasticsearch 认证模拟题 - 6

有 10 个文档返回，请重建索引。利用查询模板，编写查询语句，查询。有 3 个文档返回，

2024-06-01 17:19:01 571

原创 Elasticsearch 认证模拟题 - 5

索引按月分桶，并且对。.在集群上有一个索引。

2024-05-31 22:45:00 827

原创 Elasticsearch 认证模拟题 - 3

有一索引有 3 个字段，请写一个查询去匹配这三个字段，并且将三个字段的评分相加作为最后的总评分。（这个题目不确定是不是应该这么理解，找出具有最大平均值。

2024-05-31 09:00:00 376

原创 Elasticsearch 认证模拟题 -2

重建索引，重建后的索引新增一个字段。2. 聚合a值小于-2的文档。3. 聚合-5到5之间的文档。4. 聚合大于5的文档。

2024-05-30 19:30:00 829

原创 Elasticsearch 认证模拟题 - 1

数据首先分布在 data_hot，5分钟后移动到 data_warm，3分钟后到 data_cold，再过 8 分钟删除。索引进行重建，达到使用 match 匹配。字段，用 match 匹配。数据流至少对应一个隐藏索引。能查到很多数据，现要求对。不能查询到数据的目的。定义一个数据流，满足。

2024-05-28 22:20:10 992 4

原创 Elasticsearch 8.1官网文档梳理 - 十三、Search your data（数据搜索）

代表处理该请求所耗费的毫秒数。从节点收到查询后开始，到返回客户端之前，包括在线程池中等待、在集群中执行分布式搜索和收集、排序所有结果所花费的时间。这里有两个比较有用的参数需要注意一下。这强调一下 Response 中的。

2024-05-26 22:12:08 1007

原创 minIO 集群搭建

我这里用了 3 台 Centos7 的虚拟机，来搭建 MinIO 集群。uname -a。

2024-05-20 16:05:49 1122

原创 Elasticsearch 8.1官网文档梳理 - 十五、Aggregations（聚合）

这里值得注意的是，时间间隔的选择有两种方式，一种是周期间隔（Calendar intervals），另外一种是固定间隔（Fixed intervals），分别对应参数。聚合的组合，主要用于按文档数量排序，或按复合键的度量聚合排序并获得前 N 个结果时。ES 的聚合可以总结为三类：指标聚合、统计聚合、其他分析聚合。）聚合可以创建子聚合，子聚合是基于父聚合的结果进行创建。在聚合时根据给定的时间间隔进行聚合，结果中桶（）的数量，由 ES 自动选择聚合的时间间隔。的值，将数据按间隔，放入不同的桶（

2024-05-19 21:09:34 1654

elasticsearch-7.10.2 源码

2023-04-25

flann_manual-1.8.4.pdf

Flann的指导说明

2021-05-21

ES-顾客银行账户信息

2022-11-26

欧式距离的局部敏感哈希E2LSH.py

欧氏距离局部敏感哈希，每次描述资源都不知道说啥，还得凑够50个字，打了这么多字，想收一个积分了。没得编了，给出文章的链接吧。https://blog.youkuaiyun.com/Wolf_xujie/article/details/103847577

2020-07-30

pyflann.rar

已经改好的库函数，直接放到pip安装各种包的目录下就可以用

2021-05-25

matplotlib简单画图.ipynb

matplotlib简单画图的代码及结果，使用jupyter Notebook打开即可，本来不想要积分的，但是优快云必须让我写50个字的资源描述，我很生气，很难过，很委屈，决定收一个积分意思意思

2019-12-15

局部敏感哈希，LSH.py

将最小局部敏感hash封装成一个类，包括查询方法，凑不够50个字了，把文章链接放上去吧https://blog.youkuaiyun.com/Wolf_xujie/article/details/103847577

2020-07-29

3_neural_networks_tutorial.ipynb

官方网站的[Deep Learning with PyTorch: A 60 Minute Blitz] (https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)的中文翻译

2020-07-21

Microsoft Visual C++.rar

Microsoft Visual C++ Build Tools.exe

2021-10-20

21_8_8.rar 聚类算法总结，包括可达图的绘画，聚类效果图等

聚类算法K_Means，DBSCAN，OPTICS这三种算法，已经定义成类了，包括可达图的绘画，聚类效果图等

2021-08-18

树的公共父节点.rar

因为树的结构不同所以需要分情况考虑：当树为二叉排序树，寻找给定两节点的最低公共祖先当树为普通树，每个节点中有指针指向其父节点当树为二叉树，每个节点仅有左右孩子指针当树为普通树，每个节点仅有左右孩子指针

2020-08-23

4_cifar10_tutorial.ipynb

官方网站的[Deep Learning with PyTorch: A 60 Minute Blitz] (https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)的中文翻译

2020-07-21

5_data_parallel_tutorial.ipynb

官方网站的[Deep Learning with PyTorch: A 60 Minute Blitz] (https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)的中文翻译

2020-07-21

1_tensor_tutorial.ipynb

官方网站的[Deep Learning with PyTorch: A 60 Minute Blitz] (https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)的中文翻译

2020-07-21

2_autograd_tutorial.ipynb

官方网站的[Deep Learning with PyTorch: A 60 Minute Blitz] (https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)的中文翻译

2020-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人