陌上阳光-优快云博客

原创 git报错处理

提示表明你的代码未通过 Linter 检查或构建任务失败，需要检查构建日志并修复代码后再提交。可以使用自动化工具来解决格式问题，确保代码符合团队规范后，重新运行检查流程。

2025-01-15 15:03:25 685

原创 python代码格式检查及自动工具更改

验证安装是否成功：检查代码格式检查单个文件：检查整个项目：指定输出格式：忽略特定规则：示例中是行超长错误，忽略此规则。生成报告到文件：自动更改代码：使用或安装自动格式化工具安装：安装：使用格式化单个文件：递归格式化整个项目：自定义规则：使用格式化单个文件：格式化整个项目：自定义行宽：使用 VS Code 插件检查与格式化安装 Flake8 插件：安装自动格式化插件：配置

2025-01-15 14:57:25 893

原创 git使用

arc diff进入编辑模式但没有更新内容，通常是因为没有实质性代码更改或暂存区没有内容。如果你想提交更新的内容，确保在回滚后进行了修改，并将修改添加到暂存区。

2025-01-15 14:52:54 1100

原创 miniconda-windows安装

如果仍无效试试用旧命令如果这个可以用，则需要升级conda到最新版本以支持。conda init失败检查是否有写入配置文件的权限（如.bashrc或.zshrcWindows 用户提示找不到activate以上方法可以帮助你解决报错的问题。

2025-01-09 16:01:13 911

原创 cursor使用

projects/(Chat)(Edit)(Generate)类名。

2024-12-25 17:12:54 921 1

原创 filetype Python包

filetype是一个 Python 包，用于检测文件的类型（MIME 类型和扩展名）。它通过读取文件的二进制数据（magic numbers 或签名）来快速而准确地识别文件类型，而无需依赖文件的扩展名。

2024-12-04 16:28:34 573

原创 transformer

转导模型是一种直接从已知样本（训练数据）预测特定目标样本（测试数据）的方法，而不是像归纳学习那样先学习一个通用的规则（模型）再应用于未知数据。转导模型专注于直接解决给定的任务（输入到输出的映射）。它并不强调总结出通用的规律，而是针对问题域的具体实例优化。

2024-12-02 18:42:59 896

Monkey测试是一种非结构化的测试方法，其核心思想是像“猴子乱按键”一样，随机地向应用程序发送各种无序的输入，包括按键、手势、触摸、点击等，以观察系统的行为。它模拟用户的随意操作，帮助发现潜在的崩溃、异常或未预见的问题。Monkey 测试是一种简单而有效的随机测试方法，适用于稳定性和压力测试，但不适合替代结构化的功能测试。它更像是一种补充性测试工具，帮助发现意外问题。（Monkey Testing）是一种随机测试技术，主要用于测试应用程序的稳定性、可靠性和异常处理能力。Android 平台上的。

2024-12-02 14:32:11 842

原创 cmake编译选项设置

在CMakeLists.txt文件中设置CMAKE_CXX_FLAGS_RELEASE -O3参数解决问题。

2024-11-27 17:32:59 577

原创奇异值分解和深度学习

SVD 是将一个矩阵分解成三个矩阵的乘积的过程。对于一个大小为。

2024-11-21 17:56:03 1005

原创 vscode连接远程开发机报错

这个报错主要说明了 VSCode 通过 SSH 连接到远程服务器时，SSH 客户端未能验证远程主机的密钥。这是一个常见问题，通常与 SSH 配置或已知主机密钥有关。由于主机密钥验证失败，VSCode 无法通过 SSH 建立连接，因此后续与远程主机的通信失败。解决主机密钥验证问题后，VSCode 应该可以顺利连接到远程服务器。确保 VSCode 使用正确的 SSH 配置文件路径。，并按回车以接受密钥，密钥将被添加到。vscode连接conf配置文件。中的配置与实际情况匹配。文件，删除对应的旧记录。

2024-11-21 11:53:00 1141

原创动手学深度学习73 课程总结和进阶学习

即是通过 Tabula 工具从 PDF 中提取出来的结构化表格数据。Tabula 通过自动检测 PDF 中的表格结构，将内容转化为可直接分析的格式，适合在财务、统计等需要从 PDF 文件中提取数据的场景下使用。

2024-11-15 19:45:43 956

原创初学人工智不理解的名词3

方法定义与用途优势CFM一致流匹配，通过流模型建模目标分布，适合直接生成语音。提高语音质量，减少处理步骤，生成更加一致和自然的语音。One-Step 蒸馏一次性知识蒸馏，将教师模型的知识高效转移到学生模型中，压缩模型并加速生成过程。减少训练时间，提升生成效率，适合移动端或嵌入式设备部署。ReFlow可逆流匹配，通过流模型优化生成过程，捕获语音分布并改进波形生成。增强生成模型的灵活性和音质，减少训练不稳定性，支持高效的波形生成。

2024-11-15 15:22:58 1319 1

原创动手学深度学习72 优化算法

任意两点连线，所有线上的值都在集合里面–凸集在机器学习，凹凸函数的区别？凸函数表达能力有限动量法：比较平滑的改变方向，两个下降方向不一样【冲突】的时候，抵消掉一些使梯度的更新不那么剧烈。看过去两三个梯度。mementum–超参数【beta】Adam不一定比SGD更好，只是，做了非常多的平滑。

2024-11-15 11:00:00 431

原创动手学深度学习70 BERT微调

13 bert一般可以用工具转成c++ 开销大。考虑怎么提升bert性能。14 设备性能不高，可以用蒸馏bert。模型中有大量冗余的东西。9 10, 一般不固定，固定参数可以使训练速度加快，可以尝试。12 本身很快+技术细节–>精度高。

2024-11-14 11:53:08 661

原创初学人工智能遇到不理解的词汇2

对于一个 ( m \times n ) 的矩阵 ( A )，它的奇异值定义为 ( A ) 的奇异值分解（SVD）所得结果中的一部分。奇异值分解可以写成：( U ) 是一个 ( m \times m ) 的正交矩阵（正交矩阵意味着它的列向量是单位正交的）。( V ) 是一个 ( n \times n ) 的正交矩阵。( \Sigma ) 是一个 ( m \times n ) 的对角矩阵，其中对角线上非零元素为矩阵 ( A ) 的奇异值。

2024-11-14 11:28:41 1109

原创动手学深度学习69 BERT预训练

3亿参数 30亿个词在输入和loss上有创新两个句子拼起来放到encoder–句子对cls-class分类sep-seperate 分隔符分开每个句子告诉是哪个句子两个句子给不同的向量位置编码不用sin cos，让网络自己学习bert–通用任务encoder 是双向的，两个方向的信息都可以看到预测mask是谁。改动：让模型在做微调的时候不要看到mask就做预测。

2024-11-13 18:10:54 499

原创动手学深度学习68 Transformer

通过不断地reshape，避免forloop操作。什么样的shape进去，怎样的shape出来。

2024-11-12 17:23:22 283

原创 linux最近常用命令3

要使用grep查看包含标点符号的行，可以使用正则表达式匹配常见的标点符号。

2024-11-05 18:54:15 295

原创动手学深度学习67 自注意力

k 窗口的大小每个kernel窗口都可以并行计算，GPU计算最长路径：信息是怎么传递的 filed–视野自注意力适合处理比较长的文本，无视距离，可以看比较长的文本，但是计算复杂度高【代价】位置信息加到输入数据里面。行：样本。

2024-11-05 13:27:17 403

原创动手学深度学习66 使用注意力机制的seq2seq

key value等价是一个东西第i个词rnn的输出根据加权的不同，解码器前面用编码器前面的输出，到后面用后面的输出。

2024-11-04 14:04:59 444

原创动手学深度学习65 注意力分数

好处：k q v的长度都可以不一样。

2024-11-04 13:11:26 180

原创动手学深度学习64 注意力机制

非参：没有参数。给定数据：key value对x：query。来了一个新数据，只看和新数据比较相近的某些数据的y。类似于K近邻K: kernel 核，函数，计算新来的数据和已有的数据的距离。

2024-10-31 13:58:53 315

原创初学人工智能遇到的不理解的专业词汇

Dijkstra 算法是一种高效的最短路径搜索算法，尤其适用于边权重为非负值的加权图。通过优先队列和贪心策略，它可以快速计算出从单一源点到其他所有节点的最短路径。遗传算法通过模拟自然选择的过程，能够优化神经网络中的权重、偏置、架构和超参数等。它提供了梯度下降之外的一种全局优化方法，尤其在面对复杂、多峰值、不可微的损失函数时表现出色。然而，遗传算法的计算代价较高，适用时需要权衡计算资源与优化效果。给定一个无向图 ( G = (V, E) )，点覆盖。

2024-10-31 13:30:07 699

原创动手学深度学习63 束搜索

1. 束搜索 Beam Search

2024-10-21 18:47:42 169

原创动手学深度学习62 seq2seq

3. QA3 encoder输入embedding_size,输出位hindersize 不能直接按位相加，长度不一样。4 不是。 word2vec用的不多了。embedding是重新初始化，开始训练的。5 encoder output没意义。decoder output是预测6 实际句子的长度，算loss、attention不看padding的内容9 时代的洪流10 学过不等于会用 what how why11 不能放到下一条句子。通常取相对较长的句子，不截掉太多。12 decod

2024-10-18 10:30:00 407

原创动手学深度学习61 编码器与解码器

李沐老师动手学深度学习

2024-10-10 18:50:30 280

原创动手学深度学习60 机器翻译与数据集

李沐老师动手学深度学习

2024-10-09 18:35:56 732

原创动手学深度学习59 双向循环神经网络

视频：https://www.bilibili.com/video/BV12X4y1c71W/?p=2&spm_id_from=pageDriver&vd_source=eb04c9a33e87ceba9c9a2e5f09752ef8课件：https://courses.d2l.ai/zh-v2/assets/pdfs/part-3_7.pdf课本： https://zh-v2.d2l.ai/chapter_recurrent-modern/bi-rnn.html错误使用，不能用双向循环神经

2024-10-08 18:57:53 499

原创 Python使用cuda报错KeyError: ‘LOCAL_RANK‘

那么这个命令会让当前任务只看到编号为 0、1、2、3 的 GPU，并在一个节点上启动 4 个进程，每个进程对应一个 GPU 进行分布式训练。是 PyTorch 用于启动分布式训练的命令行工具。这是一个在使用 PyTorch 进行分布式训练时常用的命令行指令。在Python脚本调用之前，指定CUDA-visuble。如果有 4 个 GPU，并且设置。

2024-10-08 10:25:42 1468

原创动手学深度学习58 深层循环神经网络

序列变长不是深度。多加几个隐藏层。多加隐藏层，和MLP没区别右走：下一个时间步。

2024-08-28 10:00:00 365

原创动手学深度学习56 GRU门控循环单元

RNN模型# 包装rnn函数"""从零开始实现的循环神经网络模型"""# 重写 __call__ 或者写forward函数都行# x load的数据集 (批量大小，时间步数) onehot 整型变成浮点型# 预测"""prefix：给定句子的开头num_preds：预测多少词在prefix后面生成新字符"""for y in prefix[1:]: # 预热期for _ in range(num_preds): # 预测num_preds步# 多分类拿出最大概率的索引。

2024-08-15 10:00:00 320

原创动手学深度学习57 长短期记忆网络LSTM

忘记门：忘记前面H_t-1的内容输出门：极端为0，相当于重置，什么信息都不要了。

2024-08-15 10:00:00 405

原创动手学深度学习55 循环神经网络 RNN 的实现

每个批量每个样本要做t次分类【任意时间点都要做一次分类】，所以要乘。不做detach会记住前面计算的东西，误差反传会多算东西。16 每一个帧用cnn抽特征–向量，不需要one-hot. rnn不能处理特别长的序列。23 h-长为256的向量，很长很难计算。变长类似很长的mlp，容易过拟合。27 端侧–主要车上，未来家里所有深度学习都跑在车上–家庭超级计算机。7 不会预测特别长的东西。1 num_steps 输入到小批量里面面样本句子的长度。21 字符预测起来比较简单，输出是28voab，分类数少。

2024-07-28 09:00:00 2421 13

原创 git环境编译升级

是一个配置软件构建过程的重要步骤，它通过检查系统环境并生成适当的 Makefile 文件，为后续的编译和安装过程做好准备。通过指定--prefix选项，你可以灵活地控制软件的安装位置。make all执行编译过程，生成所有目标文件。不会安装文件。prefix变量在这个阶段通常没有影响。执行安装过程，将编译好的文件复制到指定的安装目录。prefix变量在这个阶段决定了文件的安装位置。make all用于编译项目。用于安装编译后的文件。prefix变量通常在安装阶段起作用，指定文件的安装路径。

2024-07-16 09:00:00 858

原创动手学深度学习54 循环神经网络

潜变量和隐变量的区别：隐变量通常是现实生活中存在的东西,只是我们没有观察到;潜变量可指代现实生活中不存在(人为创造)的东西。g值正常，不做处理，g过大，将值处理成theta，保证g不会过大–不会超过theta值，防止梯度爆炸。输出【o_t】发生在观察【x_t】之前。根据o_t和x_t的值计算损失。循环神经网络可以认为是一个简单的递归网络。递归理解为何树一样的东西。困惑度=1，下面候选词词概率最高。n个输出的多分类交叉熵损失平均值，再取指数–困惑度。所有x的信息都存储到h里面。做指数，损失数值会变大。

2024-07-09 17:33:21 824

原创动手学深度学习53 语言模型

n越大，空间复杂度越大。X：两个长为num_steps=5的序列，Y：每个元素是对应X序列的后一个元素。一元语法：马尔科夫假设tao=0 基本认为每一个字是独立的，不管前面的东西。第二种做法：两个相邻小批量的数据是相邻的。数据是连续的，可以做更长的序列出来。3 不存count为0的词，空间复杂度还是n–文本长度。最大的好处：可以处理很长的序列。每次看的序列是固定的。不调用d2l的Vocab，按照前面的代码重新写一份。2 连续单词是有时序的，有先后顺序，不能打乱。6 T 序列的长度，每次看多长的序列。

2024-07-09 15:06:22 600

原创制作TTS前端模型数据集，预训练bert模型的字典数据是怎么调用的-chatgpt问答生成

这行代码的主要作用是加载和初始化一个预训练的 BERT 中文模型的分词器，使得你可以将自然语言文本转换为模型可以理解的 token 格式，从而进行进一步的自然语言处理任务，如文本分类、命名实体识别等。上述步骤包括数据预处理、数据编码、构建训练数据集和训练模型。通过这些步骤，可以将韵律标签和多音字标签数据转换成可以用于训练 BERT 模型的格式，并进行模型训练以提升 TTS 系统的表现。

2024-06-27 15:47:35 983

原创 TTS训练环境安装

这些库涵盖了数据处理、代码质量检查、机器学习、科学计算、音频处理、自然语言处理和实时通信等多个领域。根据你的项目需求，可以选择合适的库来完成相应的任务。如果你使用 Anaconda 或 Miniconda 管理 Python 环境，建议使用。这个模块通常用于自然语言处理任务中，例如使用 BERT、GPT 等预训练模型。创建的环境），请确保你已经激活了相应的环境，并在其中安装了。错误表示在你的 Python 环境中没有安装。如果你使用的是 Python3，请确保使用。错误，并在你的项目中使用。

2024-06-27 10:22:54 1637

学习pytorch练习代码

空空如也