渊兮旷兮-优快云博客

原创创建第一个AI短视频

视频生成的提示词构成（尽量使用英文），你使用哪个底座模型就去他们的社区或者官网上找到你想要做的风格的视频（sora能看到用户的提示词，wan可以去github看他们大量的示例视频也附上了提示词），去拿到他们公开的提示词，多拿几个丢给gpt让它总结提示词构成模板然后让gpt生成优化几个版本最后再丢到工作流或者api里去抽奖，以便抽奖一边微调。1.设计风格（最好是有一些知名度高的风格如迪士尼，猎魔人，哈利波特，指环王，宫崎骏等等，或者以一些有名的代表作为例，如《满城尽带黄金甲》《环太平洋》）

2025-10-28 17:46:27 368

原创 viduQ2 新用户白嫖1000积分

ViduQ2 白嫖1000积分

2025-10-27 16:56:31 1115

原创 vscode 安装 esp ide环境

依然报错，佛了，打开windows安全中心，点击病毒和威胁防护定位到排除项，清理掉下面的排除项，然后添加父文件夹进去，我这里就是“E:\Project\Espressif”自定义本体以及Tool安装路径，点击install等待安装即可（ps：安装的很慢=。（在你想要安装的目录位置新建一个Espressif文件夹，添加排除项选择这个文件夹）权限不够，好吧，关闭vscode页面，然后以管理员身份打开，然后重复以上操作。然后清理文件夹，重启电脑，重复安装流程，完事。上方点击查看-命令列表，输入。

2025-07-14 16:54:44 888

原创 OLED 播放 GIF图片 Arduino

最近在玩硬件，发现没有什么能够便利生成AdruinoGIF库的工具，自己手搓了一个

2025-03-26 18:09:02 1162

原创阿里云oss显式使用key与secret

阿里云原demo，需要通过环境变量来读取到oss_key与oss_secret。如果在某些需要写死或者迁移的项目中，可以使用如下来显示使用key与secret。

2024-12-03 12:13:26 587

原创中文文本内容模板式总结，gpto1,claude某言初步测评

中文文本内容模板式总结，gpto1,claude某言初步测评

2024-10-17 18:00:04 721

原创 python实现音频文件mp3/m4a转.wav + windows安装ffmpeg

下载后是一个rar文件，解压到各自存储工具的地址，然后打开到bin文件夹(里面正常应该有3个.exe文件)，复制文件夹路径。找到红色框选的绿色文字链接，点击下载即可，下载大概率需要魔法，暂时麻瓜的可以先用我上传度盘的(2024/10/10)1.确保已经正确安装ffmpeg,pydub实际上仍然是ffmpeg的功能封装库，底层是依靠ffmpeg来实现的。抱脸上的模型几乎统一输入需求都是.wav，直接贴代码吧。ps:使用这段代码需要提前安装好ffmpeg(安装教程请往下拉)

2024-10-10 19:01:55 1027

原创 windows自定义路径docker安装

运行直接.exe文件会默认在C盘安装，不想C盘炸的同学可以使用如下方式自定义路径在cmd窗口中跳转至刚才下载的.exe文件路径然后运行下面这行命令(将<path>替换成你需要安装的文件夹路径)运行命令后会跳转安装界面，建议勾选wsl2，之后一路继续即可。安装结束后运行 docker -v 能正常跳出版本信息即可。

2024-09-23 18:04:32 1413

原创 hugging face 利用现有模型进行预测

本篇主要记录下如何使用hugging face来快速找到我们需要的模型，并通过已有模型来快速实现demo或是功能模块

2024-09-03 00:16:24 1074

原创 Transformer---Decoder在训练和推理中的区别

在训练时，我们已知了标签，所以可以通过mask的技术来将一整个(max_len,d_embed)的矩阵喂给模型，但是在推理中，我们无法得知真值，所以只能串行投喂（这也是为什么比较早期的大模型输出都是一个字一个字蹦出来的）。这是两个人为设定的特殊符号，我们可以把他看做某个特殊的标点符号，在训练的过程中，模型会学习到当我预测出EOS的时候，我就不需要进行之后的预测了（也就是后面对应的字符应该是空），前文+SOS就能预测出我们需要的第一个字符。但是在推理中，我们并不知道真实值是什么，那么我们只能串行运行。

2024-07-29 22:28:33 1172

原创 Pycharm conda 虚拟环境添加失败---windows

使用系统解释器选择python.exe进行本地添加（ps:该方式不会显示conda名称）conda路径使用conda info查询。

2024-07-29 11:22:58 579

原创 Transformer-Bert---散装知识点---mlm，nsp，较之经典tran的区别和实际应用方式

本文记录的是笔者在了解了transformer结构后嗑bert中记录的一些散装知识点，有时间就会整理收录，希望最后能把transformer一个系列都完整的更新进去。举几个简单的例子来解释一下常见的自监督学习：（ps:插一嘴，bert使用的是mlm，会在最后的例子中解释）被替换的单词：men ： MASK-------------------80%这一问题，我们并不总是用实际的[MASK]标记替换“遮盖”的单词。为了更好的适应下游任务，bert的作者对与MLM的规则进行了一定的微调。

2024-07-22 21:01:42 1552 7

原创使用numpy基于全连接层实现Minst数据集训练——待续

PS：本贴还没完全写完，全部代码直接转至文末，有时间会一点一点把细节部分解释清楚题外话：以前习惯调包实现网络，然后发现研究新的较为复杂的网络结构会很吃力，于是回过头来垒实基础，后续会在全连接层的基础上添加卷积池化dropout归一层等等，如果你也有对应需求，可以持续关注哈。so,进入正题Minist数据集网盘地址：回头贴上ps:度娘随便找一下也有。

2024-04-30 22:09:16 916 1

原创 Kaggle竞赛---Open Problems - Multimodal Single-Cell Integration（利用DNA预测蛋白质水平--core:0.762）---Multi模型预测

书接上文：这里主要提供multi模型预测的代码（ps:这里会同样给出整体提交的代码，我这里会使用之后已经预测好的cite模块的数据，来生成整体的提交数据）

2024-03-26 12:46:15 529

原创 Kaggle竞赛---Open Problems - Multimodal Single-Cell Integration（利用DNA预测蛋白质水平--core:0.762）---Multi模型训练

简单来说（详细的介绍建议直接看比赛介绍，无需魔法）：就是给你2份excel表（有一份是提交模板，一份是单人第二天提交细胞清单），量分别分别记录了提供者、cell_id、gene_id、cell_type、technology,这几个数据以cell_id为key互相关联，.h5文件则记录了cell_id以及DNA，RNA，蛋白质水平（这三者通过不同的转换手段转换为了（1，n）的矩阵）。（kaggle cpu 处理比本地慢，这部分文件处理我是在本地实现的，然后再手动上传）2.1处理.h5文件。

2024-03-26 12:11:47 803

原创 Kaggle竞赛入门级---泰坦尼克号飞船(0.80)

泰坦尼克号宇宙飞船

2024-03-05 23:53:13 2362

原创 GO语言环境安装---VScode.2024

由于工作原因，需要用到go来写web后端，正好从零记录下环境安装。

2024-02-28 19:15:42 1016

原创 Pandas常用操作记录（更新中）

在机器学习中，我们往往会需要对csv文件的一些列数据进行独热编码，使用pandas自带的map函数来进行替换也是一种比较简单快速的编码方式。（注意map函数需要自提供映射字典，常用于类别较少的情况）函数比较简单：df.map(字典对象)，效果见下图。在获取到df对象后，可以使用。具体方法类似loc函数，这里简单展示（当然，我们可以更加优雅一点，使用。来进行行、列、区域的数据的获取。注意此处索引都是从0开始计算。

2024-02-07 00:32:42 373 1

原创三数之和---------leetcode刷题

首先题目说明i,j,k是不重复的，这也就意味着一定有大小顺序，所以当我们排序后，以固定的最小的k来进行遍历O(N)，使用双指针记录i与j(i<j)，然后依次遍历所有可能O（N），最后完成优化。比较经典的双指针运用，利用双指针消除无效解来优化为O(N^2)。1.穷举法：O(N^3)

2023-11-10 02:04:48 144

原创最长子串问题------------Leetocode刷题

PS：我们使用的是window这个字典，key是字符，value是序列号，一旦发现重复会先更新更新左指针i = max(i,window[s[j]])然后再更新序列号，由于我们移除窗口并不会将字典内的内容直接移除，所以要使用max函数来判别该字符是否在现有窗口内，如果在，那么其下标应该大于左指针I。基于上述步骤，可以看出，整个循环其实就是右指针按顺序遍历了一遍数组，在遍历途中，左指针进行更新，最大长度进行更新，当录入重复字符时，左指针跳转到之前字符的位置后一位，然后更新数据。很容易看出时间复杂度为O(n)

2023-11-08 12:20:55 109

原创 N字形变换--------Leetocode刷题

PS：这个系列主要是记录一些让我初见茅塞顿开的算法实现，一些基础的可以取leetocode官网上看题解哈，我这里只会简述一下实现逻辑。

2023-11-07 22:19:39 125

原创最长公共前缀--------leetcode刷题

{[a,c],[a,c],[b,d],[b,d]}的元组对象，那么我们使用set(zip(a,b)[index])是不是就能按位判断了。思路:使用zip组合str对象的时候，譬如a ='aabbcc',b='ccdd',使用zip(a,b)时，会获得一个。定义一个实现比较两个字符串最长公共前缀的函数：LCP。从前往后遍历所有字符串的每一列。

2023-11-07 12:54:06 94

原创图像处理（去噪）----滤波

图像去噪，主要用于去除图像的一些噪点，从而减少乃至消除噪点对边缘检测的影响。图像降噪常见的有均值滤波，高斯滤波，中值滤波，双边滤波，引导滤波等。

2023-11-04 23:52:12 1446

原创基于opencv4x --- python3.11实现信用卡卡号识别

版本：opencv-python 4.8.1.78 python 3.11（csdn也有类似的例子，不过版本比较古早，还是自己动手实现了一下）这个小的功能demo主要是使用cv的模板匹配功能matchTemplate函数，对于一些有固定模板的文字、图片，可以参考下述代码来利用模板实现。（ps:虽然使用torch来训练模型可以获得更具有泛用性功能，但是对于信用卡这类有个固定文字格式的图片，使用模板匹配来的更加方便些）

2023-10-31 22:21:10 1094

原创 OpenCV生成随机矩阵---randn与randu

OpenCV中提供了两个函数来生成随机数矩阵，可以用来创建随机图像或是用来人为增加随机噪点。

2023-10-27 18:20:53 1120

原创 OpenCv --- 图像处理函数（手册版本）

当前版本：opencv-python 4.8.1.78 ps:0黑 255白。

2023-10-26 16:13:59 765

原创 glove文件转换为word2vec文件-----glove2word2vec弹出warning

虽然现在使用glove2word2vec任然是可以的的，但是会弹出warning警报，两者转换还需要消耗不少的时间。这是word2vec的，word2vec会多一行来表示单词总数以及词向量维度，no_header就是跳过了这一行内容。但是当你导入一个word2vec的时候，就选择默认的False就行（binary=False表示对象是txt文件）现在已经可以直接导入glove文件了，无需再转换了，注意，

2023-10-25 00:33:34 239

原创 chain函数

在使用神经进行数据预处理的时候，需要获取训练数据所有用到的不重复的单词的数量，初时定义了一个函数，想要利用set来获取不重复的数量，报错list（输入的是列表嵌套列表）是不可哈希的对象。chain函数是Python的itertools模块中的一个函数，它用于将多个可迭代对象（如列表、元组等）连接在一起，形成一个新的可迭代对象。这个新的可迭代对象可以逐个访问原始可迭代对象中的元素。此时就可以使用chain函数，来讲sum的每个子列表展开，再将所有元素连接在一起，形成一个迭代器，最后再利用set转换成集合。

2023-10-23 13:40:38 301

GIF动图调整、输出工具

批处理取模gif动图工具

GIF分离帧处理工具压缩包

chat-ollama

药物副作用神经网络模型数据集

face-catch源码文件

opencv-训练一个人脸识别分类器

空空如也