- 博客(46)
- 收藏
- 关注

原创 有关word2vec和Bert的一些相似思想(个人理解)
首先,明确一下word2vec的目的:做一个比较好的词向量,以便通过该词向量做出的模型参数浮动不是特别大.现在再看看它怎么做的.首先,将数据进行独热编码,通过独热编码与一个权重相乘获得一个非独热编码的向量,该权重记为:独热权重,所得词向量记为:word2vec词向量然后,将上述word2vec词向量放入模型中进行训练,得到一个表较好的独热权重和word2vec词向量上面两步已经诠释的word2vec的全部过程,但是对它的讨论并没有结束.将上述word2vec词向量放入相似任务的模型中
2021-11-16 13:43:07
1427

原创 使用python内置函数进行常规API接口调用
这里使用百度智能云API接口调用为例(可以使用AipSpeech和request直接做出来,但不是本问目的):调用API接口前您需要:1、注册百度智能云并进行实名认证2、打开左上角那三个杠的图标(导航栏):产品服务-人工智能(语音技术)3、下载并安装python34、创建百度智能云APP(用于调用API),创建方法网上很多就不再赘述。详细代码和注释如下:from urllib.request import urlopenfrom urllib.request import R
2021-10-25 15:01:51
1720

原创 集成学习内容分析初步理解(狭义)
集成学习目录集成学习前言一、类别二、内容三、Bagging四、Boosting五、优缺点分析1、优点2、缺点前言机器学习的精度在前几年一直没有深度学习精度高,但是最近kaggle比赛竞选出一批优秀的机器学习算法,集成学习。本文旨在用概括性语言总结集成学习要义一、类别集成学习分为bagging和boosting两个方向。Bagging主要为并行无依赖学习结构模型,Boosting主要为强依赖串行学习结构模型。二、内容...
2021-05-27 14:32:05
137

原创 RESNET残差网络跳跃连接
RESNET在处理神经网络梯度消失方面表现出了优越的性能,那么这个网络是如何处理梯度消失的?又是怎样进行反向传播的?下面将详细讲解一下:要想解决这个问题要从最本质的训练流程出发:正向传播过程:假设一个二分类全连接神经网络结构没有隐藏层,直接全连接然后分类,那么可以得到: ,,其中z1是全连接结果,w是权重,b是偏置,F1是分类结果,g()是非线性分类函数我们对其进行反向传播不难得到梯度:,其中J是损失函数有了最基本的正向反向传播概念,通过上图,不难求出RESNET的梯度表达式:...
2021-04-26 18:30:21
4561
原创 声明式schema
以下定义一个公司的实体类型Company(公司): EntityType# 以下是定义一个继承自公司的实体类型Company(公司): EntityType# 这里是公司的描述desc: 公司的描述# 这里定义属性address(地址): Text# 这里定义地址属性为非空约束,除此还可以定义MultiValue(多值,英文逗号分割)、Enum(枚举)和Regular(正则)industry(行业): Industry。
2025-03-14 14:26:43
690
原创 关于量子神经网络的思考
我一直在想,你看我们无论在使用transformer还是之前的深度学习模型,一直都在优化网络结构和硬件配置,为的是什么,为的是加快神经网络的训练速度和推理速度,在设备条件优化到极致的时候,我们都知道一种算法或神经网络亦或是其他方法论都有一个训练速度的“上限”,为什么有上限呢?比如,粒子A最初的状态我们记为0,粒子B最初的状态我们记为1,假如我们通过外力让粒子A状态变为了1,那么瞬时粒子B的状态就会变为0,而粒子B这种变化是无视距离的。量子算法的设计:开发专门的量子算法来处理神经网络的训练和推理过程。
2025-01-07 15:48:08
904
原创 温故而知新-浅谈前向传播和反向传播
最近在扣transformer细节的时候,灵感来了,对前向传播和反向传播有了新的理解。前向传播和反向传播的公式以及计算就不唠了(前面文章在聊残差网络的时候聊了一次)。我们从数学意义来聊。假设,有一组数据,这组数据非常多,数据量很大,如果我要看这组数据的特性,比如局部单调递增或单调递减,如果直接用Excel来看,就比较费劲,于是我想到了绘图,我通过简单编写一个代码,使用plot绘制了这组数据的图片,很容易的我就看到了这组数据的特性,后来发现,这组数据如果用图片表示还是不方便,为什么呢?
2024-12-18 17:58:33
925
原创 污水处理。。。。。
初始氢氧根离子浓度[0H- ]1= 10-(14-pH)(单位:mol/L),目标氢氧根离子浓度[0H-] = 10-(14-pH:)初始氢离子浓度[H+]1=10-pH(单位:mol/L),目标氢离子浓度[H+]2 = 10-pH:。废水中氰化物的总质量为40x90000=3600000mg。酸的物质的量n観 = C觖xV觖,其中C酸是酸的浓度(单位:mol/L),V酸是酸的体积(单位:升)。碱的物质的量n碱 = CxV顾,其中C碱是碱的浓度(单位:mol/L),V碱是碱的体积(单位:升)。
2024-09-14 15:36:20
966
原创 rule_解析`````````````````
(注意,尽管“cde”包含“c”,但它不会被第三条规则出发,因为它是第一条规则产生的新字符串,而不是来自原始字符串)执行第一条规则之前的输入字符串,new_str表示执行第一条规则之后的输出字符串,change_index"表示。字段说明:键1表示第一条规则,键1对应的值表示第一条规则运行后的状态,source_str表示。3.第三条规则:b + cde + b + d + a + d + a #c a。3.第三条规则:b + cde + b + d + a + d + a #c a。
2024-08-02 17:08:39
1051
原创 labelme最新版无环境安装exe文件获取
5、往下翻,找到Assets 中的labelme.exe并点击下载。3、找到Installation。进入以上链接搜 labelme。4、点击第三个(链接)2、选第一个点击进入。
2024-07-14 13:25:43
864
原创 最大非重复字符串计算-哈希表的应用
start = myHashMap[s[end]] + 1 # 更新start到重复字符的下一个位置。if s[end] not in myHashMap: # 使用in关键字检查字符是否在哈希映射中。myHashMap[s[end]] = end # 如果不在,将字符和索引添加到映射中。ans = max(ans, end - start + 1) # 更新最长子串长度。del myHashMap[s[end]] # 从哈希映射中删除重复字符。end += 1 # 右边界向后移动。
2024-04-23 16:52:14
393
原创 transformer中selfattention简单实现
在当前技术环境下,AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法,AI大模型学习能够不断提升模型的准确性和效率,为人类生活和工作带来更多便利。
2024-03-28 16:50:24
300
原创 YOLO8分类任务-总结
YOLO8算法概述YOLO8算法的核心思想是将目标检测和分类任务结合起来,通过一个单一的网络模型实现。该算法采用了一种多尺度的特征提取方法,能够捕捉不同尺度下的目标特征。同时,YOLO8算法还引入了注意力机制,提高了模型对重要目标的关注度。YOLO8算法的网络结构由多个卷积层和全连接层组成,其中卷积层用于特征提取,全连接层用于分类。该算法还使用了一种特殊的损失函数,将目标检测和分类的损失进行联合优化。数据集和预处理在进行分类任务之前,需要准备一个适用于训练和验证的数据集。数据集应包含各种类别的图像样本,并
2023-11-27 20:33:14
966
1
原创 YOLO8分类任务-训练
"""Notes:Example:```python```"""returnelse:if mode!= 'train':else:""""""
2023-11-27 19:57:23
532
原创 Sanic请求流和响应流的概念
请求为流,即入参为流式传输,通常接口的传入内容为json数据还有一种数据为流,传入的数据为流,此时接收该流数据的服务为“请求流”服务。响应为流,即出参为流式传输,通常接口的输出内容为json 还有一种数据为流,输出的数据为流,此时输出该流数据的服务为“响应流”服务。请求流和响应流是按照基于服务端的概念,如果你在写客户端,是没有请求流和响应流的概念的。所以像这种问题:使用某某框架写一个响应流或请求流的客户端 这种问题是错误的问法。客户端用于请求别人的接口。明确一下概念,老弄混。服务端用于自己起接口。
2023-06-09 10:23:42
254
原创 备忘--------------------------
未使用dockerfile:docker run --gpus all -it -v /home/rasa_project:/home/rasa_project --name rasa_base3 612e41b40837 /bin/bash。原始命令:docker run -it -v /var/rasa_project:/rasa_app1 -p 6650:22 --name rasa_base 6dbe814150cc /bin/bash。九、删除所有停止的容器、悬空的图像、未使用的网络。
2023-05-04 20:16:13
105
原创 离线创建虚拟环境(anaconda)
十、把python10安装目录下的/Scripts下的文件拷贝null_python39/Scripts文件夹下,全选替换,最后删除null_python39/Scripts下包含‘3.7’、‘37’字符的文件。一、在anaconda/env文件夹下创建空文件夹,空文件夹名为虚拟环境名,如下图创建null_python39文件夹。九、进入安装目录并复制以下文件及文件夹(除DLLs、Scripts文件夹之外的所有文件夹及文件)二、复制已成功创建虚拟环境的文件夹内容,并粘贴到 null_python39。
2023-04-12 21:34:48
3724
原创 Chatito生成的json数据转化为rasa可以使用的yml文件
第一件事:求关注,一起讨论rasa相关问题以及各种python源码问题,随着python使用的深入,越来越觉得使用python对于工业实现在速度方面有着很大的劣势,在优快云这个平台,希望能够多多结交python方面的各路英雄豪杰。第二件事:谈不上一件事,主要说一下写这篇文章的出发点。近年来,rasa作为一个快速发展的机器人框架,在国内,除了网上各种基础教程和官方文档以及中文书籍,就很难再找到有关文献了,讲的都比较浅,大多数内容很难在工业级实现。本篇文章仅讲述一个细节:训练数据的转化......
2022-07-12 21:12:32
958
原创 TTS实现过程(大白话)
实现TTS先了解数据wav文件不知道童鞋们知不知道scipy这个函数(看,有童鞋举爪了),这个函数实现了读取wav文件的过程,具体是:scipy.io.wavefile这个函数,这个函数读取wav文件之后表现为数组的形式,这样就明了多了,wav文件通过scipy转码成为了数组的形式,同样数组也可以通过scipy.io.wavefile实现存为wav文件。好了,有了对数据的基础认识,接下来聊聊TTSTTS实现目前主流的方法大家应该也都了解过是将文字转化为拼音再转化为id,然后通过训练获得模型。浅了
2022-02-24 20:24:57
1494
原创 rasa+知识图谱(大白话)
机器人DIETClassifier->知识图谱如:咳嗽怎么治->机器人DIET实体提取:咳嗽,意图识别:治疗知识图谱关于咳嗽这个主实体是这样描述的:咳嗽->治疗->感冒灵颗粒咳嗽->食物->粥咳嗽->科室->内科通过机器人识别出来的咳嗽和治疗在知识图谱中查询出咳嗽的治疗方案:感冒灵,返回给rasa机器人进行语言组织:咳嗽的治疗方案是:吃感冒灵颗粒....
2021-11-15 08:45:12
1533
原创 rasa 略深层次理解
1 内部结构和原理:(以下递进关系)nlu(定义语料,给出意图)-> config DITETClassFire(识别实体和意图)->story(根据意图定义剧本,剧本包括意图反馈action和含有实体的意图下的插槽定义并激活监视active_loop)-> domain :表单 ,story中插槽类型和实体名声明 ,表单监视程序 之表单验证声明, 需要在action中定义, 表单填充声明 常规意图反馈声明 实体声明-> action 实现domain中声明的 表
2021-11-02 11:06:56
557
2
sanic+文字流式传输+打字机效果
2023-05-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人