自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 Element Plus使用(五)

官网:https://element-plus.org/zh-CN/安装:导入组件(main.js)按钮图标图标不展示:没有导入图标的使用:提示框导航标签页输入框单选框、复选框下拉框日期选择器表单融合之前练习的输入框、文本框、单选框、复选框、下拉框、事件选择器等。

2025-03-02 16:49:10 1240

原创 Vue3:Vue Router的学习(四)

定义别名,使用aliaspath: "/",// 定义别名// 定义多个别名:},router-link的使用:< script setup > </ script > < template > 首页 - zz.com < br > < router-link to = " /content?

2025-03-01 20:33:08 1216 1

原创 三个小时学完vue3——组件学习(三)

Pinia 是 Vue.js 的一个状态管理库,从 Vue 3 开始被广泛使用。它是 Vuex 的继任者,具有更简洁的 API、更好的 TypeScript 支持和一些新特性。进行安装导入pinia,并将该实例注册到vue应用中:(修改main.js)重新运行项目并没有报错说明导入成功。接下来:定义一个store (可以参考官网:https://pinia.vuejs.org/zh/)title: 'zz学习',})return {web,user,userAdd})

2025-03-01 16:34:33 828

原创 三个小时学完vue3 —— 简单案例(二)

记事本案例购物车案例购物车优化案例使用watch、computed进行优化。使用Axios实现文章搜索案例up主讲的太好啦!多练多练!!

2025-02-28 23:23:37 1006

原创 三个小时学完vue3(一)

之前就学过一些,不过用的比较少,基本忘完了/(ㄒoㄒ)/~~跟着B站视频迅速回忆一下Vue 3 模块化开发ref和reactive区别绑定事件v-on和按键修饰符显示和隐藏 v-show条件渲染 v-ifv-show:v-show 指令是通过修改元素的 display CSS 属性来控制元素的显示与隐藏。当 v-show 绑定的值为 true 时,元素的 display 属性会恢复为原本的值(如 block、inline 等),元素会正常显示;当绑定的值为 false 时,元素的 d

2025-02-28 20:43:12 957

原创 论文阅读:A comprehensive survey on model compression and acceleration

背景:近年来,机器学习(ML)和深度学习(DL)在计算机视觉、自然语言处理、股票预测、预测和音频处理等多个领域取得显著进展。然而,针对这些复杂任务训练的深度学习模型规模较大,难以在资源受限的设备上部署,例如在 ImageNet 数据集上预训练的 VGG16 模型大小超过 500MB,而手机和物联网设备等资源受限设备内存和计算能力有限。问题:对于实时应用,需要将训练好的模型部署到资源受限设备上,但流行的卷积神经网络模型拥有数百万参数,导致训练后的模型体积庞大。

2025-02-27 23:56:30 1177 1

原创 JAVA知识复习

=

2025-02-26 10:03:55 904

原创 了解模型压缩与加速

深度学习的困境:模型太大,算力不足。如何将大型的模型部署在移动设备、嵌入式设备?必要性在许多网络结构中,如VGG-16网络,参数数量1亿3千多万,占用500MB空间,需要进行309亿次浮点运算才能完成一次图像识别任务。可行性论文提出,其实在很多深度的神经网络中存在着显著的冗余。仅仅使用很少一部分(5%)权值就足以预测剩余的权值。该论文还提出这些剩下的权值甚至可以直接不用被学习。也就是说,仅仅训练一小部分原来的权值参数就有可能达到和原来网络相近甚至超过原来网络的性能(可以看作一种正则化)。

2025-02-25 20:31:45 586

原创 跟着李沐老师学习深度学习(十六)

BERT针对微调设计基于Transformer的编码器做了如下修改模型更大,训练数据更多输入句子对,片段嵌入,可学习的位置编码训练时使用两个任务带掩码的语言模型下一个句子预测(如下图所示,一张图片可以通过T步 加噪 (高斯分布)变成一个充满噪声的图片,那么我们如何进行一个反向操作,进行去噪,这就是DDPM做的)扩散模型可以形象的比喻为:“在我开始工作之前,雕塑已经在大理石块内完成。它已经在那里了我只需要雕刻掉多余的材料。

2025-02-24 22:47:02 1175

原创 跟着李沐老师学习深度学习(十四)

Nadaraya-Watson核回归是具有注意力机制的机器学习范例。Nadaraya-Watson核回归的注意力汇聚是对训练数据中输出的加权平均。从注意力的角度来看,分配给每个值的注意力权重取决于将值所对应的键和查询作为输入的函数。注意力汇聚可以分为非参数型和带参数型。注意力分数是query和key的相似度,注意力权重是分数的softmax结果两种常见的分数计算将query和key合并起来进入一个单输出单隐藏层的MLP直接将query和key做内积。

2025-02-23 23:07:02 1702 1

原创 跟着李沐老师学习深度学习(十五)

局部最小 vs 全局最小全局最小:局部最小:使用迭代优化算法来求解,一般只能保证找到局部最小值。

2025-02-23 21:12:38 674

原创 跟着李沐老师学习深度学习(十三)

门循环单元GRU# 从零开始实现# 初始化模型参数W_xz, W_hz, b_z = three() # 更新门参数W_xr, W_hr, b_r = three() # 重置门参数W_xh, W_hh, b_h = three() # 候选隐状态参数# 输出层参数# 附加梯度# 定义模型# 定义隐状态的初始化函数# 返回一个形状为(批量大小,隐藏单元个数)的张量,张量的值全部为零。# 定义门控循环单元模型H, = state# 训练与预测。

2025-02-20 19:23:27 1099

原创 跟着李沐老师学习深度学习(十二)

时序模型中,当前数据跟之前观察到的数据相关自回归模型使用自身过去数据来预测未来马尔科夫模型假设当前只跟最近少数数据相关从而简化模型潜变量模型使用潜变量来概括历史信息文本是序列数据的一种最常见的形式之一。为了对文本进行预处理,我们通常将文本拆分为词元构建词表将词元字符串映射为数字索引,并将文本数据转换为词元索引以供模型操作。语言模型估计文本序列的联合概率使用统计方法时常采用n元语法循环神经网络的输出取决于当下输入和前一时间的隐变量(过去的历史信息)

2025-02-19 17:10:50 685

原创 了解Deepseek(本地部署及可视化)

了解新技术的一天。

2025-02-14 11:34:23 932

原创 跟着李沐老师学习深度学习(十一)

最早发布的卷积神经网络之一,因其在计算机视觉任务中的高效性能而受到广泛关注。该模型是由AT&T贝尔实验室的研究员Yann LeCun在1989年提出的(并以其命名),目的是识别图像中的手写数字(应用与美国邮政服务)。卷积编码器:由两个卷积层组成;全连接层密集块:由三个全连接层组成。在卷积层块中,每个卷积层都使用5 × 5 的窗口,并在输出上使用sigmoid激活函数。第一个卷积层输出通道数为6,第二个卷积层输出通道数则增加到16。在图中网络结构中汇聚层就是应用最大池化完成的。

2025-02-13 21:00:20 1347

原创 跟着李沐老师学习深度学习(十)

从这张PPT讲起,比如有一个猫狗分类的例子,比如一张图片的输入是36M像素,那么它的参数就有3600万;我们这里使用一个100大小的单隐藏层的MLP,那么此时整个模型就有100 * 36M的像素(即:36亿个参数);如果我们考虑多层感知机,在考虑大量数据的时候,那么此时无法处理了;说明:全连接层处理图片的时候会遇到参数过多、模型过大的问题。

2025-02-13 11:11:24 1098

原创 跟着李沐老师学习深度学习(八)

当数值过大或者过小时会导致数值问题常发生在深度模型中,因为其会对n个数累乘合理的权重初始值和激活函数的选取可以提升数值稳定性。

2025-02-12 23:57:43 670

原创 跟着李沐老师学习深度学习(七)

权重衰退通过L2 正则项使得模型参数不会过大,从而控制模型复杂度正则项权重是控制模型复杂度的超参数。丢弃法将一些输出项随机置0来控制模型复杂度常作用在多层感知机的隐藏层输出上丢弃概率是控制模型复杂度的超参数。

2025-02-12 21:50:25 979

原创 跟着李沐老师学习深度学习(六)

训练数据集:训练模型参数验证数据集:选择模型超参数非大数据集上通常使用k-折交叉验证训练、验证、测试集的关系:训练数据集是模型学习的源泉,用于确定模型的参数。验证数据集是训练过程中的 “质检员”,用于调整模型的超参数,提高模型的泛化能力。测试数据集是模型的 “最终考官”,用于对模型的最终性能进行客观评估。三者相互协作,共同确保模型具有良好的性能和泛化能力。在实际应用中,通常将原始数据集按照一定的比例(如 70% 训练集、15% 验证集、15% 测试集)进行划分。

2025-02-12 15:37:17 1035

原创 跟着李沐老师学习深度学习(五)

年前由于组会汇报,看的时候跳的比较多,看的理论也比较多,很多就没看仔细,先把年前的一些做一个总结吧。

2025-02-06 23:05:10 327

原创 跟着李沐老师学习深度学习(四)

多层感知机使用隐藏层和激活函数来得到非线性模型;常用激活函数是Sigmoid,Tanh,ReLU;使用 Softmax 来处理多类分类;超参数为隐藏层数,和各个隐藏层大小。

2025-02-06 22:25:54 1041

原创 跟着李沐老师学习深度学习(三)

Softmax 回归是一个多类分类模型使用 Softmax 操作子得到每个类的预测置信度使用交叉熵来来衡量预测和标号的区别。

2025-02-06 21:46:23 762

原创 跟着李沐老师学习深度学习(二)

线性回归是对n维输入的加权,外加偏差使用平方损失来衡量预测值和真实值的差异线性回归有显示解(最简单的模型)线性回归可以看做是单层神经网络梯度下降通过不断沿着反梯度方向更新参数求解小批量随机梯度下降是深度学习默认的求解算法(稳定、简单)两个重要的超参数是批量大小和学习率。

2025-02-06 15:46:01 902

原创 跟着李沐老师学习深度学习(一)

应用:图片分类、物体检测和分割、样式迁移、人脸合成、文字生成图片、文字生成(QA)、无人驾驶。案例-广告点击:触发(关键词)–> 点击率预估 --> 排序(点击率 * 竞价)

2025-01-10 09:43:29 779

原创 跟着小土堆学习pytorch(三)

可以尝试看一些开源项目。

2025-01-07 12:57:27 599

原创 跟着小土堆学习pytorch(二)

非线性激活函数是指在神经网络中,用于增加网络的非线性特性的函数。这些函数的输出不是输入的简单线性组合,而是通过某种非线性变换来处理输入信号,从而使得神经网络能够学习和表示更加复杂的函数关系通过对比非线性操作前后的图像,发现经过非线性激活函数处理之后的图像中的主要内容更突出了。ReLU函数处理自然语言效果更佳,Sigmoid函数处理图像效果更佳。线性层又叫全连接层,其中每个神经元与上一层所有神经元相连。in_features:每个输入(x)样本的特征的大小。

2025-01-05 00:14:31 910

原创 跟着小土堆学习pytorch(一)

打开Anaconda Prompt一开始是在base环境,可以使用来进行创建一个新的环境。创建完毕之后如下图所示:使用激活环境接下来就是安装pytorch进入pytorch官网,如下图所示可以通过选择相关版本来生成命令进行安装(很不幸我的电脑并没有英伟达的独显,先用CPU跑着吧)接下来就将刚刚的命令输入进行安装。安装完毕就可以使用pip list来查看安装的包。到这里pytorch就安装完成了。

2025-01-04 00:17:03 916

原创 2 神经网络的数学基础

斜率 a 被称为 f 在 p 点的导数(derivative)。如果 a 是负的,说明 x 在 p 点附近的微小变化将导致 f(x) 减小(如图 2-10 所示);如果 a 是正的,那么 x 的微小变化将导致 f(x) 增大。此外,a 的绝对值(导数大小)表示增大或减小的速度快慢。导数完全描述了改变 x 后 f(x) 会如何变化。如果你希望减小 f(x) 的值,只需将 x 沿着导数的反方向移动一小步。学完了这章之后了,对神经网络以及数据表示、张量运算、梯度优化有了深刻的印象。

2025-01-01 09:32:48 925

原创 《Python深度学习》阅读(一)

学习《Python 深度学习》

2024-12-30 14:39:41 643

原创 前端相关 —— nvm、vue3创建项目

nvm(Node Version Manager)是一个用于管理 Node.js 版本的工具。

2024-12-04 18:32:25 627

原创 git学习之cherry-pick命令

cherry-pick是一个 Git 命令,用于将一个或多个特定的提交从一个分支应用到当前分支。这个命令常用于将一个分支上的更改合并到另一个分支,而不需要进行完整的分支合并操作。使用 cherry-pick 时,确保你的当前分支是干净的,即没有未提交的更改,或者你已经对这些更改进行了提交。默认情况下,cherry-pick 会使用原始提交的信息。这会将这两个提交合并为一个新提交,并且让你编辑提交信息。如果你想将多个提交合并为一个新提交,可以使用。是你想要应用到当前分支的提交的哈希值。

2024-11-21 18:44:51 1031 1

原创 递归之希尔排序

希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序。

2023-01-10 14:41:15 229

原创 二分查找--递归

二分查找

2023-01-07 23:38:10 249

原创 什么是递归?

什么是递归?递归的基础练习

2023-01-06 20:02:48 156

原创 有关位运算

跟着B站《算法最美》学算法——位运算

2023-01-05 00:28:48 360

原创 HTML知识点复习

HTML知识点HTML是什么?HTML是用来描述网页的一种语言,指的是超文本标记语言(HyperText Markup Language),通过标签来标记要显示的网页中的各个部分,HTML的文档也叫web页面。现在的最新版本是:HTML5,简称H5.网页的组成部分:页面由三部分组成:内容(结构):在页面上可以看到的数据(使用html技术实现)表现:指这些内容在页面上的展示形式(CSS技术实现:布局、颜色、大小等)行为:页面元素与输入设备交互的响应(JavaScript)书写规范&lt

2022-01-20 21:59:09 807 2

原创 两数之和--力扣(Java)

两数之和–力扣这是第一次在力扣上面刷题,先做了一个简单的,但还是有很多的问题,下面就来写一写做题经过和学习心得,这里主要用Java。题目思路首先,暴力的解法就是使用双层for循环,时间复杂度为O(n^2),我考虑了暴力解法,之前主要使用C语言多,所以虽写出来了,但是效率很低。这个题呢,要用map,首先先来回忆一下Java中有关map的相关知识。在Java中,Map接口:Map中的元素都是成对出现的,以键值对映射的形式存储和管理数据每个对象都有一个唯一的key值,每个key对应一个valu

2022-01-19 22:37:19 1012 2

原创 PTA-团体程序设计天梯赛-练习集L1-003(C语言)

PTA-团体程序设计天梯赛-练习集L1-003(C语言)这几天正在做PTA这个团体程序设计天梯赛上面的题,虽然有的题并不难,但还是会出现很多的问题。下面是这几天做的其中一个题:如果没有这个位数要求的话,先设一个长度为10并且每个的值都初始化为0的数组,对传进来的数求余所得数即为数组下标,将对应数组的数值自增1即可。代码如下:#include <stdio.h>int Count_Digit ( const int N, const int D );int main(){

2021-11-07 19:49:42 1892 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除