自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 博客摘录「 关于CNN的复杂度分析总结」2025年2月19日

由于维度诅咒的限制,模型的参数越多,训练模型所需的数据量就越大,而现实生活中的数据集通常不会太大,这会导致模型的训练更容易过拟合。如果复杂度过高,则会导致模型训练和预测耗费大量时间,既无法快速的验证想法和改善模型,也无法做到快速的预测。当我们需要裁剪模型时,由于卷积核的空间尺寸通常已经很小(3x3),而网络的深度又与模型的表征能力紧密相关,不宜过多削减,通道数为3的特征图,经卷积后通道数变为5,则需5个3*3*3的卷积核(最后一个3是通道数)因此模型裁剪通常最先下手的地方就是通道数。输出特征图的通道数。

2025-02-19 23:01:43 387

原创 博客摘录「 一文彻底搞懂多模态:模态表示、多模态融合、跨模态对齐」2025年2月18日

文本模态的表示:文本模态的表示方法有多种,如独热表示、低维空间表示(如通过神经网络模型学习得到的转换矩阵将单词或字映射到语义空间中)、词袋表示及其衍生出的n-grams词袋表示等。,差别就是前者把不同的数据统一映射到一个向量空间,得到一个新的特征表示。是把不同类型(图像、文本和声音等)的数据表示成计算机能够认识的形式,以便后续对数据进行分析、融合等操作。指的是利用不同模态之间的互补性,它将抽取自不同模态的信息整合成一个稳定的多模态表征。视觉模态(图片和视频)和声音模态的表示往往通过卷积和神经网络来实现。

2025-02-19 00:06:30 931

原创 摘录「 [NLP] 自然语言处理 --- NLP入门指南」2025年2月13日

这俩模型得到的词向量都是静态词向量,此向量会把多义词的语义进行融合,训练结束之后不会根据上下文进行改变。静态词向量无法解决多义词的问题(如:“我今天买了7斤。缺点:向量和词考虑不到一词多义的情况,此模型是个静态模型,但针对特定任务的效果优化差。有两个知识点:定义窗口大小,把窗口词语出现的次数当作索引值。分布式表示的理论基础就是:词义的什么取决于该词语的上下文。目前,主流的中文分词技术采用的都是。分词,一个热门的多语言中文分词包。的方案,其中典型的代表就是。tf-idf词频逆文档频率。可以解决多义词的问题。

2025-02-13 16:12:25 480

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除