深度学习
文章平均质量分 85
禺垣
万世之一时,全局之一域。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
扩散模型(Diffusion Model)原理概述
扩散模型(Diffusion Model)是一种生成模型,受热力学中扩散过程的启发,通过模拟数据从噪声中逐步去噪的过程来生成样本。其核心思想是渐进式地添加噪声(正向过程)和逐步去噪(反向过程)。在正向过程中,逐步向数据中添加高斯噪声,最终将数据转化为纯噪声;在反向过程中,学习如何从噪声中逐步去噪,恢复出原始数据分布。原创 2025-07-13 13:56:49 · 1291 阅读 · 0 评论 -
生成式对抗网络(GAN)模型原理概述
生成对抗网络(Generative Adversarial Network, GAN)是一种通过对抗训练生成数据的深度学习模型,由生成器(Generator)和判别器(Discriminator)两部分组成,其核心思想源于博弈论中的零和博弈。原创 2025-07-12 23:59:14 · 1395 阅读 · 0 评论 -
BERT模型基本原理及实现示例
BERT(Bidirectional Encoder Representations from Transformers)是Google在2018年提出的预训练语言模型,其核心思想是通过双向Transformer结构捕捉上下文信息,为下游NLP任务提供通用的语义表示。原创 2025-07-10 21:34:02 · 501 阅读 · 0 评论 -
Transformer模型原理概述
Transformer 是一种基于自注意力机制(Self-Attention)的深度学习模型,最初由 Google 在 2017 年的论文《Attention Is All You Need》中提出,主要用于自然语言处理任务,如今已广泛应用于计算机视觉、语音识别等多个领域,是现代大语言模型(如GPT、BERT等)的核心架构。原创 2025-07-10 20:57:44 · 984 阅读 · 0 评论 -
深度学习模型在C++平台的部署
深度学习模型能够在各种生产场景中发挥重要的作用,而深度学习模型往往在Python环境下完成训练,因而训练好的模型如何在生产环境下实现稳定可靠的部署,便是一个重要内容。C++开发平台广泛存在于各种复杂的生产环境,随着业务效能需求的不断提高,充分运用深度学习技术的优势显得尤为重要。本文介绍如何实现将深度学习模型部署在C++平台上。原创 2025-07-09 23:59:35 · 513 阅读 · 0 评论 -
常见的损失函数汇总
损失函数(Loss Function)是机器学习和深度学习中用于衡量模型预测值与真实值之间差异的函数,其值越小表示模型性能越好。不同的任务(如分类、回归、生成等)需要选择不同的损失函数。原创 2025-07-01 15:21:09 · 1426 阅读 · 0 评论 -
图神经网络(GNN)模型的基本原理
图神经网络(Graph Neural Networks, GNN)是一种直接在图结构数据上运行的神经网络,用于处理节点、边或整个图的特征信息。其核心思想是通过聚合邻域节点的特征信息来更新当前节点的表示,从而捕捉图中节点间的依赖关系和拓扑结构特征。原创 2025-06-08 14:26:40 · 1658 阅读 · 0 评论 -
知识图谱技术概述
知识图谱(Knowledge Graph) 是一种基于图结构的语义网络,用于表示实体及其之间的关系,旨在实现更智能的知识表示和推理。它通过将现实世界中的各类信息抽象为 “实体-关系-实体” 的三元组结构,构建出复杂的知识网络,从而支持高效的信息检索、语义理解和决策分析。原创 2025-06-06 23:58:46 · 1033 阅读 · 3 评论 -
长短期记忆(LSTM)网络模型
长短期记忆(Long Short-Term Memory,LSTM)网络是一种特殊的循环神经网络(RNN),专门设计用于解决传统 RNN 在处理长序列数据时面临的梯度消失 / 爆炸问题,能够有效捕捉长距离依赖关系。其核心在于引入记忆细胞(Cell State)和门控机制(Gate Mechanism),通过控制信息的流动来实现对长期信息的存储与遗忘。原创 2025-05-31 00:10:23 · 3024 阅读 · 0 评论 -
循环神经网络(RNN)模型
循环神经网络(Recurrent Neural Network, RNN)是一种专门设计用于处理序列数据(如文本、语音、时间序列等)的神经网络模型。其核心思想是通过引入时间上的循环连接,使网络能够保留历史信息并影响当前输出。原创 2025-05-30 00:09:33 · 1292 阅读 · 4 评论 -
卷积神经网络(CNN)模型
卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,广泛应用于图像识别、计算机视觉等领域。其设计理念源于对生物视觉皮层神经机制的模拟,核心原理是通过卷积、池化(下采样)、全连接等操作,自动提取输入数据的层级特征,完成分类或回归任务。原创 2025-05-26 13:42:43 · 1279 阅读 · 0 评论 -
常见的激活函数汇总
在神经网络中,激活函数(Activation Function)扮演着至关重要的角色,它为神经网络引入非线性因素,使得网络能够学习和模拟复杂的非线性函数关系,从而具备处理各种复杂问题的能力。如果没有激活函数,多层神经网络将仅仅是一个线性组合模型,其表达能力会受到极大限制。以下是几种常见的激活函数汇总。原创 2025-05-16 01:04:16 · 1167 阅读 · 0 评论 -
卷积神经网络(CNN)
核心:卷积操作一、内容卷积神经网络(CNN)是一种特殊结构的神经网络,因含卷积层的卷积操作而得名,具有很强的特征提取能力,这里对卷积神经网络的各层概念及计算过程做一笔记,对于它的深层理解见仁见智吧。一般CNN各层分别为输入层、卷积层、下采样层、全连接层、输出层。该方法最初针对图像问题提出来的,也最早应用于图像问题,其最显著的一个特性就是对当前特征图局部范围内特征的提取。它的三个特征是局...原创 2018-10-27 11:45:15 · 936 阅读 · 0 评论 -
Tensorflow模型的保存和加载
刚接触深度学习,Tensorflow模型的保存和加载尚不清楚,根据教程的翻译做一记录,不当之处敬请指正。原文地址:http://cv-tricks.com/tensorflow-tutorial/save-restore-tensorflow-models-quick-complete-tutorial/在本教程中,将作出如下讲解: I. Tensorflow模型是什么样的? II...翻译 2018-04-18 19:46:40 · 11662 阅读 · 3 评论 -
MNIST数据集转化为CSV格式
MNIST数据集是一个手写识别数据集,机器学习基础的数据集,其原始数据集以字节形式存储,包含四个部分:训练集images: train-images-idx3-ubyte.gz (包含60000个样本) 训练集labels: train-labels-idx1-ubyte.gz (包含60000个标签) 测试集images:t10k-images-idx3-ubyte.gz (...原创 2018-04-11 11:46:27 · 14082 阅读 · 4 评论 -
Windows下Tensorboard的使用
TensorBoard是TensorFlow自带的一套可视化工具,可以展现tensorflow运行过程的计算图及各数据信息。本人tensorflow安装的是windows7下的cpu版本,IDE是PyCharm. 其tensorboard的使用如下:1.指定日志文件,进行记录写好name_scope后,在Session运行之前加上语句writer = tf.summary.FileWriter("...原创 2018-04-08 10:42:53 · 1208 阅读 · 0 评论 -
tensorflow错误笔记:PyCharm下各种模块导入问题和AttributeError:module 'pandas.core.computation' has no attribute
之前在windows下装了TensorFlow和Anaconda,运行环境是Pycharm.(开始直接在cmd下试的没问题,运行命令:pytho fileneme.py,感觉用着不方便,还是学着用PyCharm吧。不过二者遇到的问题都是一致的,可用同样方法解决)错误1:模块导入问题正常情况下,导入各种模块、包时,在 File->Settiings->Project:project_na原创 2018-01-22 09:47:34 · 14504 阅读 · 2 评论
分享