- 博客(74)
- 收藏
- 关注
原创 BERT:基于TensorFlow的BERT模型搭建中文问答任务模型
【代码】基于TensorFlow的BERT模型搭建中文问答系统模型。
2024-02-28 19:20:34
1569
12
原创 TextCNN:文本分类卷积神经网络
TextCNN 来源于发表于2014年,是一个经典的模型,Yoon Kim将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的关键信息(类似统计语言模型的N-Gram),从而能够更好地捕捉局部相关性。TextCNN的核心思想是将卷积神经网络 (CNN) 应用到文本分类中,从而提取文本特征。本文将逐步对TextCNN做详细介绍。优点:网络结构简洁:TextCNN的网络结构相对简单,这使得模型容易理解和实现。训练速度快。
2024-02-22 15:37:31
5374
原创 Google:Gemini 1.5跨数百万上下文令牌解锁多模态理解技术报告(中文)
Gemini 1.5 Pro 是一个基于稀疏混合专家(MoE)转换器的模型,建立在 Gemini 1.0(GeminiTeam et al.,2023)研究进展和多模态能力。转换成真实世界的数据,这种上下文长度使 Gemini 1.5 Pro 模型能够轻松处理几乎一天的音频记录(即 22 小时),是 1440 页的书籍(或 587,287 个单词)“战争与和平”整体的十倍以上,整个亚麻(Heek et al.,2023)代码库(41,070 行代码),或每秒 1 帧的三小时视频。
2024-02-19 18:06:03
1189
原创 OpenAI:Sora视频生成模型技术报告(中文)
我们探索视频数据生成模型的大规模训练。具体来说,我们在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。我们利用transformer架构,在视频和图像潜在代码的时空补丁上运行。我们最大的模型Sora能够生成一分钟的高保真视频。我们的结果表明,缩放视频生成模型是构建物理世界通用模拟器的一条有希望的道路。
2024-02-18 09:23:15
3391
2
原创 详解Keras3.0 Layer API: Base RNN layer
【代码】详解Keras3.0 Layer API: Base RNN layer。
2024-02-01 17:34:24
529
原创 深度学习模型:GAN(生成对抗网络)
通过最小化生成器的损失函数和最大化判别器的损失函数,可以实现生成器和判别器的优化。生成器的目标是生成足够真实的数据以欺骗判别器,而判别器的目标是区分输入数据是真实数据还是生成器生成的伪造数据。首先,固定生成器的参数,训练判别器以更好地区分真实数据和生成数据。然后,固定判别器的参数,训练生成器以生成更真实的数据。训练GAN模型时,需要注意平衡生成器和判别器之间的训练过程,以及选择合适的损失函数和优化器,GAN的训练过程可能不稳定,需要调整超参数和网络结构来获得更好的生成效果。
2024-01-27 07:30:00
5652
原创 详解Keras3.0 Callbacks API : TensorBoard(可视化工具)
详解Keras3.0 Callbacks API : TensorBoard(可视化工具)
2024-01-07 07:32:29
891
原创 详解Keras:keras.preprocessing.image
Keras 库中的一个模块,用于处理和增强图像数据,它提供了一些实用的函数,如图像的加载、预处理、增强等。用于数据增强的类,可以对图像进行旋转、缩放、平移、翻转等操作。将 numpy 数组或 PIL 图像转换为 PIL 图像。用于加载图像文件,并返回一个 NumPy 数组表示该图像。将图像转换为 NumPy 数组。参数需要与模型输入层的大小相匹。
2024-01-06 21:58:23
2344
2
原创 详解Keras3.0 Losses:Probabilistic losses(概率损失)
【代码】详解Keras3.0 Losses:Probabilistic losses(概率损失)
2024-01-03 08:58:02
1215
原创 Keras加载预训练模型
Keras库提供了一种方便的方式来加载预训练模型。预训练模型通常是在大型数据集上训练的,如ImageNet,这些模型已经学习到了大量的特征和模式。通过加载预训练模型,我们可以利用这些学到的知识来加速我们的模型训练过程,或者直接使用这些模型来进行预测。
2023-12-30 20:00:32
785
原创 详解Keras3.0 Layer API: Dropout layer
Dropout层的作用是在神经网络中引入正则化,以防止过拟合。它通过随机丢弃一部分神经元的输出来减少模型对训练数据的依赖性。这样可以提高模型的泛化能力,使其在测试数据上表现更好。
2023-12-29 20:16:31
1053
原创 详解Keras3.0 Layer API: Activation functions(激活函数)
【代码】详解Keras3.0 Layer API: Activation functions(激活函数)
2023-12-25 15:25:47
2307
原创 详解Keras3.0 API: Optimizers(优化器)
优化器(Optimizer)是深度学习中用于更新模型参数的一种方法,它的目标是最小化损失函数。在训练神经网络时,我们通常使用梯度下降法来更新参数,而优化器就是实现这一过程的工具。优化器的主要作用是在每次迭代过程中计算损失函数关于模型参数的梯度,并根据梯度的方向和大小来更新参数,从而使得模型逐渐逼近最优解。在使用SGD优化器时,可以设置不同的学习率和动量参数。学习率决定了权重更新的速度,而动量参数则有助于加速梯度下降过程。在实际应用中,可以根据问题的复杂性和数据的特点来选择合适的优化器和参数。
2023-12-24 18:00:54
1712
原创 详解Keras3.0 KerasNLP Models: GPT2 GPT2Tokenizer
GPT2Tokenizer 用于将文本数据转换为适合训练和预测的格式,主要功能是将输入的文本进行分词、编码等操作,以便在神经网络中使用
2023-12-23 08:38:30
1329
原创 详解Keras3.0 Data loading: Audio data loading
【代码】详解Keras3.0 Data loading: Audio data loading
2023-12-21 18:43:55
1121
原创 详解Keras3.0 Data loading: Text data loading
【代码】详解Keras3.0 Data loading: Text data loading
2023-12-21 09:46:43
642
原创 详解TensorFlow2.0 API:tf.data.Dataset
【代码】详解TensorFlow2.0 API:tf.data.Dataset
2023-12-20 18:19:19
1871
1
原创 详解Keras3.0 Layers API: Pooling layers (AveragePooling1D 、AveragePooling2D 、AveragePooling3D)
【代码】详解Keras3.0 Layers API: Pooling layers (AveragePooling1D 、AveragePooling2D 、AveragePooling3D)
2023-12-16 18:17:14
1460
1
原创 详解Keras3.0 KerasCV API: StableDiffusion image-generation model
【代码】StableDiffusion image-generation model
2023-12-15 21:46:06
687
原创 详解Keras3.0 Data loading:Image data loading
【代码】详解Keras3.0 Data loading:Image data loading。
2023-12-13 20:50:23
1131
原创 详解Keras3.0 Layers API: Pooling layers (MaxPooling1D、MaxPooling2D、MaxPooling3D)
【代码】详解Keras3.0 Layers API: Pooling layers (MaxPooling1D、MaxPooling2D、MaxPooling3D)
2023-12-12 18:45:58
1679
原创 详解Keras3.0 Layers API: Core layers
【代码】详解Keras3.0 Layers API: Core layers。
2023-12-11 12:56:42
704
原创 详解Keras3.0 Layers API: Convolution layers(Conv1D、Conv2D、Conv3D)
【代码】详解Keras3.0 Layers API: Convolution layers(Conv1D、Conv2D、Conv3D)
2023-12-10 18:16:53
2496
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人