不懂就要问-优快云博客

原创 GPT3 与 GPT2 的异同

GPT-3 是 GPT-2 的显著升级版本，通过增加模型规模、改进训练数据和方法，以及增强少样本学习能力，GPT-3 在多种自然语言处理任务上表现出色，展示了大型语言模型在通用性和适应性方面的巨大潜力。尽管 GPT-3 仍有一些局限性，但其在文本生成和理解方面的进步为未来的研究和应用提供了新的方向。

2025-02-27 19:56:50 856

GPT2主要探讨了语言模型在没有明确监督的情况下，通过在大规模网页文本数据集（WebText）上进行训练，能够学习执行多种自然语言处理任务的能力。研究团队通过实验展示了语言模型在问答、机器翻译、阅读理解等任务上的表现，并分析了模型容量对性能的影响。背景知识自然语言处理任务：通常需要通过监督学习在特定数据集上进行训练，如问答、机器翻译、阅读理解和文本摘要等。语言模型：通过预测文本序列中的下一个词来学习语言的统计规律，通常被视为无监督学习任务。GPT-2。

2025-02-27 19:45:33 931

原创 GPT 与BERT的异同

GPT1介绍了一种通过生成式预训练（Generative Pre-Training）来提升语言理解能力的方法。这种方法首先在一个大型的未标注文本语料库上进行语言模型的预训练，然后针对具体的任务进行判别式微调（discriminative fine-tuning）。文章详细阐述了这种方法的动机、相关工作、框架、实验结果以及分析。背景知识与研究动机自然语言理解（NLU）涉及多种任务，如文本蕴含、问答、语义相似度评估和文档分类等。这些任务通常面临标注数据稀缺的问题，限制了基于判别式训练模型的性能。

2025-02-27 19:42:00 802

原创使用CNN+LSTM+Attn的洪水发生几率的预测回归模型

使用CNN+LSTM+Attn解决回归问题

2024-12-26 15:20:30 1324 1

原创 EfficientNet模型Pytorch版本具体实现

EfficientNet模型简要实现

2024-12-19 19:06:57 754

原创 EfficientNet：对模型深度、宽度和分辨率的混合缩放策略

这张图可以清晰明了的显示EfficientNet 的卓越表现，一句话总结：更小的模型、更快的速度、更好的效果。

2024-12-19 15:31:29 1159

原创 Swin Transformer变体2：Swin Transformerv2模型

对Swin Transformer的举出模型做了一定的修改，模型性能大幅提升

2024-12-13 16:43:07 1033

原创 Swin Transformer 变体1：使用MLP代替多头注意力机制

对Swin Transformer的基础模型作出修改

2024-12-13 16:19:55 1145

原创 Swin Transformer模型具体代码实现

本文简要实现了Swin Transformer模型

2024-12-11 23:08:54 790

原创 Swin Transformer:用Transformer实现CNN多尺度操作

对Swin Transformer的实现原理做了简单介绍

2024-12-11 22:45:53 1588

原创 BERT模型具体代码实现

这篇文章简要实现了一个BERT模型

2024-12-05 21:08:38 1323

原创 BERT模型浅要了解

简要介绍BERT模型的基础知识

2024-12-05 20:49:00 1233

原创 ViT大模型浅要实现

简要实现了ViT模型与训练

2024-11-23 23:06:00 1315

原创 Transformer简单编码实现

简要实现transformer架构

2024-11-23 21:44:52 1174

原创 VIT大模型浅要了解

本文章简要介绍了ViT-patch16-24模型的一些简要代码

2024-11-04 19:25:45 1364

原创 AIGC利器：Flux模型代码基础学习

初步了解Flux-1-dev模型的代码

2024-10-24 23:36:55 2113

原创 Tokenizer基础使用教程

Tokenizer基础使用教程

2024-09-05 12:29:08 777

原创 Datasets库入门使用教程

datasets库入门使用

2024-09-04 17:23:49 2750 1

原创软件构造思考5：策略模式/Visitor模式/模板模式/装饰器模式

软构知识点总结

2022-06-14 16:16:31 166

原创软件构造思考3：规约与ADT

软件知识点总结

2022-06-09 22:08:44 183

原创软件构造思考4:面向对象编程OOP

软件知识点总结

2022-06-09 20:51:14 213

原创软件构造思考2：Java中的广度优先搜索

关于广度优先搜索

2022-06-07 17:13:15 474

原创软件构造思考1-软件构造的多维度视图以及质量指标

软构知识点总结

2022-06-05 17:00:11 256

原创猴子摘香蕉-人工智能实验的思考

人工智能实验

2022-06-05 12:49:41 2889 1

原创关于Wareshark分析网络层次结构的一些思考

信息安全概论

2022-06-03 19:59:44 405 1

原创软件构造LAB2的一些思考

Lab 2实验总结

2022-06-01 21:56:00 320

原创关于注册表编程的一些思考

本文是关于大信息安全概论有关注册表编程的一些基础了解

2022-06-01 21:42:20 414

原创 2022春计算机系统大作业

计算机系统大作业题目程序人生-Hello’s P2P 专业计算机学　　号班　　级学生　指导教师　计算机科学与技术学院2021年5月摘要本文主要阐述了一个孤独的hello.c文件是怎么在linux系统中一步步......

2022-05-16 21:04:56 2496

原创关于程序优化的一些思考

目录第1章实验基本信息1.1 实验目的1.2 实验环境与工具1.2.1 硬件环境1.2.2 软件环境1.2.3 开发工具1.3 实验预习第2章实验预习2.1 程序优化的十大目标（5分）2.2性能优化的方法概述（5分）2.3 Linux下性能测试的方法（5分）2.4 Windows下性能测试的方法（5分）第3章性能优化的方法第4章性能优化实践第1章实验基本信息1.1 实验目的理解程序优化的10个维度熟练利用..

2022-05-13 21:55:12 2300

原创软件构造LAB1的一些思考

软件构造LAB1总结

2022-05-08 20:02:32 539

my的博客