自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2402_82738349的博客

原创大模型的通用概念

大语言模型 (Large Language Model, LLM) 是通过大量文本语言数据，基于transformer模型架构，通过预训练，指令微调，人类对齐，解码后部署的。之后基于自然语言的研究还有提示学习，规划与智能体，评测和应用。目前主要的大模型就有GPT4o，PaLM， LLaMA等。实现的内容包括机器翻译、文本生成、语音识别、问答系统等。

2025-02-13 21:52:15 933

原创从 Transformer 到 BERT 的入门指南（简单版）

可以把 \frac{QK^T}{\sqrt{d_k}} 理解为一个“词与词之间相似度”的矩阵，然后再用 softmax 得到注意力权重，最后与 V 相乘得到加权信息。• 这一步我们得到输入序列的 \mathbf{X} 形如 (\text{batch}, \text{seq_len}, \text{embedding_dim})。：使用 Decoder 中的 Q 和 Encoder 输出 \mathbf{Z} 中的 K, V，计算 Decoder 对原文（Encoder 输出）的关注。

2025-02-06 16:54:36 786

原创 INT201 Decision,Computation and Language

xjtluY3

2024-09-12 17:52:19 1061

原创 Pairwise Sequence Alignment (PSA) in java

Pairwise Sequence Alignment (PSA) int102 算法Global alignment vs. local alignment

2024-06-02 00:31:21 603

原创 LCS算法 java

int102，lcs，dp，java，算法

2024-06-01 23:48:42 871

原创复合赋值运算符（常用篇）（基础）

快速了解++i，i++，+=, -=, *=等知识

2024-05-31 22:27:16 858 1

原创数字的数据类型（常用）java

数字数据类型及其范围

2024-05-31 20:28:06 537

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除