自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 fun-transformer task 4: Decoder

BLEU——通常用于评估机器翻译文本的质量。反向传播 随机梯度下降法。损失函数:交叉熵损失。

2025-01-25 00:07:57 217

原创 Datawhale fun-transformer task 3: transformer的encoder 结构

fill:#333;color:#333;color:#333;fill:none;

2025-01-21 23:24:52 935 1

原创 DataWhale fun-transformer task2 : attention机制+transformer

encoder-decoder架构编码器和解码器中的每一层都包含相同的子层,包括自注意力机制和前馈网络。这种架构不仅有助于全面理解输入序列,而且能够生成上下文丰富的输出序列。位置编码多头注意力机制就是多几个WqW_qWq​WkW_kWk​WvW_vWv​矩阵进行训练,可以让模型从不同的角度学习和关注输入序列的不同部分,从而增强模型的表达能力。前馈网络feed-forward就是神经网络的基本结构(线性变换和非线性激活函数)

2025-01-18 20:02:35 551

原创 DataWhale wow-agent task 2: llama-index搭建电商数据库查询&课本问答agent

llama-index默认调用OpenAI大模型,调用其他模型需要继承CustomLLM类自定义一个类。教程中还实现了一个流式输出的功能,即各大ai聊天平台上的打字机效果。这节课构建的agent暂且不需要记忆对话历史。

2025-01-17 22:23:36 811 2

原创 fun-transformer task1:

个人理解:在多分类问题中,输出的y是向量,比如transformer模型输出的是单词表里每个词在下个位置出现的概率,结果选最大的。

2025-01-15 14:38:38 752

原创 DataWhale wow-agent 笔记task 1: openai库搭建agent

通过openai框架搭建agent

2025-01-14 16:02:25 1023

原创 Datawhale夏令营 AI+经济 task3笔记

对照task3教程对task2在以下方面进行了改进。

2024-08-03 23:32:17 327

原创 Datawhale夏令营第三期AI+经济 task1&task2笔记

electricity price.csv时间两列合并后得electricity_price_parsed.csv是描述电力需求(demand)与市场出清价格(clearing price (CNY/MWh))随时间的变化数据电力需求每15min变动一次,市场出清价格每1h变动一次,用前100条数据稍微确认一下。由图可验证需求上升导致价格上升的规律。unit.csv 发电机组,即供给方数据,task1中只利用coal consumption一列作为成本参数。

2024-07-31 19:31:56 657

原创 Datawhale AI 夏令营 NLP方向 Task2笔记

该笔记比较baseline2与1相比进行了哪些改进,以及对后续优化的启发。

2024-07-17 23:30:00 180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除