- 博客(12)
- 收藏
- 关注
原创 【Transformer介绍】
在深度学习的世界里,Transformer架构可谓革命性的突破。自从2017年由Vaswani等人提出以来,Transformer不仅在自然语言处理(NLP)领域取得了巨大的成功,而且迅速普及到其他领域如计算机视觉和语音处理。今天,我们将详细解析Transformer,包括其基本原理、关键概念、实例应用以及为什么它如此重要。
2024-07-09 20:43:27
727
原创 【llm模型-参数解释】-temperature(基于GPT4的返回理解)
较低的温度使得模型更加保守,倾向于生成大家都能想到的、平滑流畅的内容。这种调整让模型在生成文本时更愿意冒险,尝试新颖或不常见的词汇组合,从而增加文本的多样性和创新性,但同时也可能降低文本的连贯性和合理性。温度 < 1:让概率分布更加尖锐,增加高概率事件的概率,同时降低低概率事件的概率。这会使模型在生成文本时倾向于选择更确定、更常见的词汇,从而生成的文本看起来更加流畅和合理,但可能牺牲一些创意和多样性。相反,如果游戏的"温度"调得高,那就意味着你在游戏中愿意大胆猜测,即便是一些看起来不太可能的词也敢于尝试。
2024-03-15 11:30:48
3507
2
原创 【机器学习记录随笔-基础篇】
【入门篇】我分享给大家一些基础内容。其中更是举例讲解了机器学习的相关简易内容。今天开始【基础篇】。基础篇的内容会逐步给大家讲解机器学习内部的一些专业术语等含义,以及再完善一下整体流程。目前的计划是,每一章节都会讲一个知识点。不求多,但求讲的通透大家可以理解。希望大家一起学习,共同进步。数据集的定义:一组数据的集合。这个定义比较简单,所以我们来结合数据集来补充一下相关的场景。同时也会结合我们实际的案例来讲。其实严格来讲。机器学习的数据集不单单是供机器来练习,一共分为训练集、验证集、测试集共三个。
2023-12-12 22:11:40
1010
1
原创 【机器学习记录随笔-入门篇】
上一篇我们初步讲解了机器学习是什么、如何预测及图片、文字等内容如何转成数字供电脑使用。今天继续接下来的内容。(本人第一次写博客,因为工作时间等缘故,可能有一些段落拆分的不合理、讲解的不够细致。后续时间充裕了会再逐步整理。
2023-12-09 19:17:52
883
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人