- 博客(13)
- 收藏
- 关注
原创 招聘与面试攻略
根据岗位需求对应的更改自身的简历,在目前的AI时代,大公司基本不排除有一套招聘大模型。时间范围:一般从每年的8月到11月,高峰期在9月到10月。早一点的7月已经开始预招人,同样晚一点的招人会招到12月底。那就将岗位需求内容问大模型,学习其技能点并分清在该行业应掌握的通用技能点以及其他技能点。如果您喜欢这篇文章,不妨打赏一杯咖啡,让我更有动力继续分享更多优质内容。Markdown语法编写适合自己的简历,不使用大家都使用的简历模板。时间范围:一般从每年的2月到5月,高峰期在3月到4月。有关于项目与证书方面。
2025-02-18 16:39:44
964
原创 DeepSeek:入门到精通(清华)文档的讲解与学习
本文章主要讲解提示语关键策略 提示语常见错误以及如何解决作为刚使用提示语的人员应先具备的思维和使用方法,并介绍AI幻觉以及五种类别七种特征
2025-02-12 14:20:20
963
原创 DeepSeek模型有关提示词的编写(Prompt)
提示词(Prompt)是用户在与人工智能系统交互时提供的输入文本,用于引导AI生成符合用户需求的内容。它是用户与AI之间沟通的桥梁,决定了AI的输出质量和方向简单的说是在使用Deepseek等模型时,用户的输入文本以及图片使得模型更出更接近用户想要的答案。
2025-02-09 15:37:38
1711
原创 DeepSeek
简单介绍:成立时间:DeepSeek23年7月份,技术:数据蒸馏技术背景:知名私募巨头幻方量化孕育而生24年1月发布,同月发布。2月,发布。3月,发布。5月,发布。6月,发布。9月,更新 API 支持文档,宣布合并DeepSeek Coder V2 和 DeepSeek V2 Chat,推出。12月,发布。同月正式上线DeepSeek-V3首个版本并同步开源。25年1月20号,发布数据蒸馏技术Mixture-of-Experts(MOE)模型介绍。
2025-02-08 19:45:00
3661
原创 Transformer总结
俩个小技巧Add&Norm:残差连接与正则化 将输入与输出连接(防止梯度消失)与改变输入在均值为0方差为1的分布(防止梯度消失与爆炸的问题)BPE(Byte Pair Encoding,字节对编码)是一种常用的子词分词算法,在自然语言处理(NLP)中用于将文本分割成更小的单位。多头注意力机制Multi-Attention与前馈Feed Forward(两层的MLP(多层感知机(输入层-隐藏层-输出层)))qkv三个矩阵是由前面的文本的表示向量(词表向量与位置向量的求和)×变换矩阵linear层。
2025-02-06 17:12:20
1110
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人