自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(318)
  • 收藏
  • 关注

原创 MCP和Function Calling的区别

最通俗易懂的讲解MCP和Function Calling的区别

2025-03-17 18:36:46 1231

原创 全网最全的pandas教学(包含17种处理函数)

带你畅游AI数据处理大门。全网最全的pandas教学(包含17种处理函数)

2025-03-03 23:52:29 801

原创 Deepseek-R1模型与GRPO原理详解

Deepseek-R1模型与GRPO原理详解

2025-03-02 14:47:19 883

原创 测评几个本地代码模型:零一万物、千问、deepseek、llama

测评几个本地代码模型:零一万物、千问、deepseek、llama

2025-03-01 23:32:43 739

原创 Cursor结合Claude 3.7零基础开发愤怒的小鸟【深夜Claude 3.7系列发布,类似DeepSeek-R1和V3的合体?】

Cursor结合Claude 3.7零基础开发愤怒的小鸟【深夜Claude 3.7系列发布,类似DeepSeek-R1和V3的合体?】

2025-02-25 22:59:08 423

原创 两种相似度算法:Jaro-Winkler和LCS

两种相似度算法:Jaro-Winkler和LCS最长公共子序列

2025-02-24 09:00:00 855

原创 DeepSeek-R1模型的数学原理(说人话)

浅显易懂的聊一聊DeepSeek-R1模型的数学原理

2025-02-09 22:12:59 1047

原创 传统NLP和大模型微调的区别(说人话)

传统NLP和大模型微调的区别(说人话)

2025-02-06 23:23:34 967

原创 神经网络的数据流动过程(张量的转换和输出)

神经网络的数据流动过程(张量的转换和输出)

2025-02-01 19:17:00 1349 1

原创 怎么在AutoDL上面使用HuggingFace(亲测有效)

在AutoDL上面使用HuggingFace,2025年1月29日亲测有效

2025-01-31 17:29:43 1145

原创 2024年度总结——普本大四学生转行人工智能的心路历程

一名大四学生从Java转行人工智能新方向的2024年终总结!

2025-01-22 20:19:02 1218 7

原创 公司代码看不懂?这个免费神器可以帮到你

自主开发的一个小工具,帮你快速上手公司代码

2024-12-08 12:33:08 1196

原创 速通LoRA:《LoRA: Low-Rank Adaptation of Large Language Models》全文解读

速通LoRA:《LoRA: Low-Rank Adaptation of Large Language Models》全文解读

2024-11-11 10:25:25 782

原创 19种RAG结构

19种RAG结构

2024-11-04 11:02:07 1196 1

原创 速通GLM:《GLM: General Language Model Pretraining with Autoregressive Blank Infilling》全文解读

速通GLM:《GLM: General Language Model Pretraining with Autoregressive Blank Infilling》全文解读

2024-10-15 08:00:00 1096 1

原创 深度学习架构:MOE架构

深度学习架构:MOE架构

2024-10-14 18:39:21 2017 3

原创 最大化似然估计?你知道什么叫”似然“吗?

最大化似然估计?你知道什么叫”似然“吗?

2024-10-14 18:34:39 1085 2

原创 [毕设项目-大模型微调]现代文翻译文言文[基于LLaMA3.1-8B微调]

教你基于LLaMA3.1-8B微调如何做到现代文翻译文言文

2024-10-10 09:47:50 1425 5

原创 两万字长文带你手搓Transformer架构【附完整python代码】

两万字长文带你手搓Transformer架构【附完整python代码】

2024-09-22 09:56:27 1391 1

原创 速通LLaMA3:《The Llama 3 Herd of Models》全文解读

速通LLaMA3:《The Llama 3 Herd of Models》全文解读

2024-09-21 14:55:06 4466

原创 Meta-Learning数学原理

Meta-Learning数学原理

2024-09-18 20:13:00 1100

原创 速通LLaMA2:《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读

速通LLaMA2:《Llama 2: Open Foundation and Fine-Tuned Chat Models》全文解读

2024-09-17 16:46:45 2248 4

原创 KL散度(Kullback-Leibler)

KL散度(Kullback-Leibler)

2024-09-16 15:56:16 1286

原创 速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读

速通LLaMA1:《LLaMA: Open and Efficient Foundation Language Models》全文解读

2024-09-15 13:26:49 1942 2

原创 AdamW和Adam优化器对比分析

AdamW和Adam优化器对比分析

2024-09-15 11:30:34 2225

原创 大模型火了这么久了,还不知道什么是token?一文教会你

大模型火了这么久了,还不知道什么是token?一文教会你

2024-09-15 10:21:52 1940

原创 速通GPT:《Improving Language Understanding by Generative Pre-Training》全文解读

速通GPT:Improving Language Understanding by Generative Pre-Training全文解读

2024-09-10 15:56:27 1444

原创 新版智慧职教(zjy2域名开头的)怎么下载课件?一篇文章教会你

新版智慧职教(zjy2域名开头的)怎么下载课件?一篇文章教会你

2024-09-10 00:35:27 2156

原创 速通GPT-2:《Language Models are Unsupervised Multitask Learners》全文解读

速通GPT-2:Language Models are Unsupervised Multitask Learners全文解读

2024-09-09 13:09:22 1165 2

原创 元学习Meta-Learning

元学习Meta-Learning

2024-09-08 13:23:07 4532

原创 什么是GPT-3的自回归架构?为什么GPT-3无需梯度更新和微调

什么是GPT-3的自回归架构?为什么GPT-3无需梯度更新和微调

2024-09-07 16:24:52 1468

原创 速通GPT-3:《Language Models are Few-Shot Learners》全文解读

速通Language Models are Few-Shot Learners文章,带你快速了解GPT-3

2024-09-07 15:41:21 1666 2

原创 一文带你全面理解Transformer的工作原理【图解】

通过图解的方式,带你全面理解Transformer的工作原理

2024-08-26 08:00:00 1716

原创 深度学习分类:交叉熵

补充一个深度学习分类重要的概念:交叉熵

2024-08-26 07:00:00 1070

原创 Self-attention反向传播和梯度消失计算

Self-attention反向传播和梯度消失计算

2024-08-25 01:27:21 1080

原创 python代码提取每页PDF转为图片

python代码提取每页PDF转为图片

2024-08-23 09:00:00 426

原创 Self-Attention流程的代码实现【python】

Self-Attention流程的代码实现

2024-08-19 17:20:46 1739 3

原创 深入剖析Self-Attention自注意力机制【图解】

Self-Attention自注意力机制详细图解,深入剖析计算过程

2024-08-19 08:30:00 1831 2

原创 【NLP】注意力机制:规则、作用、原理、实现方式

注意力机制的规则、作用、原理、实现方式【数学+图解】

2024-08-16 15:51:11 1417

原创 【NLP】文本特征处理:n-gram特征和文本长度规范

自然语言处理中的文本特征处理,包含n-gram特征和文本长度规范

2024-08-12 22:58:37 1273

中等企业规模组网与应用实践拓扑

本实训拓扑为中等企业规模组网与应用实践实训,内容是对各种网络协议的配置及其学习,与本账号的中等企业规模组网与应用实践实训文档吻合。

2024-01-08

网络实训项目:中等企业规模组网与应用实践.pdf

本实训文档为中等企业规模组网与应用实践实训,内容是对各种网络协议的配置及其学习。

2023-12-29

JavaWeb.pdf

该资源是我个人Java Web技术体系的学习笔记,可以直接下载这个pdf,也可以到我专栏Java Web中查看。谢谢大家支持。

2023-04-12

JavaSE->关于我个人学习Java途中整理的笔记

这个是我自己学习途中整理的JavaSE的笔记,内容比较详细,有理论解释也有代码样例,分享给大家。让我们一起学习一起进步!

2023-01-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除