自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 三分钟手算 Self-Attention(Transformer 核心解密)

本文通过真实模拟数据演示了Self-Attention机制的计算过程,重点解释了Query(Q)和Key(K)必须不同的原因。当Q和K不同时,才能实现"动词找名词"等语义匹配,而非简单查找相同词。文章详细展示了从输入到输出的完整计算步骤,并解读了最终输出向量的深层含义:新向量融合了上下文信息,使单词获得语境化的表征。例如"I"的向量会包含"you"的信息,这正是Transformer理解上下文关系的核心机制。

2025-12-31 15:28:16 900

原创 3分钟带你手搓 Transformer 注意力机制——原理+数值全过程详解

本文通过"查字典"的比喻解析Transformer的注意力机制。Query(Q)代表查询条件,Key(K)是索引标签,Value(V)对应具体内容。注意力机制通过计算Q与K的相似度,对V进行加权融合。数值演练展示了处理"fruit"时,模型会重点关注"apple"(权重0.79),少量关注"banana"(权重0.17),几乎忽略"chair"(权重0.04),最终输出接近apple但融合少量banana特征

2025-12-31 11:51:15 591

原创 镜像站也能被限流?用 Unsloth 踩坑实录:加个 Hugging Face Token,下载速度直接起飞

摘要:在使用Unsloth微调模型时,从HuggingFace下载模型遇到IP限制问题(Error 429)。主要原因是匿名用户频繁请求导致IP被限流。解决方法包括:1)获取HuggingFace的Read权限Token,添加到代码中(设置HF_TOKEN环境变量);2)临时方案如更换IP或等待1小时自动解除限制。推荐使用Token方法,可避免后续下载被限流。关键代码修改顺序:先设置镜像源HF_ENDPOINT,再设置HF_TOKEN,最后导入unsloth模块。

2025-12-30 15:22:19 494

原创 Python 版本升降级的后悔药——关键时候能救命

每天一个小知识,关键时候能救命,最有用的一集。在做AI项目时,总免不了与虚拟环境和各种库斗智斗勇,我就是在无意中将conda某env环境Python升级3.10了,导致环境直接崩塌,各种报错。但如果我把Python版本降到3.9,还会还原原来的环境吗。

2025-12-29 20:28:08 629

原创 未来的两个风口?论如何将大模型与车联网结合!

未来的两个风口?论如何将大模型与车联网结合!

2025-03-11 16:47:57 731

原创 如何使用PyCharm连接服务器GPU?四步搞定!

如何使用PyCharm连接服务器GPU?四步搞定!

2025-03-11 16:44:24 1149

原创 蓝桥杯---有效的括号(Python)

class Solution: def isValid(self, s: str) -> bool: if len(s) % 2 == 1: return False #当 s 长为奇数时,为错误 pairs = { ")": "(", "]": "[", "}": "{"...

2022-03-21 20:37:18 369

原创 凯撒加密与反解密(反解密要知道关键字K)

import stringdef kaisa(s, k):lower = string.ascii_lowercase #小写字母upper = string.ascii_uppercase #大写字母before = string.ascii_lettersafter = lower[k:] + lower[:k] + upper[k:] + upper[:k]table = ''.maketrans(before, after) ...

2021-11-17 11:24:58 1164

原创 (三行正则表达式) 编写程序,用户输入一段英文,然后输出这段英文中所有长度为3个字母的单词。

import resr=input('请输入一段英文:')print(re.findall(r'\b[a-zA-Z]{3}\b',sr))

2021-11-17 11:14:57 6744

原创 (正则表达式三行) 假设有一段英文,其中有单词中间的字母i误写为I,请编写程序进行纠正。

import resr=input('请输入一段英文:')print(re.sub(r'\BI\B','i',sr))

2021-11-17 11:02:46 4369

原创 (正则表达式三行完成) 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。

import resr=input('请输入一段英文:')print(re.sub('i ','I ',sr))

2021-11-17 10:27:14 4221 2

原创 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。

your_str=input("请输入一段英文:")y_lst= your_str.split(" ")for i in range(len(y_lst)): if y_lst[i] == "i": y_lst[i] = "I"print(" ".join(y_lst))

2021-11-10 11:02:19 1557

原创 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。

st=input('请输入一串字符串:')print(st) #输出用户输入的字符串my_list0=list(st) #将字符串转换成列表my_list1=[] #定义空列表for i in range(len(my_list0)): .

2021-11-03 15:26:34 4056

原创 假设有一段英文,其中有的字母I误写为i,请编写程序进行纠正。

st=input('请输入一串字符串:')print(st) #输出用户输入的字符串my_list0=list(st) #将字符串转换成列表my_list1=[] #定义空列表for i in range(len(my_list0)): .

2021-11-03 12:32:54 2834

原创 Python 编写程序,输出所有由1,2,3,4这四个数字组成的素数,并且在每个素数中每个数字只使用一次。

def my_list(): list0 = [1, 2, 3, 4] list1 = [] for i in list0: for j in list0: if i == j: continue for k in list0: if (i == k) or (j == k): continue .

2021-10-31 17:17:06 9943

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除