- 博客(15)
- 收藏
- 关注
原创 三分钟手算 Self-Attention(Transformer 核心解密)
本文通过真实模拟数据演示了Self-Attention机制的计算过程,重点解释了Query(Q)和Key(K)必须不同的原因。当Q和K不同时,才能实现"动词找名词"等语义匹配,而非简单查找相同词。文章详细展示了从输入到输出的完整计算步骤,并解读了最终输出向量的深层含义:新向量融合了上下文信息,使单词获得语境化的表征。例如"I"的向量会包含"you"的信息,这正是Transformer理解上下文关系的核心机制。
2025-12-31 15:28:16
900
原创 3分钟带你手搓 Transformer 注意力机制——原理+数值全过程详解
本文通过"查字典"的比喻解析Transformer的注意力机制。Query(Q)代表查询条件,Key(K)是索引标签,Value(V)对应具体内容。注意力机制通过计算Q与K的相似度,对V进行加权融合。数值演练展示了处理"fruit"时,模型会重点关注"apple"(权重0.79),少量关注"banana"(权重0.17),几乎忽略"chair"(权重0.04),最终输出接近apple但融合少量banana特征
2025-12-31 11:51:15
591
原创 镜像站也能被限流?用 Unsloth 踩坑实录:加个 Hugging Face Token,下载速度直接起飞
摘要:在使用Unsloth微调模型时,从HuggingFace下载模型遇到IP限制问题(Error 429)。主要原因是匿名用户频繁请求导致IP被限流。解决方法包括:1)获取HuggingFace的Read权限Token,添加到代码中(设置HF_TOKEN环境变量);2)临时方案如更换IP或等待1小时自动解除限制。推荐使用Token方法,可避免后续下载被限流。关键代码修改顺序:先设置镜像源HF_ENDPOINT,再设置HF_TOKEN,最后导入unsloth模块。
2025-12-30 15:22:19
494
原创 Python 版本升降级的后悔药——关键时候能救命
每天一个小知识,关键时候能救命,最有用的一集。在做AI项目时,总免不了与虚拟环境和各种库斗智斗勇,我就是在无意中将conda某env环境Python升级3.10了,导致环境直接崩塌,各种报错。但如果我把Python版本降到3.9,还会还原原来的环境吗。
2025-12-29 20:28:08
629
原创 蓝桥杯---有效的括号(Python)
class Solution: def isValid(self, s: str) -> bool: if len(s) % 2 == 1: return False #当 s 长为奇数时,为错误 pairs = { ")": "(", "]": "[", "}": "{"...
2022-03-21 20:37:18
369
原创 凯撒加密与反解密(反解密要知道关键字K)
import stringdef kaisa(s, k):lower = string.ascii_lowercase #小写字母upper = string.ascii_uppercase #大写字母before = string.ascii_lettersafter = lower[k:] + lower[:k] + upper[k:] + upper[:k]table = ''.maketrans(before, after) ...
2021-11-17 11:24:58
1164
原创 (三行正则表达式) 编写程序,用户输入一段英文,然后输出这段英文中所有长度为3个字母的单词。
import resr=input('请输入一段英文:')print(re.findall(r'\b[a-zA-Z]{3}\b',sr))
2021-11-17 11:14:57
6744
原创 (正则表达式三行) 假设有一段英文,其中有单词中间的字母i误写为I,请编写程序进行纠正。
import resr=input('请输入一段英文:')print(re.sub(r'\BI\B','i',sr))
2021-11-17 11:02:46
4369
原创 (正则表达式三行完成) 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。
import resr=input('请输入一段英文:')print(re.sub('i ','I ',sr))
2021-11-17 10:27:14
4221
2
原创 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。
your_str=input("请输入一段英文:")y_lst= your_str.split(" ")for i in range(len(y_lst)): if y_lst[i] == "i": y_lst[i] = "I"print(" ".join(y_lst))
2021-11-10 11:02:19
1557
原创 假设有一段英文,其中有单独的字母I误写为i,请编写程序进行纠正。
st=input('请输入一串字符串:')print(st) #输出用户输入的字符串my_list0=list(st) #将字符串转换成列表my_list1=[] #定义空列表for i in range(len(my_list0)): .
2021-11-03 15:26:34
4056
原创 假设有一段英文,其中有的字母I误写为i,请编写程序进行纠正。
st=input('请输入一串字符串:')print(st) #输出用户输入的字符串my_list0=list(st) #将字符串转换成列表my_list1=[] #定义空列表for i in range(len(my_list0)): .
2021-11-03 12:32:54
2834
原创 Python 编写程序,输出所有由1,2,3,4这四个数字组成的素数,并且在每个素数中每个数字只使用一次。
def my_list(): list0 = [1, 2, 3, 4] list1 = [] for i in list0: for j in list0: if i == j: continue for k in list0: if (i == k) or (j == k): continue .
2021-10-31 17:17:06
9943
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅