心灵Haven-优快云博客

原创 Blender模型导出

需要Blender到Unity的材质优化清单吗？包含节点简化、贴图压缩等5个关键步骤，能减少90%的材质问题。一、Blender导出设置。三、Unity导入与修复。二、导出为FBX格式。

2025-11-26 21:22:44 494

当 LLM 遇到自身无法直接解决的问题（如实时数据查询、复杂计算、操作硬件等）时，会生成结构化指令（如 JSON 格式），调用对应的函数工具完成任务，再将工具返回的结果整理成自然语言回答。搜索引擎返回的原始结果（如 10 条网页链接）经 RAG 处理后，转换为 “问题 - 答案” 形式的摘要，或按语义聚类（如按 “技术突破”“产业应用” 分类），提升用户获取信息的效率。核心特点：LLM 作为 “决策者”，决定何时调用、调用哪个工具，工具负责执行具体操作，两者形成 “决策 - 执行” 闭环。

2025-08-30 00:40:24 953

原创 14-day11大模型演进和提示工程

3.完全相同的输入，也可以有不同的结果。2.相似的表达，不一定有相似的回复。输入的文本，也称为prompt。<使用bert做sft训练>

2025-08-27 00:17:32 231

原创 16-day13强化学习和训练大模型

例如，在机器人导航任务中，智能体需要学习如何在复杂环境中移动，以最快速度到达目标位置，同时避免碰撞障碍物，这个过程中智能体要不断尝试不同的行动序列来找到最优路径。比如，根据历史数据预测股票价格走势，或者根据图像特征对图像中的物体进行分类，模型通过学习已知的输入输出对来对新的未知数据进行预测。监督学习：旨在学习一个从输入特征到输出标签的映射函数，通常用于预测、分类和回归等任务。强化学习：目标是让智能体通过与环境的交互，学习到一个最优策略，以最大化长期累积奖励。

2025-08-25 23:29:16 276

原创 15-day12LLM结构变化、位置编码和投机采样

归一化层位置归一化层类型

2025-08-21 18:43:06 193

原创 13-day10生成式任务

现在完全使用teacher-forcing的方法，放弃在训练时做解码来换取更高的训练速度。自回归语言模型也是teacher-forcing方式。Bert是encoder-only结构，自回归语言模型是decoder-only结构。在人工智能的各个领域都有，包括很多跨领域任务。来源于soft-attention的修改。图像领域：图像/视频生成, 图像补全等。输出Y没有预设的范围，受输入X影响。输入输出均为不定长的序列。语音领域：语音合成等。文本领域：机器翻译等。

2025-08-04 00:06:33 250

原创 12-day09序列标注任务

分词，词性标注，句法分析，命名实体识别等。评价指标看<evaluate.py>文件。序列标注准确率 ≠ 实体挖掘准确率。区别在于是否考虑类别样本数量的均衡。实体需要完整命中才能算正确。对于标注序列要进行解码。命名实体识别-十分类。

2025-07-28 00:20:36 466

原创 11-day08文本匹配

每组问答对中的问题，有多个时，为其中代表。一个（或多个相似的）问题与它对应的答案。问答对中，标准问之外的其他问题。人工编辑faq库的过程。2.faq库/知识库。很多问答对组成的集合。

2025-07-24 23:40:25 467

原创 10-day07文本分类

建立 K(K - 1)/2 个svm分类器，每个分类器负责K个类别中的两个类别，判断输入样本属于哪个类别。建立K个svm分类器，每个分类器负责划分输入样本属于K个类别中的“某一个类别，还是其他类别”对于一个待预测的样本，使用所有分类器进行分类，最后保留被预测词数最多的类别。1.少数支持向量决定了最终结果，对异常值不敏感。1.少数支持向量决定了最终结果，对异常值不敏感。假设要解决一个K分类问题，即有K个目标类别。one vs one方式。3.可以处理高维度数据。3.可以处理高维度数据。

2025-07-20 23:56:14 481

原创正则之re.finditer()

参考文献

2025-07-19 23:04:38 134

原创 pytorch之torch.gather()

参考文献1

2025-07-19 23:03:25 90

原创 pytorch之torch.where()

参考文献1

2025-07-19 23:01:52 86

原创 pytorch之scatter 与scatter_add_

文献参考1

2025-07-19 22:59:28 127

原创 8-day06预训练模型

【代码】8-day06预训练模型。

2025-07-11 22:31:41 306

原创 7-day06语言模型

通俗来讲语言模型评价一句话是否“合理”或“是人话”数学上讲P(今天天气不错) > P(今错不天天气)语言模型用于计算文本的成句概率。

2025-07-10 23:05:33 396

原创 6-day05 词向量应用

一、根据词与词之间关系的某种假设，制定训练目标二、设计模型，以词向量为输入三、随机初始化词向量，开始训练四、训练过程中词向量作为参数不断调整，获取一定的语义信息五、使用训练好的词向量做下游任务。

2025-07-04 01:42:10 305

原创 5-day04 TF·IDF关键词算法

import os"""tfidf的计算和使用"""#统计tf和idf值tf_dict = defaultdict(dict) #key:文档序号，value：dict，文档中每个词出现的频率idf_dict = defaultdict(set) #key:词， value：set，文档序号，最终用于计算每个词在多少篇文档中出现过#根据tf值和idf值计算tfidf#输入语料 list of string#先进行分词#根据tfidf字典，显示每个领域topK的关键词。

2025-07-01 23:42:02 227

原创 9-day06参数量和显存占用计算

1B模型参数对应多少G内存和参数的精度有关，如果是全精度训练（fp32），一个参数对应32比特，也就是4个字节，参数换算到显存的时候要乘4，也就是1B模型参数对应4G显存，如果是fp16或者bf16就是乘2，1B模型参数对应2G显存。1字节（Byte）通常由8个比特组成，FP32使用4字节（32位）表示一个浮点数，而FP16使用2字节（16位）表示一个浮点数。而"1M"的全称是"1 Million"，表示一百万。显存有多少G/M是说有多少G/M个字节（byte），1个字节=8比特（bit）。

2025-06-25 22:47:02 277

原创 4-深度学习网络层

也可以使用预训练的词向量来做初始化，此时也可以选择不训练Embedding层中的参数。输入的整数序列可以有重复，但取值不能超过Embedding矩阵的列数。Embedding矩阵是可训练的参数，一般会在模型构建时随机初始化。在nlp任务和各类特征工程中应用广泛。核心价值：将离散值转化为向量。

2025-06-23 23:12:16 193

原创 3-优化器原理

更多参考

2025-06-23 22:51:56 318

原创 2-激活函数与损失函数

目标：为模型添加非线性因素，使模型具有拟合非线性函数的能力。

2025-06-23 00:46:40 253

原创 1-梯度下降法与反向传播

1.根据输入x和模型当前权重，计算预测值y’2.根据y’和y使用loss函数计算loss。4.使用梯度和学习率，根据优化器调整模型权重。目标：找到合适的x值，使得f(x)最小。3.根据loss计算模型权重的梯度。函数f(x)的值受x影响。

2025-06-23 00:25:09 208

原创 NumPy之transpose() 和 swapaxes()

参考文献1

2025-06-22 23:44:19 104

原创 pytorch之view与reshape

参考文献1参考文献2

2025-06-22 23:25:13 153

原创 NumPy 中 np.dot 与 np.matmul 对比

2025-06-22 23:09:31 115

原创 all()函数和any()函数

【代码】all()函数和any()函数。

2025-06-22 22:47:20 189

原创 0-机器学习简介

机器学习本质：从已知数据中找规律，用来预测未知的样本。深度学习：是机器学习的一种方法。

2025-06-22 22:40:32 202

原创 Object结构

参考博客

2025-03-29 21:25:27 275

原创 ArrayList和LinkedList比较

2025-03-29 21:22:58 231

原创 JVM介绍

2025-03-29 21:16:44 408

原创缓存穿透、缓存击穿、缓存雪崩

描述：缓存没有数据，但数据库有，在高并发场景下，大量用户同时访问到缓存没有数据，都同时去查数据库，造成数据库压力过大。解决：设置value为null的缓存（key-null），并设置缓存过期时间不太长也不太短，比如说30秒。描述：缓存和数据库都没有查到数据，用户的请求都直接去查数据库了，在高并发场景下数据库的压力会过大。2.将缓存设置不同的过期时间，比如设置缓存的过期时间为随机。缓存中没有但数据库中有的数据，这时由于并发用户特别多，同时读缓存没读到数据，（2）缓存过期时间设置随机。

2025-03-23 00:50:41 203

原创 String、StringBuffer、StringBuilder的区别

执行速度由快到慢：StringBuilder > StringBuffer > String。（3）单线程操作字符串缓冲区下操作大量数据 StringBuilder。（2）多线程操作字符串缓冲区下操作大量数据 StringBuffer；（1）如果要操作少量的数据用 String；

2025-03-23 00:46:05 206

原创 Ceph集群部署步骤

博文参考：https://baijiahao.baidu.com/s?

2025-03-23 00:42:41 1272

原创 Ceph的yum源修改

Ceph]enabled=1gpgcheck=1enabled=1gpgcheck=1enabled=1gpgcheck=1。

2025-03-23 00:41:32 463

原创 yarn调度过程

client提交作业向ResourceManager请求资源分配，ResourceManager向某个NadeManager发出指令，RM总部先让某个NM区域经理提供一块地址container用作美容院的总部AM(ApplicationMaster)，然后美容院总部AM根据自身业务需要向RM总部申请更多的地址container开分店，最后美容院总部 AM调度和监控下属的美容院分店，分店也向总部汇报业务状态。各个NM区域经理响应RM总部和美容院总部AM的请求并管理各自的租房资源，把客户租赁比作作业提交，

2025-03-16 23:23:04 253

数据结构与算法，总结内容

Centos7安装jdk8

鼠标结构图例-治理鼠标按键不灵

rtk_wifi_driver_rtl8822ce-master.zip

材料力学统计分析小工具.rar

genymotion-3.2.0-linux_x64.bin

空空如也