- 博客(102)
- 资源 (4)
- 收藏
- 关注
原创 Blender模型导出
需要Blender到Unity的材质优化清单吗?包含节点简化、贴图压缩等5个关键步骤,能减少90%的材质问题。一、Blender导出设置。三、Unity导入与修复。二、导出为FBX格式。
2025-11-26 21:22:44
494
原创 17-day14RAG、MCP和Agent
当 LLM 遇到自身无法直接解决的问题(如实时数据查询、复杂计算、操作硬件等)时,会生成结构化指令(如 JSON 格式),调用对应的函数工具完成任务,再将工具返回的结果整理成自然语言回答。搜索引擎返回的原始结果(如 10 条网页链接)经 RAG 处理后,转换为 “问题 - 答案” 形式的摘要,或按语义聚类(如按 “技术突破”“产业应用” 分类),提升用户获取信息的效率。核心特点:LLM 作为 “决策者”,决定何时调用、调用哪个工具,工具负责执行具体操作,两者形成 “决策 - 执行” 闭环。
2025-08-30 00:40:24
953
原创 14-day11大模型演进和提示工程
3.完全相同的输入,也可以有不同的结果。2.相似的表达,不一定有相似的回复。输入的文本,也称为prompt。<使用bert做sft训练>
2025-08-27 00:17:32
231
原创 16-day13强化学习和训练大模型
例如,在机器人导航任务中,智能体需要学习如何在复杂环境中移动,以最快速度到达目标位置,同时避免碰撞障碍物,这个过程中智能体要不断尝试不同的行动序列来找到最优路径。比如,根据历史数据预测股票价格走势,或者根据图像特征对图像中的物体进行分类,模型通过学习已知的输入输出对来对新的未知数据进行预测。监督学习:旨在学习一个从输入特征到输出标签的映射函数,通常用于预测、分类和回归等任务。强化学习:目标是让智能体通过与环境的交互,学习到一个最优策略,以最大化长期累积奖励。
2025-08-25 23:29:16
276
原创 13-day10生成式任务
现在完全使用teacher-forcing的方法,放弃在训练时做解码来换取更高的训练速度。自回归语言模型也是teacher-forcing方式。Bert是encoder-only结构,自回归语言模型是decoder-only结构。在人工智能的各个领域都有,包括很多跨领域任务。来源于soft-attention的修改。图像领域:图像/视频生成, 图像补全等。输出Y没有预设的范围,受输入X影响。输入输出均为不定长的序列。语音领域:语音合成等。文本领域:机器翻译等。
2025-08-04 00:06:33
250
原创 12-day09序列标注任务
分词,词性标注,句法分析,命名实体识别等。评价指标看<evaluate.py>文件。序列标注准确率 ≠ 实体挖掘准确率。区别在于是否考虑类别样本数量的均衡。实体需要完整命中才能算正确。对于标注序列要进行解码。命名实体识别-十分类。
2025-07-28 00:20:36
466
原创 11-day08文本匹配
每组问答对中的问题,有多个时,为其中代表。一个(或多个相似的)问题与它对应的答案。问答对中,标准问之外的其他问题。人工编辑faq库的过程。2.faq库/知识库。很多问答对组成的集合。
2025-07-24 23:40:25
467
原创 10-day07文本分类
建立 K(K - 1)/2 个svm分类器,每个分类器负责K个类别中的两个类别,判断输入样本属于哪个类别。建立K个svm分类器,每个分类器负责划分输入样本属于K个类别中的“某一个类别,还是其他类别”对于一个待预测的样本,使用所有分类器进行分类,最后保留被预测词数最多的类别。1.少数支持向量决定了最终结果,对异常值不敏感。1.少数支持向量决定了最终结果,对异常值不敏感。假设要解决一个K分类问题,即有K个目标类别。one vs one方式。3.可以处理高维度数据。3.可以处理高维度数据。
2025-07-20 23:56:14
481
原创 7-day06语言模型
通俗来讲语言模型评价一句话是否“合理”或“是人话”数学上讲P(今天天气不错) > P(今错不天天气)语言模型用于计算文本的成句概率。
2025-07-10 23:05:33
396
原创 6-day05 词向量应用
一、根据词与词之间关系的某种假设,制定训练目标二、设计模型,以词向量为输入三、随机初始化词向量,开始训练四、训练过程中词向量作为参数不断调整,获取一定的语义信息五、使用训练好的词向量做下游任务。
2025-07-04 01:42:10
305
原创 5-day04 TF·IDF关键词算法
import os"""tfidf的计算和使用"""#统计tf和idf值tf_dict = defaultdict(dict) #key:文档序号,value:dict,文档中每个词出现的频率idf_dict = defaultdict(set) #key:词, value:set,文档序号,最终用于计算每个词在多少篇文档中出现过#根据tf值和idf值计算tfidf#输入语料 list of string#先进行分词#根据tfidf字典,显示每个领域topK的关键词。
2025-07-01 23:42:02
227
原创 9-day06参数量和显存占用计算
1B模型参数对应多少G内存和参数的精度有关,如果是全精度训练(fp32),一个参数对应32比特,也就是4个字节,参数换算到显存的时候要乘4,也就是1B模型参数对应4G显存,如果是fp16或者bf16就是乘2,1B模型参数对应2G显存。1字节(Byte)通常由8个比特组成,FP32使用4字节(32位)表示一个浮点数,而FP16使用2字节(16位)表示一个浮点数。而"1M"的全称是"1 Million",表示一百万。显存有多少G/M是说有多少G/M个字节(byte),1个字节=8比特(bit)。
2025-06-25 22:47:02
277
原创 4-深度学习网络层
也可以使用预训练的词向量来做初始化,此时也可以选择不训练Embedding层中的参数。输入的整数序列可以有重复,但取值不能超过Embedding矩阵的列数。Embedding矩阵是可训练的参数,一般会在模型构建时随机初始化。在nlp任务和各类特征工程中应用广泛。核心价值:将离散值转化为向量。
2025-06-23 23:12:16
193
原创 1-梯度下降法与反向传播
1.根据输入x和模型当前权重,计算预测值y’2.根据y’和y使用loss函数计算loss。4.使用梯度和学习率,根据优化器调整模型权重。目标:找到合适的x值,使得f(x)最小。3.根据loss计算模型权重的梯度。函数f(x)的值受x影响。
2025-06-23 00:25:09
208
原创 缓存穿透、缓存击穿、缓存雪崩
描述: 缓存没有数据,但数据库有,在高并发场景下,大量用户同时访问到缓存没有数据,都同时去查数据库,造成数据库压力过大。解决:设置value为null的缓存(key-null),并设置缓存过期时间不太长也不太短,比如说30秒。描述:缓存和数据库都没有查到数据,用户的请求都直接去查数据库了,在高并发场景下数据库的压力会过大。2.将缓存设置不同的过期时间,比如设置缓存的过期时间为随机。缓存中没有但数据库中有的数据,这时由于并发用户特别多,同时读缓存没读到数据,(2)缓存过期时间设置随机。
2025-03-23 00:50:41
203
原创 String、StringBuffer、StringBuilder的区别
执行速度由快到慢:StringBuilder > StringBuffer > String。(3)单线程操作字符串缓冲区下操作大量数据 StringBuilder。(2)多线程操作字符串缓冲区下操作大量数据 StringBuffer;(1)如果要操作少量的数据用 String;
2025-03-23 00:46:05
206
原创 Ceph的yum源修改
Ceph]enabled=1gpgcheck=1enabled=1gpgcheck=1enabled=1gpgcheck=1。
2025-03-23 00:41:32
463
原创 yarn调度过程
client提交作业向ResourceManager请求资源分配,ResourceManager向某个NadeManager发出指令,RM总部先让某个NM区域经理提供一块地址container用作美容院的总部AM(ApplicationMaster),然后美容院总部AM根据自身业务需要向RM总部申请更多的地址container开分店,最后美容院总部 AM调度和监控下属的美容院分店,分店也向总部汇报业务状态。各个NM区域经理响应RM总部和美容院总部AM的请求并管理各自的租房资源,把客户租赁比作作业提交,
2025-03-16 23:23:04
253
原创 9_Spark安装
下载spark压缩包通过百度网盘分享的文件:spark-2.0.2-bin-hadoop2.6.tgz链接:https://pan.baidu.com/s/1lXPExVxxdkdx1QjiLlaorw提取码:yc69通过百度网盘分享的文件:scala-2.11.8.tgz链接:https://pan.baidu.com/s/1YR4enZqTgE-Yy3Jb456JIQ提取码:yc69。
2025-03-06 19:56:55
533
原创 8_安装Thrift
下载thrift通过网盘分享的文件:thrift-0.9.3.tar.gz链接: https://pan.baidu.com/s/1dQ3QJu5N2exSKtHlSS7aWQ 提取码: tc4c解压thrift到src文件夹下。
2025-02-26 14:34:12
254
原创 3_Hadoop集群的格式化、启动、关闭和状态
4、检查集群是否正常:(主节点执行):hadoop dfsadmin -report。格式化hadoop集群:hadoop namenode -format。2、启动集群:sbin/start-all.sh。6、关闭集群:sbin/stop-all.sh。1、在哪个节点格式化,哪个节点就是主节点。3、检查集群是否正常:jps。
2025-02-24 17:20:04
291
原创 2_修改hostname和互信
把公钥给authorized_keys,记录所有节点的公钥,以达到免密登录(互信)分发authorized_keys公钥文件到其他节点中,使免密登录(互信)生效。1.克隆master虚拟机出slave1和slave2两台虚拟机。2.开机slave1和slave2。
2025-02-24 17:07:55
307
原创 1_安装JDK和Hadoop
链接:https://pan.baidu.com/s/1VjhdpfyqdC7ivEBIjTn8tA。通过百度网盘分享的文件:jdk-8u172-linux-x64.tar.gz。在Hadoop解压文件夹内。
2025-02-24 16:06:00
613
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅