自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(102)
  • 资源 (4)
  • 收藏
  • 关注

原创 Blender模型导出

需要Blender到Unity的材质优化清单吗?包含节点简化、贴图压缩等5个关键步骤,能减少90%的材质问题。一、Blender导出设置。三、Unity导入与修复。二、导出为FBX格式。

2025-11-26 21:22:44 494

原创 17-day14RAG、MCP和Agent

当 LLM 遇到自身无法直接解决的问题(如实时数据查询、复杂计算、操作硬件等)时,会生成结构化指令(如 JSON 格式),调用对应的函数工具完成任务,再将工具返回的结果整理成自然语言回答。搜索引擎返回的原始结果(如 10 条网页链接)经 RAG 处理后,转换为 “问题 - 答案” 形式的摘要,或按语义聚类(如按 “技术突破”“产业应用” 分类),提升用户获取信息的效率。核心特点:LLM 作为 “决策者”,决定何时调用、调用哪个工具,工具负责执行具体操作,两者形成 “决策 - 执行” 闭环。

2025-08-30 00:40:24 953

原创 14-day11大模型演进和提示工程

3.完全相同的输入,也可以有不同的结果。2.相似的表达,不一定有相似的回复。输入的文本,也称为prompt。<使用bert做sft训练>

2025-08-27 00:17:32 231

原创 16-day13强化学习和训练大模型

例如,在机器人导航任务中,智能体需要学习如何在复杂环境中移动,以最快速度到达目标位置,同时避免碰撞障碍物,这个过程中智能体要不断尝试不同的行动序列来找到最优路径。比如,根据历史数据预测股票价格走势,或者根据图像特征对图像中的物体进行分类,模型通过学习已知的输入输出对来对新的未知数据进行预测。监督学习:旨在学习一个从输入特征到输出标签的映射函数,通常用于预测、分类和回归等任务。强化学习:目标是让智能体通过与环境的交互,学习到一个最优策略,以最大化长期累积奖励。

2025-08-25 23:29:16 276

原创 15-day12LLM结构变化、位置编码和投机采样

归一化层位置归一化层类型

2025-08-21 18:43:06 193

原创 13-day10生成式任务

现在完全使用teacher-forcing的方法,放弃在训练时做解码来换取更高的训练速度。自回归语言模型也是teacher-forcing方式。Bert是encoder-only结构,自回归语言模型是decoder-only结构。在人工智能的各个领域都有,包括很多跨领域任务。来源于soft-attention的修改。图像领域:图像/视频生成, 图像补全等。输出Y没有预设的范围,受输入X影响。输入输出均为不定长的序列。语音领域:语音合成等。文本领域:机器翻译等。

2025-08-04 00:06:33 250

原创 12-day09序列标注任务

分词,词性标注,句法分析,命名实体识别等。评价指标看<evaluate.py>文件。序列标注准确率 ≠ 实体挖掘准确率。区别在于是否考虑类别样本数量的均衡。实体需要完整命中才能算正确。对于标注序列要进行解码。命名实体识别-十分类。

2025-07-28 00:20:36 466

原创 11-day08文本匹配

每组问答对中的问题,有多个时,为其中代表。一个(或多个相似的)问题与它对应的答案。问答对中,标准问之外的其他问题。人工编辑faq库的过程。2.faq库/知识库。很多问答对组成的集合。

2025-07-24 23:40:25 467

原创 10-day07文本分类

建立 K(K - 1)/2 个svm分类器,每个分类器负责K个类别中的两个类别,判断输入样本属于哪个类别。建立K个svm分类器,每个分类器负责划分输入样本属于K个类别中的“某一个类别,还是其他类别”对于一个待预测的样本,使用所有分类器进行分类,最后保留被预测词数最多的类别。1.少数支持向量决定了最终结果,对异常值不敏感。1.少数支持向量决定了最终结果,对异常值不敏感。假设要解决一个K分类问题,即有K个目标类别。one vs one方式。3.可以处理高维度数据。3.可以处理高维度数据。

2025-07-20 23:56:14 481

原创 正则之re.finditer()

参考文献

2025-07-19 23:04:38 134

原创 pytorch之torch.gather()

参考文献1

2025-07-19 23:03:25 90

原创 pytorch之torch.where()

参考文献1

2025-07-19 23:01:52 86

原创 pytorch之scatter 与scatter_add_

文献参考1

2025-07-19 22:59:28 127

原创 8-day06预训练模型

【代码】8-day06预训练模型。

2025-07-11 22:31:41 306

原创 7-day06语言模型

通俗来讲语言模型评价一句话是否“合理”或“是人话”数学上讲P(今天天气不错) > P(今错不天天气)语言模型用于计算文本的成句概率。

2025-07-10 23:05:33 396

原创 6-day05 词向量应用

一、根据词与词之间关系的某种假设,制定训练目标二、设计模型,以词向量为输入三、随机初始化词向量,开始训练四、训练过程中词向量作为参数不断调整,获取一定的语义信息五、使用训练好的词向量做下游任务。

2025-07-04 01:42:10 305

原创 5-day04 TF·IDF关键词算法

import os"""tfidf的计算和使用"""#统计tf和idf值tf_dict = defaultdict(dict) #key:文档序号,value:dict,文档中每个词出现的频率idf_dict = defaultdict(set) #key:词, value:set,文档序号,最终用于计算每个词在多少篇文档中出现过#根据tf值和idf值计算tfidf#输入语料 list of string#先进行分词#根据tfidf字典,显示每个领域topK的关键词。

2025-07-01 23:42:02 227

原创 9-day06参数量和显存占用计算

1B模型参数对应多少G内存和参数的精度有关,如果是全精度训练(fp32),一个参数对应32比特,也就是4个字节,参数换算到显存的时候要乘4,也就是1B模型参数对应4G显存,如果是fp16或者bf16就是乘2,1B模型参数对应2G显存。1字节(Byte)通常由8个比特组成,FP32使用4字节(32位)表示一个浮点数,而FP16使用2字节(16位)表示一个浮点数。而"1M"的全称是"1 Million",表示一百万。显存有多少G/M是说有多少G/M个字节(byte),1个字节=8比特(bit)。

2025-06-25 22:47:02 277

原创 4-深度学习网络层

也可以使用预训练的词向量来做初始化,此时也可以选择不训练Embedding层中的参数。输入的整数序列可以有重复,但取值不能超过Embedding矩阵的列数。Embedding矩阵是可训练的参数,一般会在模型构建时随机初始化。在nlp任务和各类特征工程中应用广泛。核心价值:将离散值转化为向量。

2025-06-23 23:12:16 193

原创 3-优化器原理

更多参考

2025-06-23 22:51:56 318

原创 2-激活函数与损失函数

目标:为模型添加非线性因素,使模型具有拟合非线性函数的能力。

2025-06-23 00:46:40 253

原创 1-梯度下降法与反向传播

1.根据输入x和模型当前权重,计算预测值y’2.根据y’和y使用loss函数计算loss。4.使用梯度和学习率,根据优化器调整模型权重。目标:找到合适的x值,使得f(x)最小。3.根据loss计算模型权重的梯度。函数f(x)的值受x影响。

2025-06-23 00:25:09 208

原创 NumPy之transpose() 和 swapaxes()

参考文献1

2025-06-22 23:44:19 104

原创 pytorch之view与reshape

参考文献1参考文献2

2025-06-22 23:25:13 153

原创 NumPy 中 np.dot 与 np.matmul 对比

2025-06-22 23:09:31 115

原创 all()函数和any()函数

【代码】all()函数和any()函数。

2025-06-22 22:47:20 189

原创 0-机器学习简介

机器学习本质:从已知数据中找规律,用来预测未知的样本。深度学习:是机器学习的一种方法。

2025-06-22 22:40:32 202

原创 Object结构

参考博客

2025-03-29 21:25:27 275

原创 ArrayList和LinkedList比较

2025-03-29 21:22:58 231

原创 JVM介绍

2025-03-29 21:16:44 408

原创 缓存穿透、缓存击穿、缓存雪崩

描述: 缓存没有数据,但数据库有,在高并发场景下,大量用户同时访问到缓存没有数据,都同时去查数据库,造成数据库压力过大。解决:设置value为null的缓存(key-null),并设置缓存过期时间不太长也不太短,比如说30秒。描述:缓存和数据库都没有查到数据,用户的请求都直接去查数据库了,在高并发场景下数据库的压力会过大。2.将缓存设置不同的过期时间,比如设置缓存的过期时间为随机。缓存中没有但数据库中有的数据,这时由于并发用户特别多,同时读缓存没读到数据,(2)缓存过期时间设置随机。

2025-03-23 00:50:41 203

原创 String、StringBuffer、StringBuilder的区别

执行速度由快到慢:StringBuilder > StringBuffer > String。(3)单线程操作字符串缓冲区下操作大量数据 StringBuilder。(2)多线程操作字符串缓冲区下操作大量数据 StringBuffer;(1)如果要操作少量的数据用 String;

2025-03-23 00:46:05 206

原创 Ceph集群部署步骤

博文参考:https://baijiahao.baidu.com/s?

2025-03-23 00:42:41 1272

原创 Ceph的yum源修改

Ceph]enabled=1gpgcheck=1enabled=1gpgcheck=1enabled=1gpgcheck=1。

2025-03-23 00:41:32 463

原创 yarn调度过程

client提交作业向ResourceManager请求资源分配,ResourceManager向某个NadeManager发出指令,RM总部先让某个NM区域经理提供一块地址container用作美容院的总部AM(ApplicationMaster),然后美容院总部AM根据自身业务需要向RM总部申请更多的地址container开分店,最后美容院总部 AM调度和监控下属的美容院分店,分店也向总部汇报业务状态。各个NM区域经理响应RM总部和美容院总部AM的请求并管理各自的租房资源,把客户租赁比作作业提交,

2025-03-16 23:23:04 253

原创 9_Spark安装

下载spark压缩包通过百度网盘分享的文件:spark-2.0.2-bin-hadoop2.6.tgz链接:https://pan.baidu.com/s/1lXPExVxxdkdx1QjiLlaorw提取码:yc69通过百度网盘分享的文件:scala-2.11.8.tgz链接:https://pan.baidu.com/s/1YR4enZqTgE-Yy3Jb456JIQ提取码:yc69。

2025-03-06 19:56:55 533

原创 8_安装Thrift

下载thrift通过网盘分享的文件:thrift-0.9.3.tar.gz链接: https://pan.baidu.com/s/1dQ3QJu5N2exSKtHlSS7aWQ 提取码: tc4c解压thrift到src文件夹下。

2025-02-26 14:34:12 254

原创 3_Hadoop集群的格式化、启动、关闭和状态

4、检查集群是否正常:(主节点执行):hadoop dfsadmin -report。格式化hadoop集群:hadoop namenode -format。2、启动集群:sbin/start-all.sh。6、关闭集群:sbin/stop-all.sh。1、在哪个节点格式化,哪个节点就是主节点。3、检查集群是否正常:jps。

2025-02-24 17:20:04 291

原创 2_修改hostname和互信

把公钥给authorized_keys,记录所有节点的公钥,以达到免密登录(互信)分发authorized_keys公钥文件到其他节点中,使免密登录(互信)生效。1.克隆master虚拟机出slave1和slave2两台虚拟机。2.开机slave1和slave2。

2025-02-24 17:07:55 307

原创 1_安装JDK和Hadoop

链接:https://pan.baidu.com/s/1VjhdpfyqdC7ivEBIjTn8tA。通过百度网盘分享的文件:jdk-8u172-linux-x64.tar.gz。在Hadoop解压文件夹内。

2025-02-24 16:06:00 613

数据结构与算法,总结内容

数据结构与算法,总结内容

2025-03-29

Centos7安装jdk8

Centos7安装jdk8

2025-01-21

鼠标结构图例-治理鼠标按键不灵

鼠标结构图例-治理鼠标按键不灵

2022-07-26

rtk_wifi_driver_rtl8822ce-master.zip

型号rtk_wifi_driver_rtl8822ce,相近型号亦可使用。

2021-03-09

材料力学统计分析小工具.rar

材料力学统计分析小工具1

2021-03-09

genymotion-3.2.0-linux_x64.bin

Android模拟器genymotion及其4.4设备

2021-03-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除