大明者省-优快云博客

原创 yolov8的yaml文件解释

nc: 1 # number of classesscales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n' # [depth, width, max_channels] n: [0.33, 0.25, 1024] # YOLOv8n summary: 129 layers, 3157200 parameter

2025-04-01 20:45:08 837

原创夜间红外图像红色和蓝色区域的含义及背后的技术原理

直观反映物体热辐射差异，结合红外成像与图像处理技术，广泛应用于军事、医学、工业等领域。红色预警潜在热源目标，蓝色标识低温背景，这种可视化方法显著提高了夜间观测和目标检测的效率。由于红外成像基于物体热辐射强度，温度越高的物体辐射的红外线越强，因此在图像中呈现为红色。低温区域的红外辐射较弱，图像中显示为冷色调的蓝色。夜间红外图像中，红色和蓝色通过。

2025-03-29 07:36:44 939

原创红外小目标检测综述

定义：红外小目标检测是从红外图像中识别微小（通常像素占比低）、信噪比低的目标，依赖物体热辐射成像，具有全天候工作能力。特点：目标尺寸小、缺乏纹理/形状信息，易受噪声和复杂背景干扰。应用场景军事：目标侦察、战场态势感知、精确制导。安防：夜间监控、入侵检测、无人机巡逻。航空航天：卫星遥感、空间目标监测、自然灾害预警。

2025-03-29 07:26:23 435

原创多头潜在注意力（MLA）机制

MLA机制通过计算效率革命与多模态统一表征，为AGI系统的实现提供了新范式。其价值不仅在于技术指标的提升，更在于揭示了注意力本质的再思考——从显式交互到潜在关联的跨越，标志着深度学习进入“认知压缩”的新阶段。随着DeepSeek等团队持续探索，MLA有望在2027年前后支撑起首个具备因果推理能力的AGI原型系统。

2025-03-28 07:00:42 770

原创 deepseek 技术的前生今世：从开源先锋到AGI探索者

DeepSeek的崛起证明，开源协作与效率创新可成为后发者超越算力霸权的关键。其技术路径不仅降低了AGI研发门槛，更推动了中国在全球AI生态中的话语权重构。未来，如何在“性能巅峰”与“技术普惠”间找到平衡，将决定DeepSeek能否真正打开AGI时代的大门。

2025-03-28 06:53:50 967

原创 MOE技术原理

的思想，将复杂任务拆解为子任务并由专家处理，实现了计算效率与模型容量的平衡。其架构灵活性使其成为大规模AI模型（如GPT-4）的核心技术，未来将在降低训练门槛、加速推理、拓展应用场景（如边缘计算）中发挥关键作用。提升模型效率的深度学习架构。MOE（Mixture of Experts，混合专家模型）是一种通过。# 根据门控权重加权求和。# 定义混合专家模型。# 生成随机输入数据。

2025-03-27 06:35:10 642

原创独热编码（One-Hot Encoding）：理论基础与实践应用

设分类特征有 n 个类别，每个类别对应一个基向量 \(\mathbf{e}_i \in \mathbb{R}^n\)，其中第 i 个元素为 1，其余为 0。特征值 \(c_j\) 的独热编码为 \(\mathbf{e}_j\)。

2025-03-26 10:25:30 298

原创 Xshell远程登录腾讯云高性能应用服务

1.图1登录https://cloud.tencent.com/product/hai。图1 登录https://cloud.tencent.com/product/hai。输入如图7所示，不知道用户名和密码的进行重置密码获得。打开Xshell，点击左上文件，新建，如图5.图5 打开Xshell，点击左上文件，新建。2.图2 选择新建获1元体验。主机是自己的公网IP，如图6。3.稍等5分钟左右出现图3。图6 主机是自己的公网IP。图2 选择新建获1元体验。图7 输入用户名和密码。5.Xshell填写。

2025-03-25 08:31:10 367

原创数值计算精度体系技术解析

1. FP64（双精度浮点数）2. FP32（单精度浮点数）3. FP16（半精度浮点数）4. FP8（8位浮点数）1. INT16（16位整数）2. INT8（8位整数）3. INT4（4位整数）

2025-03-24 08:07:29 1289

原创注意力机制技术分类与深度学习架构演进

动态注意力机制通过可学习模式选择（如Routing Transformer）优化稀疏性，自适应注意力跨度（如AdaSpan）根据输入动态调整计算范围。在文本生成任务中，点积注意力能够捕捉长程依赖关系，GPT-4等超大型模型通过深度堆叠自注意力层实现语义层级抽象。采用多粒度信息聚合，在文档分类任务中，先通过词级注意力筛选关键词，再通过句级注意力汇总段落信息。在语音识别中，Conformer模型结合卷积与注意力机制，通过受限自注意力捕捉声纹特征。在视频理解任务中，时空注意力分离建模空间对象关系与时间演化模式。

2025-03-24 07:54:48 425

原创大模型技术分类与技术演进研究

大模型技术体系正沿着架构创新、训练范式演进、应用场景深化三条主线快速发展。未来随着异构计算架构的成熟和神经科学启发的机制引入，具备更强泛化能力、更低能耗特征的新一代智能系统的诞生。这种技术演进不仅推动AI从专用模型向通用智能迈进，更将重塑数字经济时代的生产力范式。

2025-03-24 07:50:36 520

原创基于腾讯云大模型知识引擎×DeepSeek的高等职业学校单独招生二级学院考前咨询系统

本地部署需考虑硬件维护、访问效率等因素，同时高等职业学校单独招生每个二级学院考生咨询内容不同，若每个二级学院都进行本地部署将增加学校教育资金支出，因此借助腾讯云大模型知识引擎×DeepSeek有利于提高资金利用率。如图7所示，提示词，输入单招考试、考生咨询，点击右侧的一键优化可自动优化。通过大模型知识引擎×DeepSeek搭建高等职业学校单独招生二级学院考前咨询专有问答，使得专业老师能够更好的服务考试学生，有利于二级学院能够更好的进行考试宣传，招来优秀学子！点击图8的导入，出现图9、图10..

2025-03-23 20:24:04 835

原创基于腾讯云HAI的高效部署与优化：本地API运行DeepSeek-R1:14B模型

点击保存后，右下角出现deepseek-r1:14b，即选择了deepseek-r1:14b版本，对话框输入查询内容即可，如图19所示。进行deepseek-r1:14b安装需输入 ollama run deepseek-r1:14b 然后安装时间大概7分钟左右。安装好后，查询再次输入ollama list，如图10所示，此时出现了deepseek-r1:14b说明安装成功。新建购买或者1元体验deepseek ，大约等待5分钟左右，会出现系统，如图7所示，东京代表。购买后注意不使用的时候云上要关机。

2025-03-23 20:23:06 2190 3

原创神经网络前向微分和后向微分区别

较少用于神经网络训练，因为网络参数通常数量庞大（输入维度高），多次前向计算代价过高。若输出是标量（如神经网络的损失函数），仅需一次反向传播即可获得全部参数的梯度。：每个中间变量的导数随值一起计算，例如，对输入变量 �x 的导数逐层传递。反向过程：从输出层开始，按链式法则反向计算梯度（输出层 → 输入层）。：沿计算图的正向顺序（输入层 → 输出层），同时计算函数值和导数。：输入维度低（如 �n 小）、输出维度高（如 �m 大）。前向过程：计算所有中间变量的值（输入层 → 输出层）。，是神经网络训练的基石。

2025-03-02 10:37:01 908

原创常用CPU架构

高性能多核设计：Intel的酷睿i9-13900K（24核32线程）、AMD的Ryzen 9 7950X（16核32线程）均支持超线程技术。制程演进：从Intel 14nm（Skylake）到Intel 7（10nm Enhanced SuperFin，Alder Lake）。高性能计算：x86（Intel至强）或ARM（Ampere Altra Max）。嵌入式设备：RISC-V（GD32V系列）或Cortex-M（STM32）。

2025-02-28 18:02:24 449

原创 GPU架构分类

性能：具有128个流处理器，带宽高达86GB/s。性能：Volta GV100具有5120个CUDA核心和900GB/s的带宽，加上640个张量核心，AI计算能力达到112 TFLOPS，比Pascal架构提高了近3倍。性能：Pascal GP100具有3840个CUDA核心和732GB/s的显存带宽，但功耗只有300W，比Maxwell架构提高50%以上。性能：Turing TU102具有4608个CUDA核心、576个张量核心和72个RT核心，支持GPU光线追踪，代表了图形技术的新突破。

2025-02-28 17:21:50 1180

原创卷积神经网络梯度下降方向与参数更新方向的一致性论述

基于函数下降最快方向：由于梯度方向是函数上升最快的方向，那么负梯度方向就是函数下降最快的方向。我们的目标是最小化损失函数，所以沿着负梯度方向更新参数，可以使损失函数在每次迭代中尽可能快地减小，从而更快地找到损失函数的最小值或接近最小值的点，实现模型的优化.它的基本思想是通过迭代的方式来更新模型的参数，使得损失函数的值逐步减小，最终收敛到一个局部最小值或全局最小值。在每次迭代中，算法会计算损失函数关于当前参数的梯度，然后根据梯度来调整参数的值，沿着损失函数下降最快的方向更新参数，从而加快模型的收敛速度。

2025-02-28 15:48:37 376

原创虚拟仿真无线路由器5G和2.4G发射信号辐射对比（虚拟仿真得出最小安全距离，与国际标准要求一致）

5 GHz频段，频率范围：5.15 GHz 至 5.825 GHz（具体范围因地区不同有所差异），信道宽度：20 MHz、40 MHz、80 MHz，甚至160 MHz（Wi-Fi 6及以上标准），特点：干扰较少，传输速率高，但覆盖范围和穿透力较弱。公众关切问题：公众对 5G 和 2.4G 信号的辐射水平存在关注，对比两者在相关方面的情况，有助于更好地研究和评估它们对健康和环境的影响，以科学的态度回应公众疑虑，减少不必要的担忧和误解。axes[1, i].set_xlabel('距离 (米)')

2025-02-26 22:41:26 692

原创基于MNIST的数据蒸馏与知识蒸馏对比分析

知识蒸馏：Knowledge Distillation是一种模型压缩和迁移学习技术，它通过将一个大型的预训练模型（教师模型）的知识迁移到一个小型的模型（学生模型）中。教师模型通常具有较高的准确率，但可能计算成本高，而学生模型则更轻量级、计算速度更快。数据蒸馏：Data Distillation则是从原始数据集中生成一个更小、更具代表性的合成数据集。这个合成数据集可以用于训练模型，减少数据存储和计算资源的需求。

2025-02-26 20:20:57 1056

原创 A股收盘值和美股标准普尔500指数收盘价进行A股收盘预测

df_combined = pd.merge_asof(df_index, index_us_stock_sina_df[['close']].rename(columns={'close': '美股标准普尔500指数收盘价'}),axes[1].fill_between(upper_bound.index, lower_bound, upper_bound, color='gray', alpha=0.2, label='95% 置信区间')axes[0].set_title('滚动误差曲线')

2025-02-22 22:04:18 940

原创中国宏观杠杆率+居民消费价格指数+美股股票指数数据+A 股新闻情绪指数+美联储利率决议+上证指数历史数据进行未来3天A股大盘预测(结果含ARIMA 模型阶数、MAE、RMSE等指标)

在金融市场中，准确预测大盘走势对于投资者和决策者而言至关重要。为此，我们构建了一个基于多维度数据的A股大盘预测模型，该模型整合了中国宏观杠杆率、居民消费价格指数（CPI）、美股股票指数数据、A股新闻情绪指数、美联储利率决议以及上证指数历史数据。通过采用先进的ARIMA时间序列分析方法，我们成功地对未来的3天A股大盘走势进行了预测，并提供了详细的模型评价指标。

2025-02-22 21:10:26 1460

原创基于Python语言的中国宏观杠杆率+居民消费价格指数+上证指数历史数据进行未来3天股票预测.

只作研究娱乐，不作投资依据！

2025-02-19 21:26:19 1182

原创 Winograd 算法原理推导和python程序

Winograd 算法是一种用于高效计算卷积的算法，其核心思想是通过减少乘法运算的次数来提高卷积计算的效率。在传统的卷积计算中，乘法运算的开销较大，而 Winograd 算法通过巧妙的变换，将卷积运算转化为在变换域中的矩阵乘法，从而减少乘法的数量，虽然会引入一些额外的加法和变换操作，但整体上在计算效率上有显著提升。print(winograd_1d(x, g)) # 输出应为 [-2, -2]构造输入矩阵和核矩阵的变换形式。# 变换后的输入和核。：对卷积核进行类似变换。：在变换域进行乘法。

2025-02-19 19:08:49 555

原创一种简单的方法计算大模型使用的GPU

推理时，需要一次性加载700亿参数，GPU需要容量空间字节为约140G，这也是140G显存，由于训练比推理使用的显存多，约是2-3倍，训练最少280G。假设某大模型XXX--70B,其中XXX为大模型的名称，70B为模型大小，B指的是10亿，即该模型为700亿参数。在保证效率和精度的情况下，大模型训练一般使用半精度浮点数FP16（一共16位），小数占3-4位。计算机1G容量（无论显存和内存）约等于1024(M兆字节)*1024(K千字节)*1024(B。由于16位占2个字节，则700*2=1400亿字节。

2025-02-16 10:17:47 407