- 博客(35)
- 问答 (25)
- 收藏
- 关注
原创 yolov8的yaml文件解释
nc: 1 # number of classesscales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n' # [depth, width, max_channels] n: [0.33, 0.25, 1024] # YOLOv8n summary: 129 layers, 3157200 parameter
2025-04-01 20:45:08
837
原创 夜间红外图像红色和蓝色区域的含义及背后的技术原理
直观反映物体热辐射差异,结合红外成像与图像处理技术,广泛应用于军事、医学、工业等领域。红色预警潜在热源目标,蓝色标识低温背景,这种可视化方法显著提高了夜间观测和目标检测的效率。由于红外成像基于物体热辐射强度,温度越高的物体辐射的红外线越强,因此在图像中呈现为红色。低温区域的红外辐射较弱,图像中显示为冷色调的蓝色。夜间红外图像中,红色和蓝色通过。
2025-03-29 07:36:44
939
原创 红外小目标检测综述
定义:红外小目标检测是从红外图像中识别微小(通常像素占比低)、信噪比低的目标,依赖物体热辐射成像,具有全天候工作能力。特点:目标尺寸小、缺乏纹理/形状信息,易受噪声和复杂背景干扰。应用场景军事:目标侦察、战场态势感知、精确制导。安防:夜间监控、入侵检测、无人机巡逻。航空航天:卫星遥感、空间目标监测、自然灾害预警。
2025-03-29 07:26:23
435
原创 多头潜在注意力(MLA)机制
MLA机制通过计算效率革命与多模态统一表征,为AGI系统的实现提供了新范式。其价值不仅在于技术指标的提升,更在于揭示了注意力本质的再思考——从显式交互到潜在关联的跨越,标志着深度学习进入“认知压缩”的新阶段。随着DeepSeek等团队持续探索,MLA有望在2027年前后支撑起首个具备因果推理能力的AGI原型系统。
2025-03-28 07:00:42
770
原创 deepseek 技术的前生今世:从开源先锋到AGI探索者
DeepSeek的崛起证明,开源协作与效率创新可成为后发者超越算力霸权的关键。其技术路径不仅降低了AGI研发门槛,更推动了中国在全球AI生态中的话语权重构。未来,如何在“性能巅峰”与“技术普惠”间找到平衡,将决定DeepSeek能否真正打开AGI时代的大门。
2025-03-28 06:53:50
967
原创 MOE技术原理
的思想,将复杂任务拆解为子任务并由专家处理,实现了计算效率与模型容量的平衡。其架构灵活性使其成为大规模AI模型(如GPT-4)的核心技术,未来将在降低训练门槛、加速推理、拓展应用场景(如边缘计算)中发挥关键作用。提升模型效率的深度学习架构。MOE(Mixture of Experts,混合专家模型)是一种通过。# 根据门控权重加权求和。# 定义混合专家模型。# 生成随机输入数据。
2025-03-27 06:35:10
642
原创 独热编码(One-Hot Encoding):理论基础与实践应用
设分类特征有 n 个类别,每个类别对应一个基向量 \(\mathbf{e}_i \in \mathbb{R}^n\),其中第 i 个元素为 1,其余为 0。特征值 \(c_j\) 的独热编码为 \(\mathbf{e}_j\)。
2025-03-26 10:25:30
298
原创 Xshell远程登录腾讯云高性能应用服务
1.图1登录https://cloud.tencent.com/product/hai。图1 登录https://cloud.tencent.com/product/hai。输入如图7所示,不知道用户名和密码的进行重置密码获得。打开Xshell,点击左上文件,新建,如图5.图5 打开Xshell,点击左上文件,新建。2.图2 选择新建获1元体验。主机是自己的公网IP,如图6。3.稍等5分钟左右出现图3。图6 主机是自己的公网IP。图2 选择新建获1元体验。图7 输入用户名和密码。5.Xshell填写。
2025-03-25 08:31:10
367
原创 数值计算精度体系技术解析
1. FP64(双精度浮点数)2. FP32(单精度浮点数)3. FP16(半精度浮点数)4. FP8(8位浮点数)1. INT16(16位整数)2. INT8(8位整数)3. INT4(4位整数)
2025-03-24 08:07:29
1289
原创 注意力机制技术分类与深度学习架构演进
动态注意力机制通过可学习模式选择(如Routing Transformer)优化稀疏性,自适应注意力跨度(如AdaSpan)根据输入动态调整计算范围。在文本生成任务中,点积注意力能够捕捉长程依赖关系,GPT-4等超大型模型通过深度堆叠自注意力层实现语义层级抽象。采用多粒度信息聚合,在文档分类任务中,先通过词级注意力筛选关键词,再通过句级注意力汇总段落信息。在语音识别中,Conformer模型结合卷积与注意力机制,通过受限自注意力捕捉声纹特征。在视频理解任务中,时空注意力分离建模空间对象关系与时间演化模式。
2025-03-24 07:54:48
425
原创 大模型技术分类与技术演进研究
大模型技术体系正沿着架构创新、训练范式演进、应用场景深化三条主线快速发展。未来随着异构计算架构的成熟和神经科学启发的机制引入,具备更强泛化能力、更低能耗特征的新一代智能系统的诞生。这种技术演进不仅推动AI从专用模型向通用智能迈进,更将重塑数字经济时代的生产力范式。
2025-03-24 07:50:36
520
原创 基于腾讯云大模型知识引擎×DeepSeek的高等职业学校单独招生二级学院考前咨询系统
本地部署需考虑硬件维护、访问效率等因素,同时高等职业学校单独招生每个二级学院考生咨询内容不同,若每个二级学院都进行本地部署将增加学校教育资金支出,因此借助腾讯云大模型知识引擎×DeepSeek有利于提高资金利用率。如图7所示,提示词 ,输入单招考试、考生咨询,点击右侧的一键优化可自动优化。通过大模型知识引擎×DeepSeek搭建高等职业学校单独招生二级学院考前咨询专有问答,使得专业老师能够更好的服务考试学生,有利于二级学院能够更好的进行考试宣传,招来优秀学子!点击图8的 导入 ,出现图9、图10..
2025-03-23 20:24:04
835
原创 基于腾讯云HAI的高效部署与优化:本地API运行DeepSeek-R1:14B模型
点击保存后,右下角出现deepseek-r1:14b,即选择了deepseek-r1:14b版本,对话框输入查询内容即可,如图19所示。进行deepseek-r1:14b安装需输入 ollama run deepseek-r1:14b 然后安装时间大概7分钟左右。安装好后,查询 再次输入ollama list,如图10所示,此时出现了deepseek-r1:14b说明安装成功。新建购买或者1元体验deepseek ,大约等待5分钟左右,会出现系统,如图7所示,东京代表。购买后注意不使用的时候云上要关机。
2025-03-23 20:23:06
2190
3
原创 神经网络前向微分和后向微分区别
较少用于神经网络训练,因为网络参数通常数量庞大(输入维度高),多次前向计算代价过高。若输出是标量(如神经网络的损失函数),仅需一次反向传播即可获得全部参数的梯度。:每个中间变量的导数随值一起计算,例如,对输入变量 �x 的导数逐层传递。反向过程:从输出层开始,按链式法则反向计算梯度(输出层 → 输入层)。:沿计算图的正向顺序(输入层 → 输出层),同时计算函数值和导数。:输入维度低(如 �n 小)、输出维度高(如 �m 大)。前向过程:计算所有中间变量的值(输入层 → 输出层)。,是神经网络训练的基石。
2025-03-02 10:37:01
908
原创 常用CPU架构
高性能多核设计:Intel的酷睿i9-13900K(24核32线程)、AMD的Ryzen 9 7950X(16核32线程)均支持超线程技术。制程演进:从Intel 14nm(Skylake)到Intel 7(10nm Enhanced SuperFin,Alder Lake)。高性能计算:x86(Intel至强)或ARM(Ampere Altra Max)。嵌入式设备:RISC-V(GD32V系列)或Cortex-M(STM32)。
2025-02-28 18:02:24
449
原创 GPU架构分类
性能:具有128个流处理器,带宽高达86GB/s。性能:Volta GV100具有5120个CUDA核心和900GB/s的带宽,加上640个张量核心,AI计算能力达到112 TFLOPS,比Pascal架构提高了近3倍。性能:Pascal GP100具有3840个CUDA核心和732GB/s的显存带宽,但功耗只有300W,比Maxwell架构提高50%以上。性能:Turing TU102具有4608个CUDA核心、576个张量核心和72个RT核心,支持GPU光线追踪,代表了图形技术的新突破。
2025-02-28 17:21:50
1180
原创 卷积神经网络梯度下降方向与参数更新方向的一致性论述
基于函数下降最快方向:由于梯度方向是函数上升最快的方向,那么负梯度方向就是函数下降最快的方向。我们的目标是最小化损失函数,所以沿着负梯度方向更新参数,可以使损失函数在每次迭代中尽可能快地减小,从而更快地找到损失函数的最小值或接近最小值的点,实现模型的优化.它的基本思想是通过迭代的方式来更新模型的参数,使得损失函数的值逐步减小,最终收敛到一个局部最小值或全局最小值。在每次迭代中,算法会计算损失函数关于当前参数的梯度,然后根据梯度来调整参数的值,沿着损失函数下降最快的方向更新参数,从而加快模型的收敛速度。
2025-02-28 15:48:37
376
原创 虚拟仿真无线路由器5G和2.4G发射信号辐射对比(虚拟仿真得出最小安全距离,与国际标准要求一致)
5 GHz频段,频率范围:5.15 GHz 至 5.825 GHz(具体范围因地区不同有所差异),信道宽度:20 MHz、40 MHz、80 MHz,甚至160 MHz(Wi-Fi 6及以上标准),特点:干扰较少,传输速率高,但覆盖范围和穿透力较弱。公众关切问题:公众对 5G 和 2.4G 信号的辐射水平存在关注,对比两者在相关方面的情况,有助于更好地研究和评估它们对健康和环境的影响,以科学的态度回应公众疑虑,减少不必要的担忧和误解。axes[1, i].set_xlabel('距离 (米)')
2025-02-26 22:41:26
692
原创 基于MNIST的数据蒸馏与知识蒸馏对比分析
知识蒸馏:Knowledge Distillation是一种模型压缩和迁移学习技术,它通过将一个大型的预训练模型(教师模型)的知识迁移到一个小型的模型(学生模型)中。教师模型通常具有较高的准确率,但可能计算成本高,而学生模型则更轻量级、计算速度更快。数据蒸馏:Data Distillation则是从原始数据集中生成一个更小、更具代表性的合成数据集。这个合成数据集可以用于训练模型,减少数据存储和计算资源的需求。
2025-02-26 20:20:57
1056
原创 A股收盘值 和 美股标准普尔500指数收盘价 进行A股收盘预测
df_combined = pd.merge_asof(df_index, index_us_stock_sina_df[['close']].rename(columns={'close': '美股标准普尔500指数收盘价'}),axes[1].fill_between(upper_bound.index, lower_bound, upper_bound, color='gray', alpha=0.2, label='95% 置信区间')axes[0].set_title('滚动误差曲线')
2025-02-22 22:04:18
940
原创 中国宏观杠杆率+居民消费价格指数+美股股票指数数据+A 股新闻情绪指数+美联储利率决议+上证指数历史数据进行未来3天A股大盘预测(结果含ARIMA 模型阶数、MAE、RMSE等指标)
在金融市场中,准确预测大盘走势对于投资者和决策者而言至关重要。为此,我们构建了一个基于多维度数据的A股大盘预测模型,该模型整合了中国宏观杠杆率、居民消费价格指数(CPI)、美股股票指数数据、A股新闻情绪指数、美联储利率决议以及上证指数历史数据。通过采用先进的ARIMA时间序列分析方法,我们成功地对未来的3天A股大盘走势进行了预测,并提供了详细的模型评价指标。
2025-02-22 21:10:26
1460
原创 Winograd 算法原理推导和python程序
Winograd 算法是一种用于高效计算卷积的算法,其核心思想是通过减少乘法运算的次数来提高卷积计算的效率。在传统的卷积计算中,乘法运算的开销较大,而 Winograd 算法通过巧妙的变换,将卷积运算转化为在变换域中的矩阵乘法,从而减少乘法的数量,虽然会引入一些额外的加法和变换操作,但整体上在计算效率上有显著提升。print(winograd_1d(x, g)) # 输出应为 [-2, -2]构造输入矩阵和核矩阵的变换形式。# 变换后的输入和核。:对卷积核进行类似变换。:在变换域进行乘法。
2025-02-19 19:08:49
555
原创 一种简单的方法计算大模型使用的GPU
推理时,需要一次性加载700亿参数,GPU需要容量空间字节为约140G,这也是140G显存,由于训练比推理使用的显存多,约是2-3倍,训练最少280G。假设某大模型XXX--70B,其中XXX为大模型的名称,70B为模型大小,B指的是10亿,即该模型为700亿参数。在保证效率和精度的情况下,大模型训练一般使用半精度浮点数FP16(一共16位),小数占3-4位。计算机1G容量(无论显存和内存)约等于1024(M兆字节)*1024(K千字节)*1024(B。由于16位占2个字节,则700*2=1400亿字节。
2025-02-16 10:17:47
407
原创 CPU如何处理图像像素
如果CPU6核64位处理彩色图像,以24位为例,每个核64位除以24位无法整除,64-24*2=16位,即由于处理时需整个像素处理,因此每个核只能处理彩色图像的2个像素,剩下的16位(可临时存储RGB三通道的某2个通道,待下次读取剩余1个通道补全3通道)需等下一次处理凑够24位即可处理。但是有时彩色图像需外加一个透明度(8位),即共计24位+8位=32位。若CPU为6核64位,由于每个核为64位,则该CPU每个核可处理灰度图像像素为64/8=8,则该CPU可共计处理总像素为8*6=48个。
2025-02-14 20:36:05
143
原创 pycharm2024.3.2 集成 uv,通过uv安装第三方包比较快,但是运行这些第三方包不快。
但是这些安装的第三方包运行并不是基于 uv运行的,因为 uv是管理工具。通过uv安装确实比较快,但是需要安装uv、学习uv的命令。
2025-02-13 17:44:32
388
原创 Pycharm2024.3.2以上版本配置环境,生成新的环境pthon解释器
生成的虚拟环境下的python.exe也可以作为python解释器被新新的环境使用,但是我不建议这么使用,主要是生成的虚拟环境下的python.exe属于隔离环境下生成的,到时管理起来相当麻烦啊。这个python.exe文件是与你的C:\Users\Administrator\AppData\Local\Programs\Python\Python39\python.exe版本一致。一句话:新生成的虚拟环境下的python.exe版本与基础python对应位置的版本一致。
2025-02-13 17:30:47
523
原创 AI时代如何作为,自我感悟
4.不可能每个环节都赚钱,没有通吃的整个产业,在某个环节做强(我这个环节不通过,这个流程都滞后)。2.引入到自己的行业里面。3.提高自己的工作效率。1.学习好基本的知识。
2025-02-09 21:54:51
88
原创 torch,torchvision,torchaudio,不同版本下载关系
获得cuda为12.2.91,那么安装的cuda支持的torch,torchvision,torchaudio,需要选择比12.2.91小。即选择12.2以下的版本。torch,torchvision,torchaudio如果同时下载时需要一定的版本相互支持,不能胡乱下载,否则容易出错。输入nvcc --version。红色线标注的都可以,因为cuda11.8和12.1比12.2小。1.通过PowerShell依据自己的cuda信息。cpu版本不受cuda影响,自己可依据自己电脑选择。
2025-02-08 12:00:35
252
原创 公网地址访问本地部署Deepseek建立的知识库
1.安装ollama,deepseek,docker,Open WebUI.2.ollama安装deepseek,docker安装Open WebUI。3.公网地址映射到本地地址http://localhost:3000/。
2025-02-07 21:56:25
485
原创 解决问题HTTPConnectionPool(host=‘127.0.0.1‘, port=11434): Max retries exceeded with url: /api/
HTTPConnectionPool(host='127.0.0.1', port=11434): Max retries exceeded with url: /api/generate (Caused by NewConnectionError.http://127.0.0.1:11434地址为该DOCker自身的回环地址,相当于DOCker自身的IP。http://host.docker.internal:11434地址为从DOCker内访问宿主机服务.
2025-02-07 15:49:02
3136
3
原创 Anythingllm结合nomic-embed-text和deepseek-r1使用,搭建私有数据分析库
Anythingllm通过调取Embedder 首选项和LLM 首选项完成相应工作,Embedder 首选项选取nomic-embed-text处理私有数据TXT.CSV.AUDIO.SPREADSHETT等为高维向量空间中的向量,便于学习不同向量的特征。2.https://ollama.com/下载依据自己的电脑系统下载ollama,https://ollama.com/search下载安装nomic-embed-text和deepseek-r1。
2025-02-07 10:40:51
294
原创 解决Win10专业版(22H2),安装Docker、Dify大坑.
只修改这个地方是不行的,还得需要修改C:\Users\Administrator\.docker下面的config配置文档,然后依次cd dify/docker,copy .env.example .env,docker compose up -d。https://www.docker.com,选择Win-AMD64,安装Docker选择,use wsl 2打对√。注意不能再浏览器里面输入http://8d1486d167bb:3000,必须输入。注意 注意任何修改一次的docker都需重启。
2025-02-05 16:33:17
911
原创 deepseek的三种部署方法
https://ollama.com/search依据自己的电脑配置下载deepseek-r1模型的1.5b版本等,复制命令ollama run deepseek-r1:1.5b,Ollama+Chatbox, UI部署是在直接部署的基础上增加UI界面,此时的Chatbox相当于一个UI界面,下载Chatbox安装,bge-m3嵌入式私有部署模型打通私库与deepseek衔接,再打通架构IP就相当于局网可访问了,如监狱、银行等特殊行业。添加内容为自己查询已有的模型,查询自己已有的模型,
2025-02-01 22:18:19
1008
1
空空如也
win10系统dify添加添加 Ollama,基础 URL不管怎么填1434端口都出错
2025-02-06
虚拟机安装win7一直无法发现U盘,安装网上的设置方法都不行
2023-08-20
pycharm使用pytorch运行问题
2023-06-13
cuda安装时操作系统问题
2023-06-13
pth文件 怎么修改?怎么保存?
2023-05-23
GPU无法使用显示False
2023-05-20
是没有安装AlexNet吗
2023-05-19
ValueError: True is not in list
2023-05-18
ensp 视频组播实验室时,为何不能把组播组的IP地址改为225.0.0.1
2022-11-11
WIN10无法使用虚拟机。不支持虚拟化的Intel VT-x/EPT
2022-09-18
ensp防火墙无法ping通
2022-09-08
双S形隶属度函数的数学表达式是啥
2022-07-12
matlab求圆心,给出迭代曲线与圆心坐标
2022-07-11
布拉格光栅MATLAB反射谱仿真不会修改代码
2022-06-04
matlab 对粒子群惯性权重编程
2022-05-08
红外图像怎么区分出天空区域与非天空区域,matlab代码
2022-04-14
图像能量图怎么计算,代码 matlab
2022-04-14
需求红外图像的近红外信息的代码
2022-04-13
神经网络图用什么软件 画出来
2022-03-30
图像去雾中的暗通道与亮通道混合,怎么评价大气光值获取的准确性?
2022-03-18
电脑同时安装opencv 与opencv-python,他们会相互影响.不正常运行吗?
2022-02-18
测试tensorflow2版本问题 ,出现告警以及错误。
2022-02-11
打开Jupyter notebook 里面的new 下面的目录是啥意思?
2022-02-10
Anaconda 创建环境问题
2022-02-10
安装3-4个python依赖包突然C盘少了40G?是不是安装了无用的?怎么办?
2022-02-08
python 哪些地方不需要输入空格?
2022-02-08
pyhon 有的程序一会大写,一会小写,还有空格怎么方便切换输入
2022-02-08
python第三方库 安装更新、共享使用问题
2022-02-08
python第三方库的名字问题
2022-02-07
matlab软件scatter3生产的图像如何保存为ply格式
2022-02-06
点云数据matlab2017b 运行结果dragon是倾斜的,需要正视
2022-01-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人