XTuner 微调个人小助手认知任务

最新推荐文章于 2025-12-11 20:55:02 发布

原创最新推荐文章于 2025-12-11 20:55:02 发布 · 246 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

进行qlora训练之前大模型表现

进行qlora训练之后大模型表现

模型能够认清自己的弟位，并且在泛化性上依旧保持良好

通过改变temperature可以使大模型能够更加热情的回答问题，往往表现为说话语气不同和回答更长，topP目前感知不明显，但是低topP和高topP的回答可能完全不同，对同一个客观问题的回答天差地别，甚至犯错，类似我认为类似模型权重，例子如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

HOPStudio

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

DefaultCPUAllocator: can‘t allocate memory

weixin_45776000的博客

12-11

304

【代码】DefaultCPUAllocator: can‘t allocate memory。

深度学习中 z-score 标准化理解

最新发布

musk1212的博客

12-11

483

摘要： z-score标准化是深度学习中关键的数据预处理方法，通过将数据转换为均值为0、标准差为1的分布，有效提升模型训练效率并消除特征量纲差异。其核心公式为z=(x-μ)/σ，适用于加速收敛、平衡多特征权重及异常值检测等场景。与Min-Max归一化相比，z-score对异常值更鲁棒，是神经网络训练的首选方法。需注意避免数据泄露问题（测试集必须使用训练集的μ和σ），并处理标准差为0的特殊情况。批量归一化(BatchNorm)是z-score的动态扩展版本。

参与评论您还未登录，请先登录后发表或查看评论

基于深度学习的网络流量异常检测系统

XiaoMu_001的博客

12-11

628

本项目旨在构建一个基于深度学习的高效网络流量异常检测系统。系统采用 **B/S 架构**，前后端分离设计。后端基于 **Django** 框架，前端采用 **Vue 3** + **Element Plus**。核心检测引擎利用 **PyTorch** 构建深度学习模型（MLP 和 1D-CNN），能够对网络流量数据进行实时或离线分析，精准识别良性流量及多种类型的网络攻击（如 DoS, PortScan, Web Attack 等）

机器学习与深度学习基础（五）：深度神经网络经典架构简介

TracyCoder的博客

12-11

378

本文学习要点：1.深度神经网络分层架构：全连接层卷积层池化层2.深度神经网络代表:CNN：CNN、AlexNet、VGG-Net、GoogLeNet（Inception）、ResNet（残差连接）编码器-解码器架构：序列到序列模型（Seq2Seq）

微算法科技（NASDAQ MLGO）采用混合深度学习赋能区块链：打造智慧城市安全新范式

MicroTech2025的博客

12-11

160

区块链网络中的各个节点会对算法输出的结果进行验证和记录，每一个安全判断、操作记录等都会以区块的形式被添加到区块链账本上，由于区块链的不可篡改特性，这些记录能够作为可靠的依据，供后续的审计、追溯等使用。系统维护阶段，当发现潜在安全风险时，系统可以根据预设的规则自动触发相应的安全响应机制，比如向相关管理人员发送警报信息、启动防护设备（如对特定区域进行封锁、调整交通信号灯等），同时这些响应操作也会被记录在区块链上，形成完整的安全事件处置链条，方便后续复盘和改进安全策略。

深度学习与机器学习的3个关键区别

dream_it_come_in的博客

12-05

1160

在人工智能的浪潮中，“机器学习” 和 “深度学习” 是两个高频出现却常被混淆的概念。很多人误以为深度学习是机器学习的 “升级版”，但实际上二者在技术逻辑、适用场景和核心能力上存在本质区别。今天我们就从三个核心维度，拆解它们的关键差异，帮你快速理清 AI 技术的底层逻辑。

【风电功率预测服务】如何让风电场 nRMSE 再降 1%？——基于多源气象 + 深度学习的实战方案

专注AI大模型,软件混淆,授权

12-09

152

风电功率预测精度提升1%可带来显著经济效益。针对现有预测系统瓶颈，提出"多源气象+深度学习"的残差修正方案：通过融合多模式气象数据和SCADA信息，采用STL/VMD分解将误差拆分为多尺度分量，分别用Informer处理长期天气趋势、CNN-BiLSTM处理短期波动。实践表明，该方法可使200MW风电场nRMSE降低1-1.5个百分点，年节省考核费用达数十万元。该方案可作为预测服务提供，在不推翻现有系统基础上实现精度突破。

基于协同过滤和深度学习的视频推荐系统设计与实现

电脑管家

12-07

1087

本文介绍了一个融合协同过滤和深度学习技术的视频推荐系统。系统采用分层架构，包含数据预处理、模型层、推荐引擎和服务层。核心算法实现包括：1)基于SVD矩阵分解的协同过滤，使用Surprise库实现；2)神经网络协同过滤模型，通过Embedding层学习用户和视频的隐向量表示。系统采用加权融合策略(CF占40%，深度学习占60%)结合两种算法结果，并引入分类多样性机制优化推荐效果。技术栈选用Python生态工具链，包括NumPy/Pandas、Scikit-learn、TensorFlow和Flask等。该系统

（论文速读）基于深度学习的高稀疏Lamb波场复合材料损伤有效识别方法

LJ1147517021的博客

12-09

865

一种基于深度学习的空间梯度重建方法，用于高效识别高稀疏Lamb波场复合材料损伤。针对碳纤维增强塑料(CFRP)中肉眼难以察觉的分层损伤，以及扫描激光多普勒测振仪(SLDV)测量耗时的问题，该方法通过新型空间梯度损伤指标和神经网络技术实现了显著改进。采用交叉注意技术将浅层特征直接注入解码器，增强异常检测能力，并集成多重建层指导波场重建过程。实验表明，该方法重建精度较现有技术大幅提升，单损伤情况下从70%增至92%，多损伤情况下从14%增至72%。通过空间协方差分析验证了其在不同损伤位置的适用性。

机器是如何识别图片的？：卷积神经网络

最简单的方法，解决最实际的问题。

12-11

644

卷积神经网络（Convolutional Neural Networks, CNN）是一种专门用于处理具有网格状结构数据的深度学习算法，“卷积”一词源于同名的数学运算，它是一种常用于图像处理的特殊线性运算。卷积神经网络在图像识别、计算机视觉等领域表现出色。

极简单cnn对称之美

ganggangwawa的博客

12-10

687

double delta11 = E偏导zII * wcnn[1][0]*dsigmoid(aI[0]);double delta12 = E偏导zII * wcnn[1][1]*dsigmoid(aI[1]);wcnn[1][i] = wcnn[1][i] - 常数a * wcnn的偏差[1][i];wcnn[0][i] = wcnn[0][i] - 常数a * wcnn的偏差[0][i];wcnn的偏差[0][1] =wcnn的偏差[1][1] =wcnn的偏差[1][2] =

基于卷积神经网络的手写数字识别（Matlab 实现）

2504_94290909的博客

12-10

534

基于卷积神经网络的手写数字识别（matlab实现）基于CNN的matlab手写数字识别可以加Lenet-5模型数据集自制数字大小5*5训练过程良好，识别准确率在95%以上（数值+图像）主成分分析提取像素点包含图片输入和手写板输入两种方式加50在机器学习领域，手写数字识别是一个经典的项目。今天，咱们就来聊聊如何用 Matlab 基于卷积神经网络（CNN）实现手写数字识别，并且会用到 Lenet - 5 模型，还会涉及自制数据集以及多种输入方式等有趣的内容。

基于深度学习的人脸识别考勤系统设计与实现

ztt123654的博客

12-11

707

基于深度学习的人脸识别考勤系统是一个结合人工智能与教育管理的高效解决方案，专为学校、培训机构等教育场景设计，实现智能化考勤管理。该系统利用先进的深度学习技术，通过人脸识别自动完成学生考勤，显著提升管理效率和准确性，是本科毕业设计的优秀实践项目。系统核心功能包括人脸录入、人脸识别、考勤管理、课堂管理、班级管理和日志管理。人脸录入模块支持批量导入学生人脸数据，建立人脸特征数据库；人脸识别模块基于FaceNet算法，实时检测和比对摄像头捕捉的人脸，实现快速身份验证；考勤管理模块自动记录学生出勤情况，生成考勤报

【岩石种类识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法

子午的博客

12-09

901

岩石种类识别系统，基于TensorFlow搭建卷积神经网络算法，通过对7种常见的岩石图片数据集（‘玄武岩（Basalt）’, ‘煤（Coal）’, ‘花岗岩（Granite）’, ‘石灰岩（Limestone）’, ‘大理石（Marble）’, ‘石英岩（Quartzite）’, ‘砂岩（Sandstone））进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。前端后端：Django算法：TensorFlow、卷积神经网络算法具体功能。

详解高阶数学领域-信息论与深度学习：互信息在对比学习中的应用

编程技术探索者，分享C/C++、C#、Java、数据库等开发经验，聚焦实战技巧与AI兴趣，助力编程爱好者成长。

12-05

875

对比学习隐式学习数据流形结构。联合熵 H(X,Y)条件熵 H(X|Y)条件熵 H(Y|X)

卷积神经网络的设计与优化

2402_84924563的博客

12-10

798

摘要：卷积神经网络（CNN）是深度学习中处理图像、语音等网格数据的核心模型，通过局部感受野、权值共享和池化降维三大特性实现高效特征提取。本文系统阐述了CNN的基础架构设计，包括输入标准化、卷积层参数计算、激活函数选择、池化层优化以及全连接层改进策略，并对比分析了LeNet、AlexNet、VGGNet等经典架构的演进历程。研究表明，采用3×3小卷积核堆叠、ReLU激活函数和全局平均池化等优化方法可显著提升模型性能。CNN的发展呈现出深度增加、计算效率提升的趋势，为计算机视觉任务提供了强大支持。

【岩石种类识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法

子午的博客

12-07

530

岩石种类识别系统，基于TensorFlow搭建Resnet50卷积神经网络算法，通过对7种常见的岩石图片数据集（‘玄武岩（Basalt）’, ‘煤（Coal）’, ‘花岗岩（Granite）’, ‘石灰岩（Limestone）’, ‘大理石（Marble）’, ‘石英岩（Quartzite）’, ‘砂岩（Sandstone）’）进行训练，最后得到一个识别精度较高的模型，然后搭建Web可视化操作平台。技术栈项目前端使用Html、CSS、BootStrap搭建界面。后端基于Django处理逻辑请求。

基于深度学习的遥感地面物体检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

ningfoshao8678的博客

12-11

317

本文实现了一套基于YOLO系列的遥感地面物体检测系统，集成YOLOv5/v8/v11/v12四种模型，支持多模型横向对比与快速切换。系统采用PyQt5构建桌面应用，具备图片/视频/实时摄像头检测功能，提供交互式参数调节和结果分析。通过SQLite实现用户管理，配套训练脚本支持批量自动化训练。实验表明，YOLO12n在精度(mAP40.6%)和效率(6.5B FLOPs)上表现最优，YOLO11n推理速度最快(56.1ms)。系统在11类遥感目标检测任务中取得mAP@0.5达84.9%的优异性能，为遥感智能解

Xtuner大模型微调入门：轻松定制专属深度学习模型

Xtuner 是一个专注于大模型微调（Fine-tuning）的开源工具包，其设计目标是让大语言模型（Large Language Models, LLMs）的训练过程更加轻量、简单和高效。该项目特别适合希望在有限计算资源下对主流大模型进行个性...