科技论文写作技巧与鉴赏
文章平均质量分 92
专栏将深入探讨科技论文写作的艺术与科学。无论你是科研新手,还是经验丰富的学者,这里都有适合你的内容。我们将从写作技巧、论文结构、语言表达,到优秀论文的鉴赏与分析,全方位提升你的科技论文写作能力。
段一凡-华北理工大学
华北理工大学在读博士生,研究方向为工业大数据、铁前全流程智能化应用、低碳冶金
合作交流请添加微信:18631356355
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
佳文赏读 || (CVPR 2025最佳开源贡献) Molmo and PixMo:开放且先进的视觉语言模型
开源视觉语言模型新突破:Molmo与PixMo 当前顶级视觉语言模型(VLM)如GPT-4V均为闭源,开源方案多依赖闭源模型蒸馏数据。艾伦AI研究所提出全开源SOTA模型Molmo及无VLM依赖的PixMo标注数据集,突破闭源垄断。 核心创新: 1️⃣ 模型架构:采用重叠裁剪+注意力池化的视觉连接器设计,OCR精度提升12%; 2️⃣ 数据标注:通过语音转文本生成密集描述(比COCO详细17倍),2D点标注效率提升300%; --来自华北理工大学段一凡的博客鉴赏原创 2025-08-21 09:45:04 · 1004 阅读 · 0 评论 -
佳文赏读 || (CVPR 2025最佳学生论文) 首个基于物理的神经逆向渲染系统(Neural Inverse Rendering from Propagating Light)
选文提出了一种创新方法,通过结合物理模型与神经网络,让激光雷达不仅能测量深度,还能记录光在三维空间中的完整传播过程。传统方法仅利用"第一束光"的返程时间,而丢弃了大量因多次散射产生的有用信息。作者提出的"时间解析辐射缓存"技术将场景划分为体素网格,预先计算光线到达的能量图谱,大幅降低了计算复杂度。神经网络由几何、材质和缓存三部分组成,并加入物理正则项确保结果准确性。--来自华北理工大学段一凡的博客鉴赏原创 2025-08-18 11:02:20 · 1480 阅读 · 0 评论 -
佳文赏读 || (CVPR 2025新突破) Robobrain:机器人操作从抽象到具体的统一大脑模型(A Unified Brain Model)
RoboBrain研究提出了一种统一的多模态大模型范式,将任务规划、可抓取区域感知和轨迹预测整合到端到端模型中。通过超百万级的ShareRobot数据集训练,该模型在多个基准测试中刷新了SOTA表现。RoboBrain基于LLaVA-OneVision-7B架构,引入双LoRA插件(A-LoRA和T-LoRA)实现高效适配,并采用四阶段训练策略优化性能。实验显示,该模型在规划、affordance预测和轨迹生成任务上均显著优于现有方法。--来自华北理工大学段一凡的博客鉴赏原创 2025-08-17 17:05:23 · 1227 阅读 · 0 评论 -
佳文赏读 || (CVPR 2025最佳论文奖) VGGT: 通用 3D 视觉模型 (Visual Geometry Grounded Transformer)
本文围绕计算机视觉领域的 3D 重建和理解任务,重点介绍了 VGGT(Visual Geometry Grounded Transformer)模型。VGGT 是基于 Transformer 的前馈神经网络,能直接从单张或多张图像中预测相机参数、点云、深度图和 3D 点轨迹等关键 3D 属性。其核心为大型Transformer。验结果显示,在相机参数估计、多视图深度估计、点云重建和 3D 点跟踪等任务中,VGGT 均优于现有最先进方法,且运行速度更快,具备实时应用潜力--华北理工大学段一凡的博客鉴赏系列原创 2025-08-13 13:30:00 · 1211 阅读 · 0 评论 -
佳文赏读 || LPMRL~时间序列分类:语言预训练引导掩蔽表征学习(2025 AAAI: 即插即用模块)
选文针对时间序列数据的复杂性、时空性和连续性所带来的自监督表征学习挑战,提出了一种新的方法——语言预训练引导掩蔽表征学习(LPMRL)。该方法通过自然语言描述引导掩蔽编码器自适应采样语义时空块,显著提高了潜在表征的可区分性。此外,LPMRL引入了对比学习机制,通过生成高质量的难负样本,进一步优化表征的可区分性,从而提高模型的分类性能。通过在106个基准数据集上的实验验证,LPMRL显著优于现有的最先进方法。--来自华北理工大学段一凡的博客鉴赏原创 2025-08-12 14:00:00 · 1206 阅读 · 0 评论 -
佳文赏读 || 风车状卷积·Pinwheel-shaped Conv和基于尺度的动态损失:用于红外小目标检测(2024,即插即用模块)
选文提出了一种新型的红外小目标检测方法,通过风车状卷积(PConv)和基于尺度的动态损失(SD Loss)显著提升了检测性能。PConv利用非对称填充和分组卷积设计,有效捕捉目标的高斯分布特性并扩大感受野;SD Loss通过动态调整尺度与位置损失权重,优化了不同尺度目标的检测效果。实验在IRSTD-1K和新构建的SIRST-UAVB数据集上进行,结果表明该方法在检测精度上优于现有技术。研究为红外小目标检测提供了创新性解决方案和基准数据集支持。--华北理工大学段一凡的博客鉴赏原创 2025-08-11 14:00:00 · 808 阅读 · 0 评论 -
佳文赏读 || FSTA-SNN:基于频率的Spiking神经网络时空注意力模块 (2025AAAI会议)
选文提出了一种基于频率的时空注意力模块(FSTA)来优化脉冲神经网络(SNNs)的性能。研究发现SNNs在时空维度上存在特征学习冗余问题,尤其是浅层网络。通过离散傅里叶变换分析脉冲输出,发现其频率分布具有高度一致性。基于此,FSTA模块包含基于DCT的空间注意力子模块和时间注意力子模块,能有效抑制冗余脉冲特征。实验结果表明,FSTA模块在CIFAR-10、ImageNet等数据集上显著提升了SNNs的准确率(最高提升1.5%),同时降低了33.99%的脉冲发放率,提高了能效。--华北理工大学段一凡的博客鉴赏原创 2025-08-10 13:30:00 · 786 阅读 · 0 评论 -
佳文鉴赏 || 2025年重磅推出:Optimal Weighted Convolution for Classification and Denosing (即插即用的卷积块)
选文提出了一种创新的加权卷积方法,通过引入空间密度函数改进了传统卷积操作。该方法可根据像素位置分配不同权重,有效提升特征提取能力,同时保持与标准卷积相同的参数数量和计算效率。实验表明,在CIFAR-100和DIV2K数据集上,加权卷积显著提升了VGG、ResNet等模型在图像分类任务中的准确率(如VGG从56.89%升至66.94%),以及DnCNN等模型在去噪任务中的PSNR值(从20.17提升至22.63)。该方法具有通用性,可拓展至三维体积数据等应用场景。--华北理工大学段一凡的博客鉴赏原创 2025-08-09 13:30:00 · 919 阅读 · 0 评论 -
佳文荐读 || 高炉单铁次铁水产量的动态预测模型~冶金领域期刊《ISlJ International》
选文提出一种基于多头注意力机制的高炉铁水产量动态预测模型(MHA-SDAE),通过实时分析82个生产参数,动态调整特征权重以提高预测精度。研究采用堆叠去噪自编码器构建深度网络,结合互信息方法筛选出20个关键特征。实验结果表明,该模型的MAE、RMSE和MAPE指标均优于传统方法,为高炉生产优化提供了新思路。研究数据来自国内钢厂2022年度生产数据,验证了模型在工业场景中的实用性。--华北理工大学段一凡原创 2025-08-08 13:30:00 · 887 阅读 · 0 评论 -
佳文赏读 || 冶炼钒钛矿高炉操作炉型计算模拟研究
选文研究了冶炼钒钛磁铁矿高炉操作炉型的传热特性,通过MATLAB建立一维稳态传热模型,分析了炉墙挂渣厚度分布规律及其影响因素。研究发现,钒钛高炉渣皮厚度普遍超过100mm,且呈现不均匀分布,最大厚度差达184mm。冷却壁热负荷是影响渣皮厚度的关键因素,增加冷却水流量可有效减薄渣皮。研究结果为优化钒钛高炉冷却制度、提高运行稳定性提供了理论依据。--来自华北理工大学段一凡的博客原创 2025-08-07 14:00:00 · 1092 阅读 · 0 评论 -
佳文鉴赏 || FD-LLM:用于机器故障诊断的大规模语言模型
FD-LLM模型创新性地将大规模语言模型(LLM)应用于机器故障诊断领域。研究通过两种编码方法(基于字符串的标记化和统计特征提取)将振动信号等时间序列数据转换为LLM可处理的文本输入,并采用LoRA技术对Llama3等开源模型进行微调。在CWRU轴承数据集上的实验表明,该模型在传统故障诊断任务中准确率和F1分数接近100%,在跨操作条件场景下表现优异,但在跨机器组件场景中性能有所下降。这项工作为工业设备智能诊断提供了新思路,未来可进一步优化模型在跨设备场景的泛化能力。--来自华北理工大学段一凡的博客专栏原创 2025-08-06 15:19:00 · 1263 阅读 · 0 评论
分享