自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(61)
  • 收藏
  • 关注

原创 工作和学习中的高效工具

工作和学习中的高效工具

2022-08-26 16:17:25 163

原创 cursor+cline+MCP(论文agent)

本文介绍了多款工具软件的安装配置方法。首先说明使用pip安装uv工具,并给出清华镜像源地址。然后介绍cursor、vscode和cline三款编辑器的安装方式。重点讲解了arXiv和Google Scholar两种MCP服务器的安装步骤,包括GitHub项目地址。最后详细展示了为cursor/cline配置MCP服务器的YAML文件示例,包含命令路径、运行参数和自动审批规则等关键配置项。全文提供了完整的工具链安装和配置指南。

2025-12-12 22:28:55 168

原创 自然语言概述

本文概述了自然语言处理中的关键技术与模型发展。首先介绍了BPE、BBPE和WordPiece等分词算法,然后回顾了N-Gram等传统语言模型。随后详细分析了RNN、LSTM和GRU等循环神经网络的结构与优化,包括LSTM的输入门、遗忘门和输出门机制。接着讨论了BERT和GPT系列模型的演进,从GPT-1到GPT-3的规模扩展,以及InstructGPT引入的RLHF方法。最后简要提及了当前大语言模型(LLM)的发展趋势。全文系统梳理了NLP领域从基础分词到前沿大模型的技术脉络。

2025-10-07 21:36:45 956

原创 语义分割概述

本文概述了图像分割领域的核心技术与主要模型框架。首先介绍了卷积模式、三大分割任务(语义/实例/全景)及转置卷积原理。随后重点分析了FCN、U-Net、PSPNet等经典模型:FCN通过全卷积结构实现任意尺寸输入,采用转置卷积上采样和Skip结构融合多尺度特征;U-Net针对医学图像数据稀缺问题,设计了对称的编码器-解码器结构,并引入弹性变形数据增强和加权交叉熵损失;PSPNet通过金字塔池化模块捕获多尺度上下文信息,显著提升复杂场景理解能力。

2025-10-05 00:06:57 640

原创 目标检测概述

目标检测技术发展综述 本文系统梳理了目标检测领域的主要技术发展脉络。从早期基于区域提议的方法(如RCNN系列)到单阶段检测器(如YOLO、SSD),再到基于Transformer的端到端检测方法(如DETR),以及结合视觉语言模型的多模态方法(如GLIP、Grounding DINO)。重点介绍了各代表性模型的架构特点和关键技术,包括锚框机制、NMS、RoI Pooling、RPN网络等基础组件,并分析了不同方法间的演进关系。同时概述了当前前沿的多模态大语言模型(MLLM)在目标检测中的应用趋势。

2025-10-03 22:22:52 1151 1

原创 GraphRAG概述

是知识图谱中的基本构成单元,用于描述实体之间的关系或实体的属性。),形式为**<主体,谓词,宾语>**,在知识图谱中表现为节点和边的结构,其中节点代表实体或概念,边代表实体间的关系或实体的属性。:例如,<特朗普,职业,美国总统>,其中“特朗普”是实体,“职业”是属性,“美国总统”是属性值。:例如,<北京,是首都,中国>,其中“北京”和“中国”是实体,“是首都”是它们之间的关系。”的三元组结构,构建出复杂的知识网络,从而支持高效的信息检索、语义理解和推理。是一种基于图结构的语义网络,用于表现现实世界中的。

2025-09-30 17:23:41 339

原创 DeepSeek-V3.2-Exp浅析

DeepSeek-V3.2-Exp在V3.2-terminus基础上引入基于MQA的稀疏注意力(DSA)机制,显著降低训练和推理成本。该模型通过Lightning Indexer计算索引得分,使用ReLU减少吞吐量,并采用Top-k Selector选取关键token计算注意力。训练采用两阶段策略:预训练阶段包含密集预热和稀疏训练,后训练阶段结合专家蒸馏和混合强化学习,将推理、智能体和人类对齐训练合并到单一RL阶段。

2025-09-30 11:02:02 546

原创 LLM推理训练加速概述

见–>量化基础。

2025-09-23 19:32:16 332

原创 大模型相关概述

MoE负载均衡损失FP8混合精度训练GRPO强化训练蒸馏。

2025-09-22 00:03:41 239

原创 多模态大模型相关概述

本文系统梳理了多模态大模型的关键技术与最新进展。首先介绍了视觉大模型基础架构ViT及其核心改进(MAE、DINO等),以及目标检测模型DETR和分割模型SAM系列。随后重点分析了多模态对齐模型CLIP、BLIP及其迭代版本BLIP-2,以及对话式模型LLaVA系列。最新模型方面,详细解读了MiniCPM-V 2.6的高分辨率处理方案,以及Qwen VL系列的三代演进,特别是Qwen2.5-VL引入的MRoPE位置编码和分阶段训练策略。文章呈现了多模态模型从基础架构到应用落地的技术发展脉络。

2025-09-20 18:37:09 769

原创 量化基础概述

本文介绍了模型量化的基本概念、分类方法及相关工作。量化通过降低参数精度(如FP32到INT8/FP8)来减少显存占用和提升计算效率,核心是确定缩放因子和零点。量化分为后训练量化(PTQ)和量化感知训练(QAT)。

2025-09-20 10:14:09 592

原创 强化学习概述

强化学习是一种通过agent与环境交互来最大化长期奖励的机器学习方法。其核心要素包括agent、环境、状态、动作和奖励机制。根据学习方式可分为on-policy和off-policy,根据模型可分为model-free和model-based。关键区别在于奖励函数反映即时收益,而价值函数(包括状态值函数和动作-状态值函数)衡量长期收益。贝尔曼方程为解决此问题提供了递归框架,其核心思想是将问题分解为阶段性子问题,并考虑时间对奖励价值的影响。

2025-09-18 11:39:35 396

原创 SATA: Spatial Autocorrelation Token Analysis for Enhancing the Robustness of Vision Transformers

这篇论文方法很巧妙,效果很显著,即插即用,不增加训练成本的同时,显著提高标准分类任务以及鲁棒性评估指标。整篇逻辑先提出问题,再拟出解决方案,最后是对方法的验证。行云流水,很自然!

2025-05-16 13:41:23 875 1

原创 文献阅读工具-->Adobe pdf + 有道词典

最近一直在考虑用什么文献阅读工具,,Adobe pdf的添加注释已经很好用了,使用了zotero,感觉不行(使用这一套组合拳,可以直接对pdf修改,然后可以很方便的多设备相互使用。:OneDrive一个PDF,那哪儿都能用,而且对设备和软件的依赖非常小。

2024-03-27 11:17:57 5269

原创 万能近似定理

深度学习万能近似定理

2024-03-12 21:24:31 358

原创 图床服务器-->MinIO

最后我还是放弃了这个方案开通了阿里云ECS我只是有了一个公网IP,万一那天我不续费了,IP就失效了,进而blog的URL也就失效了,对于移植不是很方便。其实可以再买一个域名,IP变就变呗,但是说白了维护需要花时间。这个图床服务器界面太low了,不能所有图片全部预览(当然可能我并不知道其他隐藏trick)。

2024-02-27 21:09:55 755

原创 simple and useful command lines

pip list | grep package_name显示获取已安装包的信息(包名与版本号)pip show package_name能显示该安装的包的相关信息,其中包括它的安装路径。实际上包通常被安装在python安装目录下的lib\site-packages目录下where python显示python可执行文件的路径

2023-09-06 22:28:02 331

原创 STM32中EXTI和NVIC有别

参考:STM32中EXTI和NVIC的关系

2023-06-16 16:34:34 176

原创 sonar scanner配置

这里记录如何配置sonar scanner扫描C/C++项目代码。话不多说,先上。

2023-06-13 15:00:02 3403

原创 Git基本使用

记录一下Git的基本使用,以免以后到处找。

2023-06-13 14:18:48 229

原创 开源证书种类

代码开源证书:Open Source Initiative

2023-06-09 10:13:47 196

原创 Linux和Windows系统对大小写的区分不同

Windows 和 Linux 区分大小写之间的差异

2023-06-06 10:41:31 303

原创 MSYS2 下载GCC

MSYS2 下载GCC

2023-05-29 10:46:06 429

原创 GNU Make安装

GNU Make安装

2023-05-29 10:11:08 2227

原创 Python pip 浅了解

Python pip在哪儿

2023-05-29 09:48:25 146

原创 Arduino IDE 安装板级支持包失败(Failed to install platform: arduino:avr.)

Failed to install platform: arduino:avr.

2023-05-29 09:16:56 1680

原创 Language Server Protocol

ref:

2023-05-24 15:58:36 256

原创 chocolatey--Windows上的包管理工具

ref:

2023-05-22 14:26:17 253

原创 Robot Framework学习及使用

很多人习惯用Robot Framework + Robot Framework-Ride来开发,但是于我而言我更喜欢VSCode + Python + Robot Framework.故此,他可以很好的支持Python,砸门的一些Python函数、库、类等等都可很方便的被它使用。其实Robot Framework官网已经有很详细的文档了,但是毕竟人家是英语的,对砸门还是不是很友好。然后,Run一下,你可以尝试一下如下几种方式。默认配置下,会生成如上三个测试结果文件。建一个文件test.robot,如上。

2023-05-19 16:44:55 748

原创 %20 in URL

"%20" in URL

2023-05-09 10:17:53 875

原创 markdown catalog

markdown

2023-05-08 16:40:23 131

原创 GitLab学习-目录

GitLab 学习

2023-05-08 10:47:58 261

原创 Solved: STM32 core is locked up / STM32内核被锁

STM32 core is locked up / STM32 内核被锁

2023-05-08 10:16:11 2969

原创 python packages list

python packages list。

2023-04-28 15:26:01 250

原创 scrcpy非常好使的投屏工具

ref:https://blog.youkuaiyun.com/was172/article/details/99705855

2023-04-13 15:58:13 177

原创 Useful VSCode shortcuts

快速查找文件中的指定标识。快速查找command。进入Zen Mode。退出Zen Mode。查到当前文件中的内容。

2023-01-16 11:57:57 157

原创 mathematics statistics

mathematics statistics

2022-11-14 15:35:46 179

原创 泰勒公式/Taylor function

泰勒公式 / taylor function

2022-11-14 15:33:40 186

原创 __attribute__((section(x))) 使用

__attribute__((section(x)))

2022-10-26 14:08:38 589

原创 使用STM32 CubeMX自定义(模板)代码生成

自定义、模板代码生成

2022-10-25 14:21:38 4282

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除