面壁的熊猫-优快云博客

本文介绍了多款工具软件的安装配置方法。首先说明使用pip安装uv工具，并给出清华镜像源地址。然后介绍cursor、vscode和cline三款编辑器的安装方式。重点讲解了arXiv和Google Scholar两种MCP服务器的安装步骤，包括GitHub项目地址。最后详细展示了为cursor/cline配置MCP服务器的YAML文件示例，包含命令路径、运行参数和自动审批规则等关键配置项。全文提供了完整的工具链安装和配置指南。

2025-12-12 22:28:55 168

原创自然语言概述

本文概述了自然语言处理中的关键技术与模型发展。首先介绍了BPE、BBPE和WordPiece等分词算法，然后回顾了N-Gram等传统语言模型。随后详细分析了RNN、LSTM和GRU等循环神经网络的结构与优化，包括LSTM的输入门、遗忘门和输出门机制。接着讨论了BERT和GPT系列模型的演进，从GPT-1到GPT-3的规模扩展，以及InstructGPT引入的RLHF方法。最后简要提及了当前大语言模型(LLM)的发展趋势。全文系统梳理了NLP领域从基础分词到前沿大模型的技术脉络。

2025-10-07 21:36:45 956

原创语义分割概述

本文概述了图像分割领域的核心技术与主要模型框架。首先介绍了卷积模式、三大分割任务（语义/实例/全景）及转置卷积原理。随后重点分析了FCN、U-Net、PSPNet等经典模型：FCN通过全卷积结构实现任意尺寸输入，采用转置卷积上采样和Skip结构融合多尺度特征；U-Net针对医学图像数据稀缺问题，设计了对称的编码器-解码器结构，并引入弹性变形数据增强和加权交叉熵损失；PSPNet通过金字塔池化模块捕获多尺度上下文信息，显著提升复杂场景理解能力。

2025-10-05 00:06:57 640

原创目标检测概述

目标检测技术发展综述本文系统梳理了目标检测领域的主要技术发展脉络。从早期基于区域提议的方法（如RCNN系列）到单阶段检测器（如YOLO、SSD），再到基于Transformer的端到端检测方法（如DETR），以及结合视觉语言模型的多模态方法（如GLIP、Grounding DINO）。重点介绍了各代表性模型的架构特点和关键技术，包括锚框机制、NMS、RoI Pooling、RPN网络等基础组件，并分析了不同方法间的演进关系。同时概述了当前前沿的多模态大语言模型（MLLM）在目标检测中的应用趋势。

2025-10-03 22:22:52 1151 1

原创 GraphRAG概述

是知识图谱中的基本构成单元，用于描述实体之间的关系或实体的属性。），形式为**<主体，谓词，宾语>**，在知识图谱中表现为节点和边的结构，其中节点代表实体或概念，边代表实体间的关系或实体的属性。：例如，<特朗普，职业，美国总统>，其中“特朗普”是实体，“职业”是属性，“美国总统”是属性值。：例如，<北京，是首都，中国>，其中“北京”和“中国”是实体，“是首都”是它们之间的关系。”的三元组结构，构建出复杂的知识网络，从而支持高效的信息检索、语义理解和推理。是一种基于图结构的语义网络，用于表现现实世界中的。

2025-09-30 17:23:41 339

原创 DeepSeek-V3.2-Exp浅析

DeepSeek-V3.2-Exp在V3.2-terminus基础上引入基于MQA的稀疏注意力(DSA)机制，显著降低训练和推理成本。该模型通过Lightning Indexer计算索引得分，使用ReLU减少吞吐量，并采用Top-k Selector选取关键token计算注意力。训练采用两阶段策略：预训练阶段包含密集预热和稀疏训练，后训练阶段结合专家蒸馏和混合强化学习，将推理、智能体和人类对齐训练合并到单一RL阶段。

2025-09-30 11:02:02 546

原创 LLM推理训练加速概述

见–>量化基础。

2025-09-23 19:32:16 332

原创大模型相关概述

MoE负载均衡损失FP8混合精度训练GRPO强化训练蒸馏。

2025-09-22 00:03:41 239

原创多模态大模型相关概述

本文系统梳理了多模态大模型的关键技术与最新进展。首先介绍了视觉大模型基础架构ViT及其核心改进（MAE、DINO等），以及目标检测模型DETR和分割模型SAM系列。随后重点分析了多模态对齐模型CLIP、BLIP及其迭代版本BLIP-2，以及对话式模型LLaVA系列。最新模型方面，详细解读了MiniCPM-V 2.6的高分辨率处理方案，以及Qwen VL系列的三代演进，特别是Qwen2.5-VL引入的MRoPE位置编码和分阶段训练策略。文章呈现了多模态模型从基础架构到应用落地的技术发展脉络。

2025-09-20 18:37:09 769

原创量化基础概述

本文介绍了模型量化的基本概念、分类方法及相关工作。量化通过降低参数精度（如FP32到INT8/FP8）来减少显存占用和提升计算效率，核心是确定缩放因子和零点。量化分为后训练量化（PTQ）和量化感知训练（QAT）。

2025-09-20 10:14:09 592

原创强化学习概述

强化学习是一种通过agent与环境交互来最大化长期奖励的机器学习方法。其核心要素包括agent、环境、状态、动作和奖励机制。根据学习方式可分为on-policy和off-policy，根据模型可分为model-free和model-based。关键区别在于奖励函数反映即时收益，而价值函数（包括状态值函数和动作-状态值函数）衡量长期收益。贝尔曼方程为解决此问题提供了递归框架，其核心思想是将问题分解为阶段性子问题，并考虑时间对奖励价值的影响。

2025-09-18 11:39:35 396

原创 SATA: Spatial Autocorrelation Token Analysis for Enhancing the Robustness of Vision Transformers

这篇论文方法很巧妙，效果很显著，即插即用，不增加训练成本的同时，显著提高标准分类任务以及鲁棒性评估指标。整篇逻辑先提出问题，再拟出解决方案，最后是对方法的验证。行云流水，很自然！

2025-05-16 13:41:23 875 1

原创文献阅读工具--＞Adobe pdf + 有道词典

最近一直在考虑用什么文献阅读工具，，Adobe pdf的添加注释已经很好用了，使用了zotero，感觉不行（使用这一套组合拳，可以直接对pdf修改，然后可以很方便的多设备相互使用。：OneDrive一个PDF，那哪儿都能用，而且对设备和软件的依赖非常小。

2024-03-27 11:17:57 5269

原创万能近似定理

深度学习万能近似定理

2024-03-12 21:24:31 358

原创图床服务器--＞MinIO

最后我还是放弃了这个方案开通了阿里云ECS我只是有了一个公网IP，万一那天我不续费了，IP就失效了，进而blog的URL也就失效了，对于移植不是很方便。其实可以再买一个域名，IP变就变呗，但是说白了维护需要花时间。这个图床服务器界面太low了，不能所有图片全部预览（当然可能我并不知道其他隐藏trick）。

2024-02-27 21:09:55 755

原创 simple and useful command lines

pip list | grep package_name显示获取已安装包的信息（包名与版本号）pip show package_name能显示该安装的包的相关信息，其中包括它的安装路径。实际上包通常被安装在python安装目录下的lib\site-packages目录下where python显示python可执行文件的路径

2023-09-06 22:28:02 331

原创 STM32中EXTI和NVIC有别

参考：STM32中EXTI和NVIC的关系

2023-06-16 16:34:34 176

原创 sonar scanner配置

这里记录如何配置sonar scanner扫描C/C++项目代码。话不多说，先上。

2023-06-13 15:00:02 3403

原创 Git基本使用

记录一下Git的基本使用，以免以后到处找。

2023-06-13 14:18:48 229

原创开源证书种类

代码开源证书：Open Source Initiative

2023-06-09 10:13:47 196

原创 Linux和Windows系统对大小写的区分不同

Windows 和 Linux 区分大小写之间的差异

2023-06-06 10:41:31 303

原创 MSYS2 下载GCC

MSYS2 下载GCC

2023-05-29 10:46:06 429

原创 GNU Make安装

GNU Make安装

2023-05-29 10:11:08 2227

原创 Python pip 浅了解

Python pip在哪儿

2023-05-29 09:48:25 146

原创 Arduino IDE 安装板级支持包失败（Failed to install platform: arduino:avr.）

Failed to install platform: arduino:avr.

2023-05-29 09:16:56 1680

原创 Language Server Protocol

ref:

2023-05-24 15:58:36 256

原创 chocolatey--Windows上的包管理工具

ref:

2023-05-22 14:26:17 253

原创 Robot Framework学习及使用

很多人习惯用Robot Framework + Robot Framework-Ride来开发，但是于我而言我更喜欢VSCode + Python + Robot Framework.故此，他可以很好的支持Python，砸门的一些Python函数、库、类等等都可很方便的被它使用。其实Robot Framework官网已经有很详细的文档了，但是毕竟人家是英语的，对砸门还是不是很友好。然后，Run一下，你可以尝试一下如下几种方式。默认配置下，会生成如上三个测试结果文件。建一个文件test.robot，如上。

2023-05-19 16:44:55 748

SATA: Spatial Autocorrelation Token Analysis for Enhancing the Robustness of Vision Transformers

空空如也