- 博客(61)
- 收藏
- 关注
原创 cursor+cline+MCP(论文agent)
本文介绍了多款工具软件的安装配置方法。首先说明使用pip安装uv工具,并给出清华镜像源地址。然后介绍cursor、vscode和cline三款编辑器的安装方式。重点讲解了arXiv和Google Scholar两种MCP服务器的安装步骤,包括GitHub项目地址。最后详细展示了为cursor/cline配置MCP服务器的YAML文件示例,包含命令路径、运行参数和自动审批规则等关键配置项。全文提供了完整的工具链安装和配置指南。
2025-12-12 22:28:55
168
原创 自然语言概述
本文概述了自然语言处理中的关键技术与模型发展。首先介绍了BPE、BBPE和WordPiece等分词算法,然后回顾了N-Gram等传统语言模型。随后详细分析了RNN、LSTM和GRU等循环神经网络的结构与优化,包括LSTM的输入门、遗忘门和输出门机制。接着讨论了BERT和GPT系列模型的演进,从GPT-1到GPT-3的规模扩展,以及InstructGPT引入的RLHF方法。最后简要提及了当前大语言模型(LLM)的发展趋势。全文系统梳理了NLP领域从基础分词到前沿大模型的技术脉络。
2025-10-07 21:36:45
956
原创 语义分割概述
本文概述了图像分割领域的核心技术与主要模型框架。首先介绍了卷积模式、三大分割任务(语义/实例/全景)及转置卷积原理。随后重点分析了FCN、U-Net、PSPNet等经典模型:FCN通过全卷积结构实现任意尺寸输入,采用转置卷积上采样和Skip结构融合多尺度特征;U-Net针对医学图像数据稀缺问题,设计了对称的编码器-解码器结构,并引入弹性变形数据增强和加权交叉熵损失;PSPNet通过金字塔池化模块捕获多尺度上下文信息,显著提升复杂场景理解能力。
2025-10-05 00:06:57
640
原创 目标检测概述
目标检测技术发展综述 本文系统梳理了目标检测领域的主要技术发展脉络。从早期基于区域提议的方法(如RCNN系列)到单阶段检测器(如YOLO、SSD),再到基于Transformer的端到端检测方法(如DETR),以及结合视觉语言模型的多模态方法(如GLIP、Grounding DINO)。重点介绍了各代表性模型的架构特点和关键技术,包括锚框机制、NMS、RoI Pooling、RPN网络等基础组件,并分析了不同方法间的演进关系。同时概述了当前前沿的多模态大语言模型(MLLM)在目标检测中的应用趋势。
2025-10-03 22:22:52
1151
1
原创 GraphRAG概述
是知识图谱中的基本构成单元,用于描述实体之间的关系或实体的属性。),形式为**<主体,谓词,宾语>**,在知识图谱中表现为节点和边的结构,其中节点代表实体或概念,边代表实体间的关系或实体的属性。:例如,<特朗普,职业,美国总统>,其中“特朗普”是实体,“职业”是属性,“美国总统”是属性值。:例如,<北京,是首都,中国>,其中“北京”和“中国”是实体,“是首都”是它们之间的关系。”的三元组结构,构建出复杂的知识网络,从而支持高效的信息检索、语义理解和推理。是一种基于图结构的语义网络,用于表现现实世界中的。
2025-09-30 17:23:41
339
原创 DeepSeek-V3.2-Exp浅析
DeepSeek-V3.2-Exp在V3.2-terminus基础上引入基于MQA的稀疏注意力(DSA)机制,显著降低训练和推理成本。该模型通过Lightning Indexer计算索引得分,使用ReLU减少吞吐量,并采用Top-k Selector选取关键token计算注意力。训练采用两阶段策略:预训练阶段包含密集预热和稀疏训练,后训练阶段结合专家蒸馏和混合强化学习,将推理、智能体和人类对齐训练合并到单一RL阶段。
2025-09-30 11:02:02
546
原创 多模态大模型相关概述
本文系统梳理了多模态大模型的关键技术与最新进展。首先介绍了视觉大模型基础架构ViT及其核心改进(MAE、DINO等),以及目标检测模型DETR和分割模型SAM系列。随后重点分析了多模态对齐模型CLIP、BLIP及其迭代版本BLIP-2,以及对话式模型LLaVA系列。最新模型方面,详细解读了MiniCPM-V 2.6的高分辨率处理方案,以及Qwen VL系列的三代演进,特别是Qwen2.5-VL引入的MRoPE位置编码和分阶段训练策略。文章呈现了多模态模型从基础架构到应用落地的技术发展脉络。
2025-09-20 18:37:09
769
原创 量化基础概述
本文介绍了模型量化的基本概念、分类方法及相关工作。量化通过降低参数精度(如FP32到INT8/FP8)来减少显存占用和提升计算效率,核心是确定缩放因子和零点。量化分为后训练量化(PTQ)和量化感知训练(QAT)。
2025-09-20 10:14:09
592
原创 强化学习概述
强化学习是一种通过agent与环境交互来最大化长期奖励的机器学习方法。其核心要素包括agent、环境、状态、动作和奖励机制。根据学习方式可分为on-policy和off-policy,根据模型可分为model-free和model-based。关键区别在于奖励函数反映即时收益,而价值函数(包括状态值函数和动作-状态值函数)衡量长期收益。贝尔曼方程为解决此问题提供了递归框架,其核心思想是将问题分解为阶段性子问题,并考虑时间对奖励价值的影响。
2025-09-18 11:39:35
396
原创 SATA: Spatial Autocorrelation Token Analysis for Enhancing the Robustness of Vision Transformers
这篇论文方法很巧妙,效果很显著,即插即用,不增加训练成本的同时,显著提高标准分类任务以及鲁棒性评估指标。整篇逻辑先提出问题,再拟出解决方案,最后是对方法的验证。行云流水,很自然!
2025-05-16 13:41:23
875
1
原创 文献阅读工具-->Adobe pdf + 有道词典
最近一直在考虑用什么文献阅读工具,,Adobe pdf的添加注释已经很好用了,使用了zotero,感觉不行(使用这一套组合拳,可以直接对pdf修改,然后可以很方便的多设备相互使用。:OneDrive一个PDF,那哪儿都能用,而且对设备和软件的依赖非常小。
2024-03-27 11:17:57
5269
原创 图床服务器-->MinIO
最后我还是放弃了这个方案开通了阿里云ECS我只是有了一个公网IP,万一那天我不续费了,IP就失效了,进而blog的URL也就失效了,对于移植不是很方便。其实可以再买一个域名,IP变就变呗,但是说白了维护需要花时间。这个图床服务器界面太low了,不能所有图片全部预览(当然可能我并不知道其他隐藏trick)。
2024-02-27 21:09:55
755
原创 simple and useful command lines
pip list | grep package_name显示获取已安装包的信息(包名与版本号)pip show package_name能显示该安装的包的相关信息,其中包括它的安装路径。实际上包通常被安装在python安装目录下的lib\site-packages目录下where python显示python可执行文件的路径
2023-09-06 22:28:02
331
原创 Arduino IDE 安装板级支持包失败(Failed to install platform: arduino:avr.)
Failed to install platform: arduino:avr.
2023-05-29 09:16:56
1680
原创 Robot Framework学习及使用
很多人习惯用Robot Framework + Robot Framework-Ride来开发,但是于我而言我更喜欢VSCode + Python + Robot Framework.故此,他可以很好的支持Python,砸门的一些Python函数、库、类等等都可很方便的被它使用。其实Robot Framework官网已经有很详细的文档了,但是毕竟人家是英语的,对砸门还是不是很友好。然后,Run一下,你可以尝试一下如下几种方式。默认配置下,会生成如上三个测试结果文件。建一个文件test.robot,如上。
2023-05-19 16:44:55
748
原创 Solved: STM32 core is locked up / STM32内核被锁
STM32 core is locked up / STM32 内核被锁
2023-05-08 10:16:11
2969
原创 scrcpy非常好使的投屏工具
ref:https://blog.youkuaiyun.com/was172/article/details/99705855
2023-04-13 15:58:13
177
原创 Useful VSCode shortcuts
快速查找文件中的指定标识。快速查找command。进入Zen Mode。退出Zen Mode。查到当前文件中的内容。
2023-01-16 11:57:57
157
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅