自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 在pycharm中会自动检测代码test单词 从而自动进入测试模式

把Default test runner 设置为Unittests。

2025-12-03 20:35:04 196

原创 latex 编译错误及解决之Package natbib Error: Bibliography not compatible with author-year citations.

【代码】latex 编译错误及解决之Package natbib Error: Bibliography not compatible with author-year citations.

2025-10-21 18:48:10 115

原创 深入理解终端:从历史到实践的完整指南

终端(Terminal)是用户与计算机操作系统交互的命令行界面工具。它允许用户通过键入文本命令来控制计算机,而不是使用鼠标点击图形界面。终端是什么:命令行界面工具,通过文本命令控制计算机为何存在:效率、自动化、精确控制、远程操作主要类型:CMD(简单)、PowerShell(强大)、Bash(通用)应用场景:开发、系统管理、数据处理、DevOps选择建议:根据任务复杂度和个人熟悉程度选择。

2025-10-15 03:00:23 500

原创 遥感变化检测完全指南:从传统方法到基础模型的演进之路

变化检测的数据集可以按和。

2025-10-14 03:22:13 1124 1

原创 地球观测编程资源大全:从入门到精通的开发者宝典

作为地球观测领域的开发者,你是否曾经为找不到合适的工具而苦恼?是否想知道业界大牛都在用什么库和框架?这份精心策划的资源清单涵盖了从数据下载到深度学习的完整工具链,让你的遥感之旅不再孤单!

2025-10-14 03:15:25 765

原创 时空遥感遇上大模型!RS-STVLMs全景图谱震撼发布

💫:首个专注于遥感时空视觉-语言模型的综合性综述!从变化描述到智能问答,从Agent到基础模型,一网打尽!

2025-10-14 03:11:16 1083

原创 遥感领域的“GPT时刻“来了!最全RS-MLLMs资源汇总

💡:当ChatGPT席卷全球时,遥感领域也迎来了自己的多模态大模型革命!本文为你揭秘遥感+大模型的最新进展,附超全资源清单!

2025-10-14 03:06:10 929

原创 卫星遥感影像深度学习数据集终极指南

在人工智能与遥感技术深度融合的今天,获取高质量的卫星影像数据集成为了每个研究者和工程师的必修课。无论你是想用深度学习检测森林火灾、追踪城市扩张,还是监测海洋污染,这篇文章都将成为你的"数据宝藏地图"。

2025-10-14 03:02:12 1117

原创 卫星图像深度学习完全指南:从分类到基础模型的技术全景

深度学习已经彻底改变了卫星和航空影像的分析与解译方式,成功应对了超大图像尺寸和多样化目标类别等独特挑战。本文将全面介绍专门针对卫星和航空影像处理的深度学习技术,涵盖分类、分割、目标检测等关键任务的各种架构、模型和算法。传统遥感影像分析面临诸多挑战:深度学习通过以下方式应对这些挑战:图像分类是遥感数据分析中的基础任务,目标是为每张图像分配一个或多个语义标签,如"城市"、"森林"、"农田"等。1. 基于CNN的方法2. 基于Transformer的方法3. 注意力机制增强语义分割是将图像划分为具有语义意义

2025-10-14 02:52:39 1021

原创 遥感基础模型全景图谱:从视觉到多模态的技术演进

遥感基础模型正处于快速发展阶段,从早期的单模态自监督学习,到现在的多模态大语言模型,技术路线日趋成熟。随着**SkySense++**在Nature Machine Intelligence上的发表,以及众多CVPR 2025论文的涌现,该领域已经从"探索"走向"成熟"。✨ 更统一的多模态架构✨ 更强的泛化与迁移能力✨ 更广泛的实际应用落地。

2025-10-14 02:42:11 822

原创 TeXstudio 编译器详解:PdfLaTeX、LaTeX、XeLaTeX、LuaLaTeX、Latexmk 的区别与选择指南

LaTeX 文档需要通过编译器将.tex源文件转换为 PDF 等可阅读格式。不同的编译器在字体支持、编码处理、编译速度等方面各有特点。PdfLaTeX 是最传统、使用最广泛的 LaTeX 编译器,直接将.tex文件编译为 PDF 格式。传统的 LaTeX 编译器,先生成 DVI 文件,再转换为 PS 或 PDF 格式。XeLaTeX 是现代化的 LaTeX 编译器,原生支持 Unicode 和系统字体,特别适合多语言文档。LuaLaTeX 是最新的 LaTeX 编译器,内嵌 Lua 脚本语言,功能最强大。

2025-10-14 01:42:19 1180

原创 “构建并查看“和“编译“区别

构建并查看 通常会按顺序执行:编译 只执行:💡 日常使用推荐:

2025-10-12 08:03:30 294

原创 遥感图像深度学习数据集完全指南:2024-2025最新汇总

随着深度学习技术的飞速发展,遥感图像分析已成为计算机视觉领域的重要研究方向。从城市规划到环境监测,从农业管理到灾害评估,遥感AI正在改变我们观察和理解地球的方式。然而,高质量的数据集是训练优秀模型的基础。本文基于 satellite-image-deep-learning 开源项目,系统整理了500+个遥感深度学习数据集,涵盖分类、检测、分割、变化检测等多个任务类型,为研究人员和工程师提供一站式的数据集查询指南。数据特点:核心数据集:Sentinel-2专题数据集精选:2. Sentinel-1(S

2025-10-12 03:06:30 1965

原创 Token的未来:多模态与效率优化

真实世界的信息是多模态的——我们通过视觉、听觉、文字综合理解世界,AI也应该如此!:30秒语音 ≈ 375个tokens(音频)→ 50个tokens(文本):一张图片 ≈ 256个tokens(比想象中少!:上传图片比描述图片更省token!不同任务需要不同数量的tokens。用少量tokens"蒸馏"大量信息。Tokenizer本身也能学习!所有模态用统一的token表示。用文本作为"锚点"连接所有模态。把图像当作"视觉单词"的序列。固定token浪费资源。多层次Token表示。

2025-10-11 00:11:05 570

原创 Token经济学:为什么Token数量很重要?

✨Token = 金钱:直接影响运营成本✨Token = 速度:决定用户体验✨Token = 容量:限制应用能力✨优化ROI高:投入小,回报大。

2025-10-11 00:07:14 633

原创 Token是如何工作的?Tokenization全流程解析

Tokenization全流程│├─ 1. 预处理│ ├─ 空格归一化│ ├─ Unicode标准化│ └─ 特殊字符处理│├─ 2. 应用算法│ ├─ BPE(频率合并)│ ├─ WordPiece(概率合并)│ └─ Unigram(似然删除)│├─ 3. Token→ID映射│ ├─ 查词汇表│ └─ 特殊token处理│└─ 4. 生成Embedding├─ ID→向量└─ 语义表示✨三大算法:BPE(频率)、WordPiece(概率)、Unigram(似然)

2025-10-11 00:02:48 438

原创 深入浅出理解Token:大模型的“语言单位“

当我们输入"你好,世界!"这句话时,大模型看到的不是完整的句子,而是被切分成一个个小单位。这些小单位,就是Token。如果把语言比作乐高玩具,那么Token就是一块块乐高积木大模型通过组合这些"积木"来理解和生成文本不同的语言、不同的词汇,需要的"积木数量"各不相同✨Token是什么:大模型理解语言的基本单位,像乐高积木✨为什么重要:决定了模型的输入输出能力和使用成本✨关键差异:中文比英文消耗更多token✨实用价值:理解token有助于优化提示词、控制成本。

2025-10-10 23:59:07 501

原创 现代大模型优化技术详解:Flash Attention、KV Cache等

核心思想:用更少的比特表示权重和激活值原始模型(FP32):每个参数 = 32 bit = 4 bytes7B参数模型 = 7,000,000,000 × 4 = 28 GBINT8量化:每个参数 = 8 bit = 1 byte7B参数模型 = 7 GB节省:75%INT4量化:每个参数 = 4 bit = 0.5 bytes7B参数模型 = 3.5 GB节省:87.5%

2025-10-10 23:52:34 784

原创 位置编码原理深度解析:让Transformer理解词序的秘密

【代码】位置编码原理深度解析:让Transformer理解词序的秘密。

2025-10-10 23:46:15 249

原创 使用GPT/Claude API开发实战:智能文档问答系统

智能文档问答系统:上传文档(PDF/TXT/Markdown),AI自动理解内容并回答相关问题。应用场景企业知识库问答技术文档查询合同/报告分析学习资料辅导✓ 向量检索是关键:降低90%成本✓ 提示词工程很重要:决定回答质量✓ 成本监控不可少:避免预算超支✓ 错误处理要完善:提升用户体验。

2025-10-10 23:42:16 410

原创 RLHF技术详解:如何让AI更懂人类

同一个问题,不同的回答:GPT-3(未使用RLHF)用户:如何制作炸弹?GPT-3回答:制作炸弹需要以下材料:1. 硝酸铵...2. 燃料油...[继续详细说明]❌ 危险!直接提供有害信息ChatGPT(使用RLHF)用户:如何制作炸弹?ChatGPT回答:我不能提供制作爆炸装置的信息,因为这可能被用于危害他人。如果你对化学或工程感兴趣,我可以推荐一些安全的学习资源。如果你遇到了困难需要帮助,我可以提供心理健康资源。✅ 安全!拒绝有害请求并提供帮助关键差异:RLHF让模型学会了价值对齐。

2025-10-10 23:38:16 387

原创 提示工程完全指南:从入门到精通——让AI理解你的艺术

*提示工程(Prompt Engineering)**是一门通过精心设计输入文本(提示词),来引导大语言模型生成高质量输出的技术和艺术。传统编程:人 → 代码 → 计算机 → 结果提示工程:人 → 提示词 → AI模型 → 结果你的提示词 = 给AI的"编程指令"

2025-10-10 23:34:32 797

原创 深度解析Transformer:GPT、Claude等大模型的技术基石

"银行账户的余额不足,无法完成转账"银行(高度相关 ⭐⭐⭐⭐⭐)账户(高度相关 ⭐⭐⭐⭐)转账(相关 ⭐⭐⭐)的、无法(低相关 ⭐)这就是注意力机制!模型在处理每个词时,动态计算它与其他所有词的相关性。│ Transformer的三大核心 ││ 1. 自注意力机制 ││ → 捕获任意距离的语义关系 ││ ││ 2. 多头注意力 ││ → 并行学习多种语义关系 ││ ││ 3. 位置编码 ││ → 保留序列顺序信息 │。

2025-10-10 23:29:33 425

原创 AGI之路:我们离通用人工智能还有多远?

通用人工智能简单定义能够理解、学习和应用知识的AI系统,其智能水平可以匹敌或超越人类,能够完成人类能做的任何智力任务。

2025-10-10 23:21:09 987

原创 GPT vs Claude:两种AI哲学的碰撞

测试:给一篇10,000字的文章,要求总结GPT-4 Turbo(128K上下文)✅ 能处理✅ 总结准确⚠️ 有时会遗漏细节Claude 3(200K上下文)✅ 能处理更长文本✅ 抓住核心要点✅ 保留重要细节🎯 对长文档的处理更可靠结论:处理长文档时,Claude更有优势。最经济实惠🥇 Claude 3 Haiku(简单任务)🥈 GPT-3.5 Turbo(通用任务)最佳平衡🥇 Claude 3.5 Sonnet(高质量+合理价格)🥈 GPT-4o(速度+性能)

2025-10-10 23:15:06 840

原创 GPT家族进化史:从1亿到万亿参数的疯狂之旅

OpenAI在5年内通过GPT系列模型证明了"规模就是一切"的AI发展真理。从2018年1.17亿参数的GPT-1,到2024年万亿参数级的GPT-4o,模型性能随规模增长呈现指数级提升。关键里程碑包括:GPT-2(2019)展现零样本学习能力,GPT-3(2020)实现few-shot学习突破,ChatGPT(2022)凭借对话式交互引爆全球,GPT-4(2023)在多模态和推理能力上接近人类水平。每次迭代都伴随着参数量、训练数据和计算成本的数十倍增长,同时OpenAI通过RLHF等技

2025-10-10 23:05:52 915

原创 一篇论文如何改变AI的命运

技术RNN/LSTM处理方式串行✅ 并行长距离依赖❌ 衰减✅ 直接连接训练速度慢✅ 快10-100倍可扩展性❌ 受限✅ 易扩展计算复杂度O(n)❌ O(n²)2017年的那篇论文,不只是提出了一个新架构,更是开启了一个新时代。Transformer的意义🔬 科学层面:证明了注意力机制的有效性🏗️ 工程层面:让大规模模型训练成为可能🌍 社会层面:让AI从实验室走向千家万户今天,当你用ChatGPT写文章用搜索引擎找信息用翻译软件看外文用Copilot写代码。

2025-10-10 22:58:02 406

原创 从图灵测试到ChatGPT:大模型的70年进化史

从图灵的天才预言,到今天我们与AI自然对话,人类走过了70年。我们经历过狂热的乐观也经历过绝望的寒冬但从未放弃过对智能的追求今天,我们站在一个激动人心的时刻学生用它辅助学习程序员用它提升效率作家用它激发灵感医生用它辅助诊断但这不是终点,而是新的起点。也许10年后,我们会回头看2025年,就像今天回看2015年一样,感叹:"那时的AI还这么'笨'啊!

2025-10-10 22:52:08 813

原创 遥感VLM的Prompt工程完全指南

文章摘要: 本文系统探讨了如何通过优化提示词(Prompt)设计提升遥感视觉语言模型(VLM)的零样本分类性能。核心内容包括:1. Prompt工程基础,强调提问方式直接影响模型输出质量,通过示例展示精准描述可使准确率提升26%;2. 遥感领域Prompt设计四原则:明确卫星/航拍视角、嵌入关键视觉特征(如机场跑道)、使用专业术语(如NDVI)、量化描述优于定性;3. 模板设计技巧,提出分类任务的标准结构(视角+对象+特征+上下文)和层次化设计方法,复杂场景下准确率提升11%;

2025-10-09 10:35:01 756

原创 遥感视觉语言大模型:预训练策略深度解析

🚀本文深入探讨遥感VLM的两大核心预训练策略:对比学习与掩码建模。

2025-10-09 10:29:19 673

原创 遥感视觉语言大模型入门指南(三):多模态融合与实战应用

无需任何训练样本,仅通过文本描述就能识别新类别。

2025-10-09 10:19:56 1128

原创 遥感视觉语言大模型入门指南(二):技术原理深度解析

视觉语言模型是一种能够同时处理和理解图像与文本的AI系统,它将视觉信息和语言信息映射到同一个语义空间中。核心能力跨模态理解:理解图像和文本之间的语义关联跨模态检索:用文本搜索图像,或用图像搜索文本零样本学习:无需训练即可识别新类别多模态生成:根据图像生成描述,或根据描述生成图像核心思想:通过对比正样本和负样本来学习特征表示。直观理解正样本:语义相关的图像-文本对,应该在特征空间中靠近负样本:语义无关的图像-文本对,应该在特征空间中远离类比:就像学习识别人脸同一个人的不同照片应该相似(正样本)

2025-10-09 10:08:21 635

原创 遥感视觉语言大模型入门指南(一):遥感图像的独特性深度解析

遥感视觉语言模型(Remote Sensing Vision-Language Model, RS-VLM)理解遥感图像的视觉内容关联遥感图像与自然语言描述执行检索、分类、描述生成等任务利用遥感领域的专业知识遥感(Remote Sensing)是指不直接接触目标物体,通过传感器获取目标物体信息的技术。Landsat系列(美国)空间分辨率:30m(多光谱)、15m(全色)光谱波段:11个波段重访周期:16天数据免费开放Sentinel-2(欧空局)

2025-10-09 10:01:16 792

原创 伪标签与自训练:让模型成为自己的老师

成功的配方1. 强噪声正则化(最关键)输入噪声:RandAugment + CutOut模型噪声:Dropout + Stochastic Depth训练噪声:大学习率 + 不平衡采样2. 学生比教师大(1.5-2倍参数)足够容量从噪声中学习3. 迭代训练(3-4轮)每轮都提升滚雪球效应4. 海量无标注数据数量级:标注数据的100-1000倍5. 长时间训练需要足够时间从噪声中收敛缺一不可:去掉噪声 → 提升从2.0%降到0.5%

2025-10-09 08:18:56 979

原创 对比学习深度解析:让AI学会“物以类聚,人以群分“

想象你在教一个孩子认识动物:传统监督学习的方式:对比学习的方式:这就是**对比学习(Contrastive Learning)**的核心思想:在过去5年中,对比学习彻底改变了无监督学习和半监督学习的格局,催生了SimCLR、MoCo、CLIP等突破性工作。今天,让我们深入理解这个强大的技术。问题:什么是好的特征表示?糟糕的特征空间:理想的特征空间:数学表达:1.2 正样本对与负样本对对比学习的关键概念:正样本对(Positive Pair):负样本对(Negativ

2025-10-09 08:04:47 935

原创 数据增强技术深度解析:从传统到混合增强的演进

2012-2015:经典增强时代- 翻转、旋转、裁剪- 简单但有效- 人工设计2016-2018:混合增强崛起- Mixup:线性混合- CutOut:随机遮挡- 突破单张图像限制2019-2020:自动化与专业化- AutoAugment:AI找增强- RandAugment:简化自动化- Mosaic:任务专用增强2021至今:自适应与高效- 根据数据动态调整- 元学习增强策略- 与模型架构协同设计。

2025-10-09 07:58:05 647

原创 一致性正则化深度解析:半监督学习的核心武器

摘要:一致性正则化是半监督学习的核心技术,核心思想是强制模型对输入扰动保持预测一致。从2017年的Π-Model到2020年的FixMatch,该技术经历了多次演进:Π-Model通过Dropout扰动实现一致性;Temporal Ensembling引入历史预测;Mean Teacher采用教师-学生框架;UDA引入强数据增强;FixMatch简化流程,仅使用弱增强生成伪标签+强增强强制执行一致性。实验表明,置信度阈值0.95能平衡伪标签质量和数据利用率。该技术使模型在少量标注数据下接近全监督性能,如CI

2025-10-09 07:50:21 707

原创 为什么需要半监督学习?深度学习的标注困境与破局之道引言:一个价值百万的问题

为什么需要半监督学习?│ ││ 深度学习的困境: ││ ✗ 监督学习需要海量标注(成本高昂) ││ ✗ 无监督学习性能不足(实用性差) ││ ││ 半监督学习的破局: ││ ✓ 少量标注(5-10%)引导方向 ││ ✓ 大量无标注数据提供泛化能力 ││ ✓ 达到监督学习90-95%的性能 ││ ✓ 成本降低80-95% ││ │。

2025-10-09 07:44:41 843

原创 彻底解决Springer LaTeX模板表格错误:Missing \endgroup inserted in tabular

endgroup对于包含多列数据的表格,始终使用table*而非table用\centering命令替代环境确保\multirow注意\scalebox和\resizebox的大括号配对在 Springer 模板中,\caption应该在\centering之前错误看似复杂,但本质上是 Springer 模板对表格浮动体的特殊处理机制导致的。通过将宽表格从table改为table*,并优化嵌套结构,可以彻底解决这个问题。希望本文能帮助你顺利完成论文排版!如果还有问题,欢迎在评论区讨论。

2025-10-09 06:36:38 997

原创 TeXstudio完整安装配置教程(2025最新版)

至此,你已经完成了TeXstudio的完整安装和配置!现在你可以:✅ 使用TeXstudio编写LaTeX文档✅ 正确编译中英文混排的文档✅ 掌握基本的编辑和配置技巧LaTeX的学习曲线较陡,但一旦掌握,你会发现它在学术写作中的强大之处。建议从简单的文档开始练习,逐步掌握更高级的功能。祝你LaTeX写作顺利!如果有任何问题,欢迎在评论区留言交流。关键词:TeXstudio安装、LaTeX环境配置、中文LaTeX、TeX Live、学术论文写作更新日期:2025年10月。

2025-10-08 04:29:25 2359

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除