双木的木-优快云博客

原创 Coursera吴恩达《深度学习》课程总结（全）

01 神经网络和深度学习（Neural Networks and Deep Learning）1-1 深度学习概论主要介绍：主要对深度学习进行了简要概述。首先，我们使用房价预测的例子来建立最简单的单个神经元组成的神经网络模型。然后，我们将例子复杂化，建立标准的神经网络模型结构。接着，我们从监督式学习入手，介绍了不同的神经网络类型，包括Standard NN，CNN和RNN。不同的神经网络模型适合处理不同类型的问题。对数据集本身来说，分为结构化数据和非结构化数据。近些年来，深度学习对非结构化数据的处理

2021-09-24 19:01:44 45618 5

原创 python | rauth，一个有趣的 Python 库！

rauth是一个专注于OAuth认证的轻量级Python库，它通过简洁的API设计大大简化了OAuth 1.0/1.0a和OAuth 2.0的实现复杂度。相比于手动处理OAuth协议的各种细节，rauth提供了开箱即用的解决方案，让开发者能够快速集成第三方登录和API授权功能。该库不仅支持Twitter、GitHub、Facebook等主流服务，还具备良好的扩展性，可以轻松对接自定义OAuth服务。通过封装token获取、签名生成、会话管理等底层操作，rauth让开发者能够专注于业务逻辑而非认证细节。

2025-11-24 17:11:56 350

原创集智书童 | MoIIE打破三阶段魔咒 | 模态内外专家混合+两阶段训练，激活5.5B参数反超密集LVLM

摘要：本文提出混合模态内和模态间专家模型（MoIIE），通过构建视觉、语言和跨模态三个专家组，有效平衡模态特定特征学习和跨模态关联建模。创新性地采用两阶段训练策略，简化传统三阶段流程，实现多模态微调与稀疏化的联合优化。实验表明，MoIIE在13个多模态基准测试中表现优异，激活参数量仅5.5B/11.3B即超越现有模型，尤其在知识问答和幻觉测试中优势显著。该模型展现出良好的扩展性，但存在训练数据有限和模态覆盖不足的局限性。

2025-11-24 17:10:17 521

原创马哥Linux运维 | Prometheus 告警规则生产级配置：50+ 核心指标与最佳实践(四)

本文介绍了Prometheus告警规则的最佳实践，包括50+核心指标配置与常见问题解答。主要内容涵盖：1) Prometheus与其他监控工具(Zabbix/Nagios)的区别；2) Recording Rules的性能优化作用；3) 告警疲劳的解决方案；4) 数据保留策略建议；5) Kubernetes集群监控方法；6) PromQL查询优化技巧；7) 高可用部署方案。文章还提供了自动化部署脚本、健康检查脚本和扩展阅读资源，帮助用户快速构建生产级监控系统。

2025-11-21 19:15:00 1374

原创马哥Linux运维 | Prometheus 告警规则生产级配置：50+ 核心指标与最佳实践(三)

本文介绍了Prometheus告警规则的生产级配置与最佳实践，涵盖50+核心指标监控方案。主要内容包括：常见故障排查流程（告警未触发/发送、指标采集失败等）、高基数标签处理方法、变更灰度策略与回滚机制、自动化备份脚本实现。最佳实践部分重点阐述告警规则设计原则（添加for持续时间、Runbook链接）、避免高基数标签技巧、RecordingRules优化复杂查询、告警抑制配置防止风暴、定期故障演练方案、维护窗口静默规则设置，以及大规模场景下的联邦集群架构配置。文章提供了详细的诊断命令和解决方案，帮助运维人员构

2025-11-21 19:00:00 554

原创马哥Linux运维 | Prometheus 告警规则生产级配置：50+ 核心指标与最佳实践(二)

本文介绍了Prometheus告警规则的最佳实践，包括其核心工作机制与性能优化策略。主要内容涵盖：1）PromQL查询引擎的执行流程与时间序列数据模型；2）告警状态转换机制及for参数的意义；3）Alertmanager的分组、抑制等告警处理流程；4）Prometheus自监控指标与关键告警规则示例；5）性能测试方法及调优建议，如调整抓取间隔、WAL压缩等参数。通过50+核心指标的监控实践，帮助运维人员构建稳定高效的告警体系，平衡响应速度与误报率。文章还提供了完整的性能基准测试方案与典型场景下的资源消耗数据

2025-11-20 17:48:19 1233

原创马哥Linux运维 | Prometheus 告警规则生产级配置：50+ 核心指标与最佳实践(一)

本文介绍了Prometheus监控系统的生产级部署方案，包括适用场景、反模式警告、环境版本矩阵等。详细讲解了NodeExporter安装、Prometheus配置、告警规则设置和Alertmanager集成，提供完整的实施步骤和验证方法。文章强调适用于云原生和微服务监控环境，推荐8C16G配置支持10K+时间序列，并指出不适用于小规模环境或需要自动修复的场景。附有快速清单和关键脚本，帮助用户快速搭建完整的监控告警系统。

2025-11-20 17:47:26 615

原创 OpenCV与AI深度学习 | 视觉大模型在笔记本工件检测识别领域的运用

本文探讨了利用视觉大模型技术改进笔记本电脑零件检测的方法。针对传统人工检测存在的效率低、适应性差、结果不稳定等问题，介绍了DaoAIWorld深度学习平台通过语义分割模型实现自动化检测的解决方案。该方案使用包含863张图像、1752组标注的数据集进行训练，能准确识别螺丝缺失、线缆歪斜等5类缺陷，模型精度达到85%。实际应用显示该方法可显著提高检测效率和准确性，降低生产成本。文章验证了深度学习在笔记本零件检测中的有效性，展示了工业智能化检测的应用前景。

2025-11-19 17:41:16 629

原创 AI生成未来 | 新加坡国立等发布WEAVE：首个上下文交错式跨模态理解与生成全套解决方案

摘要：WEAVE是首个面向多轮上下文感知跨模态理解与生成的研究体系，包含WEAVE-100k数据集（10万样本/37万轮对话/50万图像）和WEAVEBench人工标注基准。研究表明，基于WEAVE-100k的训练能显著提升模型性能（MMMU提升9.8%，GEditBench提升4.8%），并激发视觉记忆能力涌现。但WEAVEBench评估显示，现有模型在多轮上下文感知生成方面仍存在明显局限。该研究为多模态理解与生成领域提供了重要基准和发展方向。

2025-11-19 17:40:30 1147

原创 Coggle数据科学 | 小白学大模型：Tongyi DeepResearch 系列Agent

本文介绍了多款智能体大语言模型的研发成果及技术突破，包括TongyiDeepResearch、WebWalker、WebDancer、WebSailor等。这些模型通过创新框架设计（如多智能体协作、动态规划等）和训练方法（如强化学习、数据合成管线），显著提升了网络信息检索、多模态推理和长程探索能力。其中WebWatcher引入视觉语言推理，WebResearcher提出迭代研究范式，WebWeaver采用双智能体框架动态优化研究流程，ReSum通过周期性摘要突破上下文限制。

2025-11-18 15:00:00 847

原创 AI生成未来 | 一步直接封神！单步扩散媲美250步教师模型！中科大&字节发布图像生成“分层蒸馏术”

本文提出分层蒸馏(HD)框架以解决单步扩散模型保真度问题。通过理论分析揭示了轨迹蒸馏(TD)在保留全局结构时会损失细节，因此设计了包含两阶段的方案：先利用TD注入结构先验，再通过分布匹配优化细节。创新性地提出自适应加权判别器(AWD)，动态聚焦局部伪影指导优化。实验表明该方法在ImageNet256×256上取得FID 2.26，媲美250步教师模型，推理速度提升70倍。该工作为高效高保真单步生成提供了新范式。

2025-11-18 14:45:00 1077

原创数据派THU | 从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解

本文介绍了使用PyTorch实现3D高斯泼溅(3DGS)技术的方法。3DGS已成为3D视觉领域的重要技术，被NVIDIA和Meta等公司应用于产品中。文章详细讲解了如何用数百行PyTorch代码实现3DGS的核心部分，包括场景表示、渲染流程和球谐函数等关键技术。3DGS将场景表示为可微的各向异性3D高斯分布，并通过两个主要阶段进行渲染：预处理阶段完成高斯投影和排序，渲染阶段执行volume rendering。文章还探讨了球谐函数用于表示视角相关颜色，并提供了完整代码实现。

2025-11-17 17:36:54 1381

原创周报 | 25.11.10-25.11.16文章汇总

本周技术文章汇总涵盖多个AI热点领域：1）图像技术方面，对比了CLIP、EfficientNet等5种图像相似性搜索算法，介绍了MobileViCLIP在移动设备视频理解上的突破；2）智能体专题发布上下两篇入门指南及《Hello-Agents》学习项目；3）创新应用包括火灾检测数据集、工业异常检测预训练方法ADPretrain及无人机轻量检测网络LUD-YOLO；4）开发工具推荐了iRedis库和ClaudeAgentSDK使用指南。文章来自优快云等技术社区，涵盖算法研究、应用实践及工具教程。

2025-11-17 17:35:30 370

原创计算机视觉研究院 | LUD-YOLO：一种用于无人机的新型轻量级目标检测网络

本文来源公众号，仅用于学术分享，侵权删，干货满满。亮点：专为无人机打造的轻量级目标检测网络 LUD - YOLO。提出全新特征融合模式，以解决特征交互退化问题。推出新型特征提取模块，提升推理速度。对模型进行轻量化调整，克服了在无人机应用中的不足。对比结果表明，LUD - YOLO 性能优于其他 10 种同类模型。

2025-11-15 19:16:39 819

原创皮皮克克 | OpenCV 案例【1】人脸检测

本文来源公众号，仅用于学术分享，侵权删，干货满满。说来惭愧，诸位！最近一直没更新......有诸多原因，但，最烦人的莫过于，一直在加班搬砖可曾想，今年5月31号那天晚上，为了赶项目进度，我一个人通宵加班，真的是身心俱疲，力不从心！第二天早上7点多才从公司出来，那天早上，抬头看着旭日，只有一声轻叹：真 ji er 累啊！所以，请诸君见谅。小编我虽晚必到。前面的系列，讲的是 Shell 脚本相关案例，比较常用，倒也不难。后面，小编准备新开一个系列，给大家带来OpenCV的实战案例，

2025-11-15 19:15:04 489

原创 python | iredis，一个超强的 Python 库！

Redis增强工具iRedis提供智能补全、语法高亮等现代化功能，显著提升Redis命令行操作体验。作为完全兼容redis-cli的交互式客户端，iRedis支持所有Redis数据操作、集群模式及Lua脚本，并通过多行编辑、命令提示等特性优化开发效率。其安装便捷（pip install iredis），具备管道批量操作能力，输出格式友好，是传统redis-cli的理想替代方案。无论是日常开发还是复杂运维，iRedis都能提供更高效、更直观的Redis操作体验。

2025-11-14 16:40:05 1040

原创 Datawhale | 《Hello-Agents》项目正式发布，一起从零学习智能体！(内有github学习地址!)

《Hello-Agents：从零构建AI原生智能体系统》摘要 Datawhale社区推出系统性智能体教程Hello-Agents，聚焦AI原生Agent开发（非工程类Agent）。项目分为五阶段：基础理论→框架构建→核心技术→综合案例→毕业设计，涵盖ReAct范式、记忆系统、多Agent协作等核心内容，配套旅行助手、赛博小镇等实战项目。通过学习，开发者可从LLM使用者进阶为智能体系统构建者，掌握自研框架、训练评估等全流程能力。项目提供完整代码与社区支持，适合具备Python和LLM基础的学习者。开源地址：g

2025-11-14 16:23:39 993

原创极市平台 | NeurIPS 2025 | 上交大、南农大提出ADPretrain：为工业异常检测量身打造的预训练“超能力”

上海交大与南京农大提出ADPretrain框架，专为工业异常检测定制预训练。该方法通过残差特征剥离类别信息，并设计角度-范数双对比损失，显著提升了异常检测性能。实验显示，该方法在MVTecAD等数据集上使PatchCore、UniAD等模型的AUROC平均提升20+个百分点。该工作突破了传统ImageNet预训练在工业场景的局限性，为领域特定预训练提供了新思路。

2025-11-13 17:33:41 748 1

原创 Coggle数据科学 | 小白学大模型：Claude Agent SDK 使用指南

Anthropic推出Claude Agent SDK，为开发者提供构建生产级AI智能体的工具包。该SDK基于Claude Code的核心技术，具备上下文管理、丰富工具生态、细粒度权限控制等关键功能。支持Python和TypeScript开发，提供两种交互模式：一次性查询和持续会话。SDK还包含会话管理、自定义工具扩展、子智能体协作等高级特性，适用于编码助手、业务代理等多种应用场景。开发者可通过pip或npm快速安装，实现高效AI智能体开发。

2025-11-13 17:32:57 1229

原创码科智能 | 传统的火灾检测任务过时了？一个开源的大规模多模态火灾理解数据集来了：场景全覆盖、全风险等级

介绍首个面向多模态大模型的大规模火灾理解数据集DetectiumFire。该数据集包含2.25万张图像和2500个视频，突破传统火灾检测仅提供边界框标注的局限，创新性地采用专家级文本描述标注，并引入8000多张合成数据。数据集覆盖室内外多种火灾场景，包含高低风险火源，有效提升AI对火灾场景的细粒度理解能力。实验显示，基于该数据集训练的模型能显著降低误报率，并实现燃烧物识别、环境评估等高级推理功能。相关论文和数据已公开发布在arXiv和Kaggle平台。

2025-11-12 21:06:47 919

原创集智书童 | MobileViCLIP横空出世：55倍速度碾压InternVideo2-L14，移动设备视频文本理解首次超越云端

本文提出首个适用于移动设备的高效视频文本模型MobileViCLIP。针对现有视频预训练模型计算复杂度高、难以部署的问题，作者通过改造轻量级图像文本模型MobileCLIP，引入时空重混器和时空注意力模块增强时序建模能力。实验表明，MobileViCLIP-Small在MSR-VTT等数据集上保持与ViT-L14相当性能的同时，移动端推理速度提升55.4倍，参数和计算量显著降低。模型在动作识别、时序定位等下游任务也展现优秀泛化能力。研究还对模块延迟进行深入分析，为移动端视频模型设计提供重要参考。这项工作实现

2025-11-12 21:03:34 776

原创周报 | 25.11.3-25.11.9文章汇总

本周技术周报涵盖多个热门领域：编程经验分享（资深程序员心得）、AI技术前沿（AIAgent类型分析、图像编辑突破）、竞赛方案（大模型金融预测Top3）、工具推荐（Clerk、Orator库）、系统优化（MySQL慢查询调优）以及计算机视觉深度解析。亮点包括：天大&快手图像编辑四行代码实现、字节文本生成图像新范式、港科大端到端电影生成技术。同时推荐了10个实用Python项目仓库和机器学习预测库mlforecast。

2025-11-11 17:37:50 192

原创江大白 | 5款图像相似性搜索算法全面对比，CLIP、EfficientNet 、ViT、DINO-v2、BLIP-2！

本文对比了五种深度模型（EfficientNet、ViT、DINO-v2、CLIP和BLIP-2）在Flickr30k数据集上的图像语义理解表现。通过特征提取和Faiss相似性搜索实验发现：传统CNN模型EfficientNet侧重像素特征，ViT改进有限；基于自监督的DINO-v2能有效捕捉前景物体语义；多模态模型CLIP易受文字信息干扰，而BLIP-2综合表现最佳，尤其在理解复杂场景语义方面优势明显。研究建议根据任务需求选择模型。

2025-11-11 17:34:09 1107

原创 Datawhale | 关于智能体（AI Agent）入门，一篇超详细的总结-下！（建议收藏）

它本质上是一个精确的、静态的流程图，规定了在何种条件下、以何种顺序执行哪些操作。一个典型的案例：某企业的费用报销审批流程。员工提交报销单（触发）-> 如果金额小于500元，直接由部门经理审批 -> 如果金额大于500元，先由部门经理审批，再流转至财务总监审批 -> 审批通过后，通知财务部打款。整个过程的每一步、每一个判断条件都被精确地预先设定。与工作流不同，基于大型语言模型的智能体是一个。

2025-11-10 17:41:30 874

原创 Datawhale | 关于智能体（AI Agent）入门，一篇超详细的总结-上！（建议收藏）

在探索任何一个复杂概念时，我们最好从一个简洁的定义开始。在人工智能领域，智能体被定义为任何能够通过传感器（Sensors）感知其所处环境（Environment），并自主地通过执行器（Actuators）采取行动（Action）以达成特定目标的实体。这个定义包含了智能体存在的四个基本要素。环境是智能体所处的外部世界。对于自动驾驶汽车，环境是动态变化的道路交通；对于一个交易算法，环境则是瞬息万变的金融市场。智能体并非与环境隔离，它通过其传感器持续地感知环境状态。摄像头、麦克风、雷达或各类。

2025-11-10 17:40:55 1364

原创 AI生成未来 | 导演之魂，端到端电影制作更进一步！港科大&蚂蚁等最新HoloCine一键生成完整电影场景

HoloCine框架实现了文本到多镜头视频的整体生成，通过窗口交叉注意力机制实现精确导演控制，并用稀疏镜头间自注意力降低计算成本。该模型在40万样本数据集上训练后，能够生成角色一致、叙事连贯的分钟级视频，具备跨镜头记忆能力和精准的镜头控制。实验表明其在转场控制、一致性等指标上超越现有方法，但与人类导演相比在因果推理上仍存在局限。该研究为自动化电影制作提供了新思路。

2025-11-09 00:45:00 781

原创 python | mlforecast，一个强大的 Python 库！

本文介绍了Python时间序列预测库mlforecast，由Nixtla团队开发，能高效处理大规模数据并自动生成时间特征。安装简单，支持与主流机器学习库集成。核心特性包括高性能处理、自动特征工程和多模型支持。示例展示了单序列预测、多特征预测、批量多序列预测及交叉验证评估。mlforecast通过简化复杂的时间序列建模流程，为销售预测、库存管理等场景提供准确高效的解决方案。

2025-11-09 00:30:00 958

原创 python | orator，一个非常 nice 的 Python 库！

Orator是一个受Laravel Eloquent启发的Python ORM库，提供ActiveRecord实现和流畅的查询API。支持MySQL、PostgreSQL和SQLite等数据库，具有模型关系管理、数据库迁移、查询作用域和软删除等功能。通过简单的配置即可连接数据库，使用链式调用执行CRUD操作，支持一对一、一对多等关系定义。高级特性包括预加载关联数据、封装查询条件的作用域方法，以及通过SoftDeletes混入实现逻辑删除。

2025-11-08 17:01:40 580

原创数据派THU | 2025年必藏！10个超实用的Python项目GitHub仓库（建议收藏！）

Python在2025年仍是最受欢迎的编程语言之一，凭借简单易学的语法和强大的生态系统，广泛应用于人工智能、数据科学和自动化等领域。本文推荐了10个GitHub宝藏仓库，涵盖从入门到进阶的Python学习资源：实战教程合集（practical-tutorials） 100天机器学习挑战（Avik-Jain）交互式语法速查表（trekhleb）新手迷你项目库（garimasingh128）精选工具清单（vinta）算法实现大全（TheAlgorithms） 10行代码小应用（qxresearch）等

2025-11-08 17:00:15 990

全国省-市-区城市经纬度汇总.csv

空空如也