- 博客(23)
- 收藏
- 关注
原创 强化学习PPO算法介绍
邻近策略优化(Proximal Policy Optimization,PPO)算法解决的问题是离散动作空间和连续动作空间的强化学习问题,是on-policy的强化学习算法。算法主要思想:策略pi接受状态s,输出动作概率分布,在动作概率分布中采样动作,执行动作,得到回报,跳到下一个状态。在这样的步骤下,我们可以使用策略pi收集一批样本,然后使用梯度下降算法学习这些样本,但是当策略pi的参数更新后,这些样本不能继续被使用,还要重新使用策略pi与环境互动收集数据,真的非常耗时。
2025-04-29 10:03:41
1444
原创 一文秒懂Transformer:拆解火爆大语言模型背后的秘密
Transformer架构以自注意力机制为核心,突破了传统序列模型的局限,极大提升了自然语言处理的能力。输入嵌入和位置编码解决了语义和顺序感的结合,多头自注意力、多层前馈网络等模块让模型可以捕捉复杂的全局关系和抽象表达。掩码自注意力则确保了模型生成时的信息封闭性和合理性。这些创新共同构建了强大而高效的底座,使Transformer成为近年来AI领域最火爆的模型框架,催生如GPT系列、DeepSeek 系列等众多的大模型产品。
2025-04-27 10:19:19
951
原创 多尺度自适应注意力实现58%AP新高,揭示检测注意力演进规律
一种DETR风格的检测器由 Backbone 网络(例如,ResNet [24]、Swin Transformer [25])和具有编码器和解码器模块的transformer架构组成。给定一个输入图像, Backbone 网络首先提取图像特征,然后将这些特征分割成块状 Token。transformer编码器通过自注意力机制处理这些 Token ,并输出增强的特征表示,记为记忆。transformer解码器以一组可学习的目标 Query 作为输入。
2025-04-26 09:51:45
727
原创 目标检测框架详解
然后支持集图像和对应的真实标签图经过预测器重建模网络(PRN)得到每个类别对应的类别注意力向量(class-attentive vectors),PRN网络的主体部分与Faster/Mask R-CNN的特征提取网络结构相同且权重共享,得到对应特征图后,通过逐元素Sigmoid函数得到对应的注意力向量vc。这是通过使用从为这些类别提供的少量训练示例(k个用于k-shot检测的示例)的前景RoI中计算的嵌入向量来替换所学习的代表(对应于旧类别)来实现的。需要注意的是,DML子网是与生成功能的主干一起训练的。
2025-04-24 16:38:56
815
原创 一文读懂计算机视觉「目标检测」的基本原理和主流模型
根据模型的不同,坐标 (𝑥, 𝑦) 可以表示框的中心(在像 YOLO 这样的模型中)或者左上角(在像 Faster R-CNN 这样的模型中),而 𝑤 和 ℎ 决定了框的尺寸。医疗保健:在医疗保健领域,目标检测应用于医学成像,以协助医生和放射科医生在各种类型的扫描(如 X 光、CT 扫描和 MRI)中识别异常,如肿瘤、骨折或其他状况。为了评估预测的边界框与真实情况的匹配程度,使用了一个称为交并比(Intersection over Union,IOU)的指标,用于测量预测和实际边界框之间的重叠部分。
2025-04-23 09:44:49
1135
原创 如何解决工业缺陷检测小样本问题?
当前基于有监督的缺陷检测算法,在数据量充足的场景下已经逐步成功落地,但工业场景具有一定的离散性,大部分应用场景均为小样本检测场景,小样本问题的解决有助于将AI技术应用于千千万万工厂。虽然当前针对小样本问题有一些初步的解决思路,但该问题的彻底解决需要更深入的研究及更大的投入。阿丘科技将AI For Every Factory作为使命,会坚定不移地持续研究小样本问题,也希望可以和有志于研究工业AI检测问题的工业人一起交流进步,推动小样本问题的彻底解决。
2025-04-22 17:42:03
903
原创 从论文看趋势:YOLO在遥感小目标检测中还能怎么改?
近年来,围绕YOLO算法进行改进的研究持续升温,尤其是在目标检测领域依然是热点之一。这些改进大多聚焦于YOLO的骨干网络、颈部结构以及检测头的设计优化,同时也涵盖了损失函数的调整与特定任务的适配。在遥感图像目标检测任务中,常常面临“小目标”和“密集分布”这两个典型挑战:目标尺寸较小、有效像素有限,容易出现漏检与误检,进而影响整体检测性能。针对这一问题,本文将分享近期几篇专注于的优秀研究成果,分别从特征提取、特征融合、注意力机制和损失函数等多个角度展开,为相关领域的研究和应用提供参考与启发。
2025-04-21 11:10:24
1271
原创 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
一、目标检测介绍目标检测(Object Detection)是计算机视觉领域的一项重要技术,旨在识别图像或视频中的特定目标并确定其位置。通过训练深度学习模型,如卷积神经网络(CNN),可以实现对各种目标的精确检测。常见的目标检测任务包括:人脸检测、行人检测、车辆检测等。目标检测在安防监控、自动驾驶、智能零售等领域具有广泛应用前景。二、YOLOv8介绍。
2025-04-19 10:44:59
1288
原创 图解 Transformer,一文吃透工作原理
另一种方法是保留前两个最有可能的单词(例如 ‘I’ 和 ‘a’),然后在下一步中,运行模型两次:一次假设第一个输出位置是单词 ‘I’ ,另一次假设第一个输出位置是单词 ‘a’,然后根据考虑位置 #1 和 #2 的错误程度,保留生成误差较小的版本。这种方法称为“束搜索”(beam search),在我们的示例中,束宽(beam_size)为 2(这意味着在任何时候,模型会在内存中保留两个部分假设,即未完成的翻译),而返回束(top_beams)也是 2(这意味着我们最终会返回两个翻译)。
2025-04-18 10:57:52
998
原创 带深度学习新手用pytorch从头构建神经网络!
让我们创建10组输入样本数据——x_sample,每组x_sample是一个包含4个元素的数组,与权重的长度相同。正如我们在准备阶段所讨论的,第一步是使用模型预测一个结果:y_pred,然后,调用loss_fn来计算损失值。我们的训练数据已准备就绪,无需下载任何内容,也无需使用DataLoader等,接下来,让我们定义模型。我们的模型可能是世界上最简单的模型,即以下代码中定义的一个简单的线性点积:。我们的模型将用于预测权重列表,因此在使用它生成一些训练数据后,我们假装不知道这些权重。
2025-04-17 17:57:00
335
原创 我十天入门机器学习的路线
研究 AIGC(如 Midjourney、ChatGPT 背后的技术)梯度提升树(GBDT、XGBoost、LightGBM)用 Pandas 进行数据清洗(缺失值、异常值处理)逻辑回归(Logistic Regression)线性回归(Linear Regression)用 CNN 识别手写数字(MNIST 数据集)用 LSTM 进行情感分析(IMDB 数据集):分类(如垃圾邮件检测)、回归(如房价预测):聚类(如用户分群)、降维(如 PCA)Titanic 乘客生存预测(分类问题)
2025-04-17 11:37:24
487
原创 分布式架构基石-TCP通信协议
为什么会有TCP/IP协议在世界上各地,各种各样的电脑运行着各自不同的操作系统为大家服务,这些电脑在表达同一种信息的时候所使用的方法是千差万别。就好像圣经中上帝打乱了各地人的口音,让他们无法合作一样。计算机使用者意识到,计算机只是单兵作战并不会发挥太大的作用。只有把它们联合起来,电脑才会发挥出它最大的潜力。于是人们就想方设法的用电线把电脑连接到了一起。但是简单的连到一起是远远不够的,就好像...
2018-08-20 17:30:58
254
原创 深入透析分布式架构的演进历程
分布式架构的演进系统架构演化历程-初始阶段架构 初始阶段 的小型系统 应用程序、数据库、文件等所有的资源都在一台服务器上通俗称为LAMP特征: 应用程序、数据库、文件等所有的资源都在一台服务器上。描述: 通常服务器操作系统使用linux,应用程序使用PHP开发,然后部署在Apache上,数据库使用Mysql,汇集各种免费开源软件以及一台廉价服务器就可...
2018-08-14 17:20:57
303
原创 大型分布式架构演进过程
分布式架构的演进过程一.分布式架构的发展历史 1946年,世界上第一台电子计算机在美国的宾夕法尼亚大学诞生,它的名字是:ENICAC ,这台计算机的体重比较大,计算速度也不快,但是而代表了计算机时代的到来,再以后的互联网的发展中也有基础性的意义。 计算机的组成是有五部分完成的,分别是:输入设备,输出设备,存储器,存储器里面由运算器和控制器,有一个冯诺依曼的模型非常形象...
2018-08-14 14:56:03
529
原创 如何把应用从单机扩展到分布式
本节会学习以下内容:第一版 单台服务器应用 第二版 应用服务器和数据库服务器分离 第三版 应用服务器集群 第四版 负载均衡器 第五版 数据库服务器集群 第六版 搜索引擎集群 第七版 缓存服务器 第八版 数据库水平/垂直拆分 第九版 应用服务器垂直拆分 第十版 SOA服务(分布式架构)第一版 单台服务器应用 出现以下问题: 由于流量越来越大出现服务器性能问题。第二...
2018-08-07 17:54:18
852
原创 初识分布式架构及意义
随着计算机系统规模变得越来越大,将所有的业务单元集中部署在一个或若干个大型机上的体系结构,已经越来越不能满足当今计算机系统,尤其是大型互联网系统的快速发展,各种灵活多变的系统架构模型层出不穷。分布式的处理方式越来越受到业界的青睐——计算机系统正在经历一场前所未有的从集中式向分布式架构的变革。集中式与分布式集中式系统所谓的集中式系统就是指由一台或多台主计算机组成中心节点,数据集中存储于这...
2018-08-07 17:05:46
5434
原创 架构设计之初体验,送给准备进阶架构的朋友(个人总结)
1 基本概念和目的 架构设计的目的是为了解决系统复杂度带来的问题,并不是要面面俱到,不需要每个架构都具备高性能、高可用、高扩展等特点,而是要识别出实际业务实际情况的复杂点,然后有有针对性地解决问题,即:有的放矢,而不是贪大求全。 在实际情况中,不一定每个系统都要做架构设计,需要结合实际情况。有时候最简单的设计开发效率反而是最高的,架构设计毕竟要投入时间和人力,这部分投入如果用来尽早编码,项目也许会...
2018-06-25 17:17:20
173
原创 Otto.de:我为什么选择分布式垂直架构
在我们开始开发otto.de网上商店时,我们选择了分布式垂直架构。之前的工作经验告诉我们,一体化架构(monolithic architecture)不能够满足不断增长的需求。爆发式增长的数据,持续提高的负载和对系统的扩展,所有的这些强迫我们去重新思考网站的架构。这篇文章将会描述我们的解决办法,还有我们这么做的原因。一体化(Monoliths)在项目刚开始的时候,团队通常会考虑使用什么编程语言和合...
2018-06-22 19:24:23
339
原创 “欣欣”架构师说:分布式具体方案解析
欣欣今天带给大家的是分布式解决方案首先,缓存由于其高并发和高性能的特性,已经在项目中被广泛使用。在读取缓存方面,大家没啥疑问,都是按照下图的流程来进行业务操作。但是在更新缓存方面,对于更新完数据库,是更新缓存呢,还是删除缓存。又或者是先删除缓存,再更新数据库,其实大家存在很大的争议。目前没有一篇全面的文章,对这几种方案进行解析。于是欣欣战战兢兢,顶着被大家喷的风险,写了这篇文章。先做一个说明,从理...
2018-05-24 20:57:02
166
原创 CTO详细讲解海量日志处理ELK
ELK实时日志分析平台之Elasticsearch简介Elasticsearch是一个高度灵活的开源全文检索和分析引擎。它能够迅速(几乎是实时地)地存储、查找和分析大规模数据。通常被用在有复杂的搜索要求的系统中。比如:在电子商务系统中用户搜索商品,可以使用Elasticsearch存储产品目录后为客户提供搜索接口。如果要收集日志或交易信息,然后分析这些数据得到有价值信息,可以先使用Logstash...
2018-05-23 19:44:52
420
原创 十个理由,让程序员成为2018最抢手老公
是什么让你选择一个程序员1.薪资高,很抢手程序猿,是现在需求比较大的一个职业,比较好找工作。他们在市场上很抢手、很受欢迎。关键是,他们的起薪都非常高。程序员个个都是潜力股,你看无论是世界首富,还是中国首富,最多的就做IT,说不定那天一不小心,你就成了亿万富翁的老婆啦。2.专一我是一个苦b的程序员,今晚加班到快通宵了,困得快睁不开眼了,女上司很关心,问我要不要吃宵夜。我没好气地说,宵夜就算了,能让我...
2018-05-22 21:55:57
1768
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅