人工智能-研究所-优快云博客

原创硕士论文写YOLO可以毕业吗？

YOLO算法是一种革命性的目标检测方法，它巧妙地将复杂的问题转化为简单的回归任务。通过，每个网格负责预测位于其中心的目标，实现了端到端的目标检测。这种方法不仅简化了问题，还显著提升了检测速度。YOLO的核心创新在于，无需额外的候选区域生成步骤。这种统一的框架使得YOLO能够在保证较高准确率的同时，实现极高的检测速度，成为实时目标检测领域的里程碑式算法。YOLO算法自2016年问世以来，经历了多个重要版本的演进，不断推动着实时目标检测技术的进步。以下是各版本的主要特点和发展时间线：YOLOv6。

2024-12-07 17:00:14 1653

原创人工智能对图像处理常用的四大算法

欢迎大家扫描文末的二维码进行咨询（学习交流、大牛答疑、大厂内推）另外我还整理了整整200G的人工智能学习笔记、课程视频、面试宝典一并可以无套路免费分享给大家！这是小编的其他文章,希望对大家有所帮助,点击即可阅读人工智能常用的十大算法人工智能数学基础（一）人工智能数学基础(二)人工智能数学基础（三）人工智能数学基础（四）遗传算法(Genetic Algorithm，GA)遗传算法是计算数学中用于解决最佳化的搜索算法，是进化算法的一种。进化算法最初是...

2021-10-08 19:20:56 8058 1

原创人工智能必备数学基础（一）

导读：数学基础知识蕴含着处理智能问题的基本思想与方法，也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上，要了解人工智能，首先要掌握必备的数学基础知识。整理了有关人工智能的资料，有python基础，图像处理opencv\自然语言处理、机器学习数学基础等资源库，想学习人工智能或者转行到高薪资行业的，大学生也非常实用，无任何套路免费提供,，加我裙【966367816】下载，或者扫码+vx 也可以领取的内部资源，人工智能题库，大厂面试题学习大纲自学课程大纲还有200G人工智

2021-09-18 14:31:16 2686

原创人工智能的常用十种算法

导读人工智能发展速度非常的快，

2021-09-15 15:32:34 22068

原创暑假轻松发SCI

大牛轻松带你发论文

2025-07-03 14:52:19 122

原创强化学习也能预训练？效果可提升20倍，华人新作引爆RL新范式!

来自OGBench基准测试的四个领域：单个立方体(cube single)、双立方体(cube double)、场景(scene)、谜题4x4(puzzle 4x4)，包括20个基于状态的任务和4个基于图像的任务，用于评估我们的算法。为了测试InFOM，能否从无标签数据集中捕获基于用户意图的可操作信息，能否在微调后训练出高效的策略来解决下游任务，在36个基于状态的任务和4个基于图像的任务中，比较了InFOM和八个基线方法的性能。而InFOM不仅可预测多个未来步骤，还能适应用户不同的「意图」。

2025-07-01 15:11:34 838

原创使用第一性原理方法理解深度学习

第一性原理”（First Principles）源于哲学与物理学，指从最基本的不可再分的原理出发，通过逻辑推演构建整个知识体系，而不依赖经验或类比。将复杂问题拆解到最底层的基本单元，从源头出发进行推理，而非基于现有经验或表象规律进行归纳。1小时跟着谷歌大佬使用第一性原理方法理解深度学习！深度学习神经网络原理：卷积神经网络！物理学、数学、Google DeepMind例如，在物理学中，牛顿力学的第一性原理是三大运动定律，所有宏观力学现象均可从这些基本定律推导而来；

2025-06-30 15:34:29 535

原创知识图谱结合什么好发论文

知识图谱（Knowledge Graph）作为融合结构化知识与语义关系的核心技术，与多个领域结合可产生丰富的研究创新点。以下从资料包：一、人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】

2025-06-27 14:58:04 703

原创机器学习哪个方向好发sci呀，找方向好迷茫?

机器学习领域易发SCI的热门方向包括：1.可解释性机器学习（如SHAP方法），满足模型透明化需求；2.生物医学应用（疾病诊断、药物研发），受益于交叉学科期刊支持；3.工业自动化（预测性维护），具有实际应用价值；4.强化学习（机器人控制、自动驾驶），在交互决策领域前景广阔；5.生成式模型（GAN/VAE），推动图像和文本生成技术创新。这些方向因兼具理论价值与实践意义，易受权威期刊青睐。

2025-06-27 11:27:42 745

原创机器学习算法的时间复杂度：从基础概念到实践分析

机器学习算法的时间复杂度是算法设计与工程实现的核心考量，其本质是计算资源与模型能力的量化平衡。实时推荐系统：选择 O (d) 复杂度的线性模型（如 FTRL）；图像识别：使用预训练模型 + 模型压缩技术降低推理复杂度。通过理论分析与工程优化的结合，可在保证模型性能的前提下大幅提升算法效率。

2025-06-27 11:22:53 692

原创清华等开源YOLOv13：基于超图增强的实时目标检测

YOLOv13 是一次“结构级的飞跃”。它把高阶相关建模真正带进了实时检测任务里，并通过轻量优化和全流程融合机制，把速度、精度和部署成本三者做到了真正意义上的平衡。未来，如果你想做目标检测模型优化、端侧部署，或者需要一个“复杂场景也能应对”的强大检测模型，YOLOv13 一定是你绕不开的一环。

2025-06-26 10:44:00 607

原创终于把 LSTM 算法搞懂了！

LSTM (长短期记忆网络) 是一种特殊的循环神经网络算法 (RNN)，旨在解决传统 RNN 在处理长序列数据时面临的梯度消失和梯度爆炸问题，从而更好地捕捉序列中的长期依赖关系。资料包：一、人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】

2025-06-21 14:23:45 320

原创一文弄懂扩散模型diffusion models

生成式人工智能（Generative AI）是当今最受关注的热门术语之一。近年来，涉及文本、图像、音频和视频生成的应用不断增加，呈现出一股蓬勃发展的趋势。在图像创作方面，扩散模型（diffusion models）已成为内容生成的前沿技术。虽然它们最早在2015年被提出，但经过不断的创新和发展，如今已成为诸如DALLE、Midjourney等知名模型的核心机制。什么是扩散模型？为什么扩散比自回归效果更好？stable diffusion原理精讲+代码实现，Diffusion Model。

2025-06-19 10:55:22 797

原创 3D点云算法概述与核心技术解析

3D 点云算法体系庞大，从基础预处理到深度学习驱动的智能分析，覆盖了从数据清洗到语义理解的全流程。随着自动驾驶和机器人技术的发展，点云算法将更注重实时性、鲁棒性和多模态融合，而深度学习的引入正推动点云处理向端到端智能决策迈进。如需深入某类算法（如 PointNet 网络结构），可进一步探讨具体技术细节。3D点云资料+AI学习路线可以上图扫码获取资料包：一、人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉教程。

2025-06-18 14:21:27 1085

原创我如何用一份模型地图，避开了90%的深度学习坑

本课程课程内容是按照互联网大厂公司的架构体系设计的，符合企业以及市场的要求。全程实战源代码讲解，课程通俗易懂，所有算法均给出相应的实战案例及应用项目，内容覆盖200+案例30+应用场景。课程根据市场需求不断升级。目前已更新到第十二期。

2025-06-18 09:38:26 393

原创彻底搞懂深度学习-正则化和归一化

｜架构师带你玩转AI在深度学习模型训练中，你是否也遇到过这样的困扰：“为什么我的模型在训练集上表现完美，但在测试集上却一塌糊涂？”又或者"为什么我的神经网络训练了几百个epoch还是不收敛？" 这背后的原因在于，模型的成功不仅取决于网络架构的设计，更在于训练过程的精细调控。在这个调控过程中，有两个技术占据着举足轻重的地位：正则化与归一化。前者如同智慧的导师，防止模型过度拟合训练数据；后者如同稳定的基石，确保训练过程平稳高效。正则化（Regularization）是什么？正则化是一种减少模型过拟合风险的技术。

2025-06-18 09:28:34 765

原创知识图谱入门：从概念架构到实践应用

知识图谱（Knowledge Graph）是一种用表示现实世界中实体及其关系的知识模型，核心是将离散的信息转化为关联的语义网络，让机器具备 “理解” 世界的能力。资料包：一、人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】

2025-06-16 11:59:52 637

原创神经网络入门：从基础概念到核心原理

神经网络（Neural Network）的灵感源于生物大脑的神经元结构，是一种通过多层节点（神经元）相互连接实现信息处理的计算模型。其核心目标是通过 “学习” 从数据中提取模式，解决分类、回归、生成等复杂问题。资料包：一、人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】

2025-06-16 11:32:05 795

原创 2025好发论文的方向：卡尔曼滤波与 DeepSort：目标跟踪中的核心技术组合

卡尔曼滤波与 DeepSORT 的结合，实现了动态目标跟踪中 “运动预测” 与 “外观识别” 的优势互补。卡尔曼滤波通过数学建模解决目标的动态估计问题，而 DeepSORT 通过深度学习增强外观特征的区分能力，两者共同推动了目标跟踪技术在复杂场景下的实用化。未来，随着边缘计算技术和轻量化模型的发展，这一组合将在更多实时跟踪场景中发挥关键作用。有以下论文写作问题的可以扫下方名片详聊前沿顶会、期刊论文、综述文献浩如烟海，不知道学习路径，无从下手？

2025-06-12 16:33:27 953

原创自动驾驶必学：基于深度学习的车道线检测：原理、技术与应用

基于深度学习的车道线检测已从实验室研究走向实际应用，但仍需在鲁棒性、实时性和泛化能力上持续突破。随着自动驾驶技术的发展，车道线检测将与更多环境感知技术融合，成为智能驾驶系统的关键基础模块。有以下论文写作问题的可以扫下方名片详聊前沿顶会、期刊论文、综述文献浩如烟海，不知道学习路径，无从下手？没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文？CVPR、ICCV、ECCV、ICLR、NeurlPS、AAAI……想发表顶会论文，找不到创新点？读完论文，仍旧无法用代码复现……

2025-06-12 16:10:42 1073

原创 10%训练数据超越100%表现，机器人学习领域迎来重要突破

密歇根大学和瑞典皇家理工学院的研究团队提出了 ViSA-Flow 框架，这是一种革命性的机器人技能学习方法，能够从大规模人类视频中提取语义动作流，显著提升机器人在数据稀缺情况下的学习效率。2. 连续任务性能：在 5 个连续任务完成方面，ViSA-Flow 达到 31.4% 的成功率，几乎是使用 10% 数据的次佳方法 GR-MG（16.2%）的两倍，甚至超过了使用 100% 数据训练的 SuSIE（26.0%）。由于语义分割在连续帧间的不稳定性，研究团队提出跟踪正确分割的手 - 物体交互掩码。

2025-06-11 16:12:57 554

原创「Next-Token」范式改变！刚刚，强化学习预训练来了

RPT 将传统的对 next-token 的预测任务重构为对 next-token 的推理过程：对于预训练语料中的任意上下文，模型需在预测前对后续 Token 进行推理，并通过与语料真实的 next-token 比对获得可验证的内在奖励。另一方面，可验证奖励的强化学习 (RLVR) 利用客观的、基于规则的奖励，这些奖励通常来自问答对。最后，预训练期间的内部推理过程允许模型为每个预测步骤分配更多的思考（计算资源），这类似于将推理时间扩展能力提前应用到训练过程中，从而直接提升下一 Token 预测的准确性。

2025-06-11 16:02:59 767

原创中南大学开发DeepDTAGen：用于药物靶标亲和力预测和靶标感知药物生成的多任务深度学习框架

药物选择性分析表明，DeepDTAGen 的亲和力预测与药物和靶标之间的生物学相关行为相一致，其中根据亲和力概况从每个数据集中选择两种药物：一种药物与不同靶标的亲和力变化很大，另一种药物与其靶标的亲和力水平一致。在最新的研究中，中南大学、赫尔辛基大学（University of Helsinki）的研究人员开发了一个新的多任务学习框架 DeepDTAGen，该框架可以预测药物-靶标结合亲和力，并同时生成新的靶标感知药物变体，并利用这两项任务的共同特征生成新型药物。」研究人员在论文里表示。

2025-06-10 14:40:36 547

原创比自回归更灵活、比离散扩散更通用，首个纯Discrete Flow Matching多模态巨兽降临

近年来，大型语言模型（LLMs）在多模态任务中取得了显著进展，在人工通用智能（AGI）的两大核心支柱（即理解与生成）方面展现出强大潜力。与传统的自回归方法不同，FUDOKI 通过并行去噪机制实现了高效的双向信息整合，显著提升了模型的复杂推理和生成能力。与离散扩散架构相比，FUDOKI 采用更加通用的概率路径建模框架，从均匀分布出发，允许模型在推理过程中不断更新和修正生成结果，为多模态模型打开了一条崭新的技术路径。没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文。

2025-06-10 14:29:58 465

原创给强化学习加上约束，拯救熬夜调reward的你

南科大机器人控制与学习实验室（CLEAR Lab），致力于人形机器人控制，强化学习，与具身智能等方面的研究。

2025-06-05 17:50:32 935

原创彻底搞懂深度学习-从神经网络入门（动图讲解）

深度学习“三巨头”——Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio，为推动学术界更广泛地接纳深度学习，将 20 世纪 40 至 50 年代就已问世的神经网络重新包装，提出“深度学习”（Deep Learning）这一概念，本质上即深度的神经网络。

2025-06-05 14:16:13 926

原创 15种图神经网络变体GNN—GCN、GAT、GAE

选择适配的 GNN 变体或组合（如 RGCN + 图池化用于知识图谱分类），可显著提升模型性能。

2025-05-27 20:50:23 1082

原创吴恩达：如何在人工智能领域打造你的职业生涯？

让每一天都有意义。每年我的生日，我都会思考过去的日子和可能到来的日子。也许你擅长数学；我相信你能通过快速计算回答以下问题。但让我问你一个问题，请凭直觉回答，不要计算。典型的人类寿命是几天？2万天？10万天？100万天？500万天？当我问朋友时，很多人选择了一个数十万计的数字。（其他很多人忍不住要算出答案，这让我很恼火！）当我还是个研究生的时候，我记得把我的统计数据输入一个死亡计算器，算出我的预期寿命。计算器说我可以活 27,649 天。这个数字让我震惊。

2025-05-26 21:14:24 933

原创 Transformer解码器如何使用编码器的输出？

将编码器输出的全局语义信息与解码器当前生成的局部信息动态结合，实现了 “根据输入内容指导目标序列生成” 的核心逻辑。与解码器自注意力的输出结合（通过残差连接和层归一化），输入到前馈神经网络（FFN），生成下一个位置的隐藏状态。Q、K、V 均来自解码器当前层输入，作用是建模目标序列内部的依赖关系（如已生成词的顺序）Q 来自解码器自注意力，K、V 来自编码器输出，作用是建立目标序列与输入序列的跨模态关联。，从而在生成目标序列时动态地关注输入序列的相关部分。在 Transformer 模型中，

2025-05-26 20:01:30 1013

原创毕设党福音！OpenCV 实战：掌握视觉处理技巧

在当下，AI 大模型的热潮可谓席卷全球，从能与我们流畅对话、撰写文案的语言模型，到能根据只言片语创作出精美画作的图像生成模型，它们不断刷新着大众对人工智能的认知，也切实改变着众多行业的运作模式。事实并非如此，计算机视觉技术正凭借自身的独特优势不断创新，展现出强大的生命力与发展潜力。今天我将以下几个方面来带领大家快速了解计算机视觉这个领域。

2025-05-24 11:06:27 585

原创使用代码深入了解自动编码器（AE、VAE 和 VQ-VAE）

自动编码器是一类无监督神经网络，可以在低维空间（也称为潜在空间）中表示数据，以学习有效的表示。应用包括压缩、降噪、特征提取和生成模型。自动编码器的训练方式是：首先将数据编码到潜在空间中，然后将它们解码回原始表示形式，也称为重建，同时最大限度地减少原始输入和重建数据之间的差异。在扩展中，变分自动编码器（VAE）学习潜在空间上的概率分布，这使它们能够生成全新的数据，同时牺牲了完美重建现有数据的能力。这种权衡由向量量化变分自动编码器（DQ-VAE）解决，它用学习到的字母或码本。

2025-05-23 20:25:07 703

原创了解图像补丁嵌入，从简单的展开到 2D 卷积

transformer 架构如此强大，因为它不会在文本、图像或任何数据及其组合之间产生任何差异。“Attention” 模型计算序列中每个标记之间的自相似性，允许汇总和生成任何类型的数据。Vision Transformer 通过将图像分解为二次色块来实现这一点，然后将其展平为单个矢量嵌入。此时，可以像处理文本嵌入（或任何其他嵌入）一样处理它们，甚至可以与其他数据类型连接。通常，创建 patchs 的步骤与使用 2D 卷积的第一个可学习的非线性转换相结合，这可能很难解包。本文将深入探讨这一步。

2025-05-23 15:57:41 628

原创创新点+1 仅需一行代码即可提升训练效果！

在这篇文章中只做了一个出人意料的简单调整，作者建议忽略来自优化器、与最近反向传播中当前梯度符号相反的任何更新。换句话说，建议只应用与当前梯度一致的更新，使更新更稳定，并与最新数据保持一致。他们发现这个小小的调整可以显著加快训练速度，大致梳理了下内容，一起看看。

2025-05-23 13:59:27 245

原创使用 PyTorch 进行超大规模训练深度学习模型（对训练并行性基础知识的概念深入探讨）

我们每个人都在跟上 LLM 研究社区的步伐。似乎每天都会带来一个新的最先进的模型，打破以前的基准。如果您曾经想过是什么带来了这种创新的加速 — 基本上是研究人员能够在超大规模上进行训练和验证 — 这一切都归功于并行性。如果您还没听说过，5D 并行这个术语最早是由 Meta AI 的论文 The Llama 3 Herd of Models 推广的。传统上，它是指结合数据、张量、上下文、管道和专家并行的技术。

2025-05-22 20:21:31 1216

原创 Transformer原作、斯坦福、清华交大三篇论文共识：基座模型边界锁死RL能力上限

1、能力来源（source）语言模型的推理能力 = f(模型架构, token量, 训练数据多样性, 泛化能力)2、RL的作用（作用机制）RL ≈ 一个奖励驱动的路径偏移器• 将已存在于模型分布中的推理路径偏移为更高 reward 的选项• 提高成功率，但不生成新“知识”或“能力”3、提升路径（有效方向）想要获得新的 reasoning 能力 ≠ 强化训练需要更强的知识/经验（知识注入+架构优化+认知行为引导）RL不是创造能力，而是优化选择。

2025-05-22 17:28:32 680

原创如何选择神经网络？CNN、RNN、LSTM八大经典神经网络

终于有博士将深度学习顺序讲清楚了！深度神经网络算法入门到实战最佳学习路径！CNN RNN LSTM GAN一口气学爽！根据具体任务需求、数据类型和计算资源选择模型，并结合迁移学习、模型压缩等技术优化性能。以下是机器学习和深度学习中。

2025-05-21 21:05:11 815

原创八年Java转AI算法工程师自学路线！别再看乱七八糟的教程了(人工智能/计算机视觉/深度学习系统)

精通机器学习算法，主攻计算机视觉方向，线上选课学员30W+，累计开发课程50余门覆盖人工智能热门方向。联通，移动，中信等公司特邀企业培训导师，全国高校教师培训讲师，开展线下与直播培训百余场，具有丰富的授课经验。课程风格通俗易懂，擅长有最接地气的方式讲解复杂的算法问题。具体了解这套计算机视觉【机器学习+深度学习】课程的微信扫码人工智能已从实验室的前沿技术演变为重塑社会的核心力量。它既是职业发展的 “硬通货”，也是参与全球竞争的 “入场券”；既是解决现实问题的工具，也是推动文明进步的杠杆。

2025-05-21 15:42:24 1167

原创图解AI三大核心技术：RAG、大模型、智能体，大模型算法工程师

文章详细介绍了Transformer和混合专家（MoE）两种深度学习架构的差异，包括模型结构、工作原理、性能、计算资源与训练难度以及应用场景。Transformer以其自注意力机制在自然语言处理任务中表现出色，而MoE通过组合多个专家模型处理复杂任务，具有较好的泛化能力。此外，文章还探讨了五种大模型微调技术，如LORA及其变体，以及传统RAG与Agentic RAG的对比，智能体设计模式和文本分块策略。这些内容为Java开发者提供了全面的学习指南，帮助他们在AI大模型领域实现职业转型。

2025-05-20 21:08:07 754

原创 Java转行大模型工程师必看AI大模型零基础到商业实战全栈学习路线

人人都要学的AI大模型全栈课》，包含26+真实项目-案例实战演示、24+动手实践、4+原创项目部署大模型，从理论到实践，我们都将给予最大程度的支持，课程学习的目标是，可达到应聘大模型岗位的要求和标准，同时，也能完整掌握AI方面的技术技能，为自己的职业方向赋能。【终于有人讲透大模型工程师自学路线了】别再学乱七八糟的教程了，构建专属大模型！提示工程、 LangChain/NLP/神经网络/数据预处理/LLM生成模型。

2025-05-20 16:03:06 954

原创大模型入门指南 - Prompt Engineering：小白也能看懂的“提示词工程”全解析

通过身份设定框定AI的思考边界，让输出更专业。用于规避通用型废话，提升行业针对性，适用场景：法律文书生成、医疗报告撰写、营销文案创作。【角色】你现在是拥有10年经验的母婴电商运营【任务】分析2024年Q3纸尿裤销售数据【要求】用小红书爆款笔记风格总结增长亮点。

2025-05-19 19:50:29 827

SCI论文idea形成方法

研一刚结束，图像处理哪个方向比较好做，只想水论文毕业？

空空如也