- 博客(167)
- 收藏
- 关注

原创 硕士论文写YOLO可以毕业吗?
YOLO算法是一种革命性的目标检测方法,它巧妙地将复杂的问题转化为简单的回归任务。通过,每个网格负责预测位于其中心的目标,实现了端到端的目标检测。这种方法不仅简化了问题,还显著提升了检测速度。YOLO的核心创新在于,无需额外的候选区域生成步骤。这种统一的框架使得YOLO能够在保证较高准确率的同时,实现极高的检测速度,成为实时目标检测领域的里程碑式算法。YOLO算法自2016年问世以来,经历了多个重要版本的演进,不断推动着实时目标检测技术的进步。以下是各版本的主要特点和发展时间线:YOLOv6。
2024-12-07 17:00:14
1637

原创 人工智能对图像处理常用的四大算法
欢迎大家扫描文末的二维码进行咨询(学习交流、大牛答疑、大厂内推)另外我还整理了整整200G的人工智能学习笔记、课程视频、面试宝典一并可以无套路免费分享给大家!这是小编的其他文章,希望对大家有所帮助,点击即可阅读人工智能常用的十大算法 人工智能数学基础(一) 人工智能数学基础(二)人工智能数学基础(三) 人工智能数学基础(四)遗传算法(Genetic Algorithm,GA)遗传算法是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。进化算法最初是...
2021-10-08 19:20:56
8034
1

原创 人工智能必备数学基础(一)
导读:数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上,要了解人工智能,首先要掌握必备的数学基础知识。整理了有关人工智能的资料,有python基础,图像处理opencv\自然语言处理、机器学习数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生也非常实用,无任何套路免费提供,,加我裙【966367816】下载,或者扫码+vx 也可以领取的内部资源,人工智能题库,大厂面试题 学习大纲 自学课程大纲还有200G人工智
2021-09-18 14:31:16
2685
原创 终于把 LSTM 算法搞懂了!
LSTM (长短期记忆网络) 是一种特殊的循环神经网络算法 (RNN),旨在解决传统 RNN 在处理长序列数据时面临的梯度消失和梯度爆炸问题,从而更好地捕捉序列中的长期依赖关系。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】
2025-06-21 14:23:45
294
原创 一文弄懂扩散模型diffusion models
生成式人工智能(Generative AI)是当今最受关注的热门术语之一。近年来,涉及文本、图像、音频和视频生成的应用不断增加,呈现出一股蓬勃发展的趋势。在图像创作方面,扩散模型(diffusion models)已成为内容生成的前沿技术。虽然它们最早在2015年被提出,但经过不断的创新和发展,如今已成为诸如DALLE、Midjourney等知名模型的核心机制。什么是扩散模型?为什么扩散比自回归效果更好?stable diffusion原理精讲+代码实现,Diffusion Model。
2025-06-19 10:55:22
763
原创 3D点云算法概述与核心技术解析
3D 点云算法体系庞大,从基础预处理到深度学习驱动的智能分析,覆盖了从数据清洗到语义理解的全流程。随着自动驾驶和机器人技术的发展,点云算法将更注重实时性、鲁棒性和多模态融合,而深度学习的引入正推动点云处理向端到端智能决策迈进。如需深入某类算法(如 PointNet 网络结构),可进一步探讨具体技术细节。3D点云资料+AI学习路线可以上图扫码获取资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程。
2025-06-18 14:21:27
737
原创 我如何用一份模型地图,避开了90%的深度学习坑
本课程课程内容是按照互联网大厂公司的架构体系设计的,符合企业以及市场的要求。全程实战源代码讲解,课程通俗易懂,所有算法均给出相应的实战案例及应用项目,内容覆盖200+案例30+应用场景。课程根据市场需求不断升级。目前已更新到第十二期。
2025-06-18 09:38:26
387
原创 彻底搞懂深度学习-正则化和归一化
|架构师带你玩转AI在深度学习模型训练中,你是否也遇到过这样的困扰:“为什么我的模型在训练集上表现完美,但在测试集上却一塌糊涂?”又或者"为什么我的神经网络训练了几百个epoch还是不收敛?" 这背后的原因在于,模型的成功不仅取决于网络架构的设计,更在于训练过程的精细调控。在这个调控过程中,有两个技术占据着举足轻重的地位:正则化与归一化。前者如同智慧的导师,防止模型过度拟合训练数据;后者如同稳定的基石,确保训练过程平稳高效。正则化(Regularization)是什么?正则化是一种减少模型过拟合风险的技术。
2025-06-18 09:28:34
757
原创 知识图谱入门:从概念架构到实践应用
知识图谱(Knowledge Graph)是一种用表示现实世界中实体及其关系的知识模型,核心是将离散的信息转化为关联的语义网络,让机器具备 “理解” 世界的能力。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】
2025-06-16 11:59:52
609
原创 神经网络入门:从基础概念到核心原理
神经网络(Neural Network)的灵感源于生物大脑的神经元结构,是一种通过多层节点(神经元)相互连接实现信息处理的计算模型。其核心目标是通过 “学习” 从数据中提取模式,解决分类、回归、生成等复杂问题。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】
2025-06-16 11:32:05
788
原创 2025好发论文的方向:卡尔曼滤波与 DeepSort:目标跟踪中的核心技术组合
卡尔曼滤波与 DeepSORT 的结合,实现了动态目标跟踪中 “运动预测” 与 “外观识别” 的优势互补。卡尔曼滤波通过数学建模解决目标的动态估计问题,而 DeepSORT 通过深度学习增强外观特征的区分能力,两者共同推动了目标跟踪技术在复杂场景下的实用化。未来,随着边缘计算技术和轻量化模型的发展,这一组合将在更多实时跟踪场景中发挥关键作用。有以下论文写作问题的可以扫下方名片详聊前沿顶会、期刊论文、综述文献浩如烟海,不知道学习路径,无从下手?
2025-06-12 16:33:27
929
原创 自动驾驶必学:基于深度学习的车道线检测:原理、技术与应用
基于深度学习的车道线检测已从实验室研究走向实际应用,但仍需在鲁棒性、实时性和泛化能力上持续突破。随着自动驾驶技术的发展,车道线检测将与更多环境感知技术融合,成为智能驾驶系统的关键基础模块。有以下论文写作问题的可以扫下方名片详聊前沿顶会、期刊论文、综述文献浩如烟海,不知道学习路径,无从下手?没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文?CVPR、ICCV、ECCV、ICLR、NeurlPS、AAAI……想发表顶会论文,找不到创新点?读完论文,仍旧无法用代码复现……
2025-06-12 16:10:42
977
原创 10%训练数据超越100%表现,机器人学习领域迎来重要突破
密歇根大学和瑞典皇家理工学院的研究团队提出了 ViSA-Flow 框架,这是一种革命性的机器人技能学习方法,能够从大规模人类视频中提取语义动作流,显著提升机器人在数据稀缺情况下的学习效率。2. 连续任务性能:在 5 个连续任务完成方面,ViSA-Flow 达到 31.4% 的成功率,几乎是使用 10% 数据的次佳方法 GR-MG(16.2%)的两倍,甚至超过了使用 100% 数据训练的 SuSIE(26.0%)。由于语义分割在连续帧间的不稳定性,研究团队提出跟踪正确分割的手 - 物体交互掩码。
2025-06-11 16:12:57
546
原创 「Next-Token」范式改变!刚刚,强化学习预训练来了
RPT 将传统的对 next-token 的预测任务重构为对 next-token 的推理过程:对于预训练语料中的任意上下文,模型需在预测前对后续 Token 进行推理,并通过与语料真实的 next-token 比对获得可验证的内在奖励。另一方面,可验证奖励的强化学习 (RLVR) 利用客观的、基于规则的奖励,这些奖励通常来自问答对。最后,预训练期间的内部推理过程允许模型为每个预测步骤分配更多的思考(计算资源),这类似于将推理时间扩展能力提前应用到训练过程中,从而直接提升下一 Token 预测的准确性。
2025-06-11 16:02:59
763
原创 中南大学开发DeepDTAGen:用于药物靶标亲和力预测和靶标感知药物生成的多任务深度学习框架
药物选择性分析表明,DeepDTAGen 的亲和力预测与药物和靶标之间的生物学相关行为相一致,其中根据亲和力概况从每个数据集中选择两种药物:一种药物与不同靶标的亲和力变化很大,另一种药物与其靶标的亲和力水平一致。在最新的研究中,中南大学、赫尔辛基大学(University of Helsinki)的研究人员开发了一个新的多任务学习框架 DeepDTAGen,该框架可以预测药物-靶标结合亲和力,并同时生成新的靶标感知药物变体,并利用这两项任务的共同特征生成新型药物。」研究人员在论文里表示。
2025-06-10 14:40:36
535
原创 比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临
近年来,大型语言模型(LLMs)在多模态任务中取得了显著进展,在人工通用智能(AGI)的两大核心支柱(即理解与生成)方面展现出强大潜力。与传统的自回归方法不同,FUDOKI 通过并行去噪机制实现了高效的双向信息整合,显著提升了模型的复杂推理和生成能力。与离散扩散架构相比,FUDOKI 采用更加通用的概率路径建模框架,从均匀分布出发,允许模型在推理过程中不断更新和修正生成结果,为多模态模型打开了一条崭新的技术路径。没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文。
2025-06-10 14:29:58
455
原创 给强化学习加上约束,拯救熬夜调reward的你
南科大机器人控制与学习实验室(CLEAR Lab),致力于人形机器人控制,强化学习,与具身智能等方面的研究。
2025-06-05 17:50:32
916
原创 彻底搞懂深度学习-从神经网络入门(动图讲解)
深度学习“三巨头”——Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio,为推动学术界更广泛地接纳深度学习,将 20 世纪 40 至 50 年代就已问世的神经网络重新包装,提出“深度学习”(Deep Learning)这一概念,本质上即深度的神经网络。
2025-06-05 14:16:13
916
原创 15种图神经网络变体GNN—GCN、GAT、GAE
选择适配的 GNN 变体或组合(如 RGCN + 图池化用于知识图谱分类),可显著提升模型性能。
2025-05-27 20:50:23
1032
原创 吴恩达:如何在人工智能领域打造你的职业生涯?
让每一天都有意义。每年我的生日,我都会思考过去的日子和可能到来的日子。也许你擅长数学;我相信你能通过快速计算回答以下问题。但让我问你一个问题,请凭直觉回答,不要计算。典型的人类寿命是几天?2万天?10万天?100万天?500万天?当我问朋友时,很多人选择了一个数十万计的数字。(其他很多人忍不住要算出答案,这让我很恼火!)当我还是个研究生的时候,我记得把我的统计数据输入一个死亡计算器,算出我的预期寿命。计算器说我可以活 27,649 天。这个数字让我震惊。
2025-05-26 21:14:24
928
原创 Transformer解码器如何使用编码器的输出?
将编码器输出的全局语义信息与解码器当前生成的局部信息动态结合,实现了 “根据输入内容指导目标序列生成” 的核心逻辑。与解码器自注意力的输出结合(通过残差连接和层归一化),输入到前馈神经网络(FFN),生成下一个位置的隐藏状态。Q、K、V 均来自解码器当前层输入 ,作用是建模目标序列内部的依赖关系(如已生成词的顺序)Q 来自解码器自注意力,K、V 来自编码器输出,作用是建立目标序列与输入序列的跨模态关联。,从而在生成目标序列时动态地关注输入序列的相关部分。在 Transformer 模型中,
2025-05-26 20:01:30
989
原创 毕设党福音!OpenCV 实战:掌握视觉处理技巧
在当下,AI 大模型的热潮可谓席卷全球,从能与我们流畅对话、撰写文案的语言模型,到能根据只言片语创作出精美画作的图像生成模型,它们不断刷新着大众对人工智能的认知,也切实改变着众多行业的运作模式。事实并非如此,计算机视觉技术正凭借自身的独特优势不断创新,展现出强大的生命力与发展潜力。今天我将以下几个方面来带领大家快速了解计算机视觉这个领域。
2025-05-24 11:06:27
583
原创 使用代码深入了解自动编码器(AE、VAE 和 VQ-VAE)
自动编码器是一类无监督神经网络,可以在低维空间(也称为潜在空间)中表示数据,以学习有效的表示。应用包括压缩、降噪、特征提取和生成模型。自动编码器的训练方式是:首先将数据编码到潜在空间中,然后将它们解码回原始表示形式,也称为重建,同时最大限度地减少原始输入和重建数据之间的差异。在扩展中,变分自动编码器(VAE) 学习潜在空间上的概率分布,这使它们能够生成全新的数据,同时牺牲了完美重建现有数据的能力。这种权衡由向量量化变分自动编码器(DQ-VAE) 解决,它用学习到的字母或码本。
2025-05-23 20:25:07
691
原创 了解图像补丁嵌入,从简单的展开到 2D 卷积
transformer 架构如此强大,因为它不会在文本、图像或任何数据及其组合之间产生任何差异。“Attention” 模型计算序列中每个标记之间的自相似性,允许汇总和生成任何类型的数据。Vision Transformer 通过将图像分解为二次色块来实现这一点,然后将其展平为单个矢量嵌入。此时,可以像处理文本嵌入(或任何其他嵌入)一样处理它们,甚至可以与其他数据类型连接。通常,创建 patchs 的步骤与使用 2D 卷积的第一个可学习的非线性转换相结合,这可能很难解包。本文将深入探讨这一步。
2025-05-23 15:57:41
620
原创 创新点+1 仅需一行代码即可提升训练效果!
在这篇文章中只做了一个出人意料的简单调整,作者建议忽略来自优化器、与最近反向传播中当前梯度符号相反的任何更新。换句话说,建议只应用与当前梯度一致的更新,使更新更稳定,并与最新数据保持一致。他们发现这个小小的调整可以显著加快训练速度,大致梳理了下内容,一起看看。
2025-05-23 13:59:27
238
原创 使用 PyTorch 进行超大规模训练深度学习模型(对训练并行性基础知识的概念深入探讨)
我们每个人都在跟上 LLM 研究社区的步伐。似乎每天都会带来一个新的最先进的模型,打破以前的基准。如果您曾经想过是什么带来了这种创新的加速 — 基本上是研究人员能够在超大规模上进行训练和验证 — 这一切都归功于并行性。如果您还没听说过,5D 并行这个术语最早是由 Meta AI 的论文 The Llama 3 Herd of Models 推广的。传统上,它是指结合数据、张量、上下文、管道和专家并行的技术。
2025-05-22 20:21:31
1204
原创 Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限
1、能力来源(source)语言模型的推理能力 = f(模型架构, token量, 训练数据多样性, 泛化能力)2、RL的作用(作用机制)RL ≈ 一个奖励驱动的路径偏移器• 将已存在于模型分布中的推理路径偏移为更高 reward 的选项• 提高成功率,但不生成新“知识”或“能力”3、提升路径(有效方向)想要获得新的 reasoning 能力 ≠ 强化训练需要更强的知识/经验(知识注入+架构优化+认知行为引导)RL不是创造能力,而是优化选择。
2025-05-22 17:28:32
672
原创 如何选择神经网络?CNN、RNN、LSTM八大经典神经网络
终于有博士将深度学习顺序讲清楚了!深度神经网络算法入门到实战最佳学习路径!CNN RNN LSTM GAN一口气学爽!根据具体任务需求、数据类型和计算资源选择模型,并结合迁移学习、模型压缩等技术优化性能。以下是机器学习和深度学习中。
2025-05-21 21:05:11
775
原创 八年Java转AI算法工程师自学路线!别再看乱七八糟的教程了(人工智能/计算机视觉/深度学习系统)
精通机器学习算法,主攻计算机视觉方向,线上选课学员30W+,累计开发课程50余门覆盖人工智能热门方向。联通,移动,中信等公司特邀企业培训导师,全国高校教师培训讲师,开展线下与直播培训百余场,具有丰富的授课经验。课程风格通俗易懂,擅长有最接地气的方式讲解复杂的算法问题。具体了解这套计算机视觉【机器学习+深度学习】课程的微信扫码人工智能已从实验室的前沿技术演变为重塑社会的核心力量。它既是职业发展的 “硬通货”,也是参与全球竞争的 “入场券”;既是解决现实问题的工具,也是推动文明进步的杠杆。
2025-05-21 15:42:24
1150
原创 图解AI三大核心技术:RAG、大模型、智能体,大模型算法工程师
文章详细介绍了Transformer和混合专家(MoE)两种深度学习架构的差异,包括模型结构、工作原理、性能、计算资源与训练难度以及应用场景。Transformer以其自注意力机制在自然语言处理任务中表现出色,而MoE通过组合多个专家模型处理复杂任务,具有较好的泛化能力。此外,文章还探讨了五种大模型微调技术,如LORA及其变体,以及传统RAG与Agentic RAG的对比,智能体设计模式和文本分块策略。这些内容为Java开发者提供了全面的学习指南,帮助他们在AI大模型领域实现职业转型。
2025-05-20 21:08:07
740
原创 Java转行大模型工程师必看AI大模型零基础到商业实战全栈学习路线
人人都要学的AI大模型全栈课》,包含26+真实项目-案例实战演示、24+动手实践、4+原创项目部署大模型,从理论到实践,我们都将给予最大程度的支持,课程学习的目标是,可达到应聘大模型岗位的要求和标准,同时,也能完整掌握AI方面的技术技能,为自己的职业方向赋能。【终于有人讲透大模型工程师自学路线了】别再学乱七八糟的教程了,构建专属大模型!提示工程、 LangChain/NLP/神经网络/数据预处理/LLM生成模型。
2025-05-20 16:03:06
940
原创 大模型入门指南 - Prompt Engineering:小白也能看懂的“提示词工程”全解析
通过身份设定框定AI的思考边界,让输出更专业。用于规避通用型废话,提升行业针对性,适用场景:法律文书生成、医疗报告撰写、营销文案创作。【角色】你现在是拥有10年经验的母婴电商运营【任务】分析2024年Q3纸尿裤销售数据【要求】用小红书爆款笔记风格总结增长亮点。
2025-05-19 19:50:29
817
原创 大模型入门指南 - MoE:小白也能看懂的“模型架构”全解析
随着国产模型DeepSeekMoE、Qwen-2.5 Max、国际标杆GPT-4的实践验证,MoE已成为下一代大模型的核心架构。路由器(Router)输出概率,用于混合专家(MoE)模型选择最佳匹配专家(Expert),选择的专家(Expert)也是一个前馈神经网络(FFNN)。混合专家(MoE)模型的路由器(Router)是什么?MoE模型:可以堆叠1000个专家,但每次只激活10个(“脑容量”飙升,耗电量不变)。稠密模型:参数越多,计算越慢(“脑容量”和“耗电量”同步增长)。(2)专家越多,能力越强。
2025-05-19 19:43:34
388
原创 大模型入门指南 - Fine-tuning:小白也能看懂的“模型微调”全解析
通用模型可能生成“看似合理但错误”的答案(如法律条款引用错误)。微调通过损失函数设计(如增加法律条款一致性约束),让模型输出更符合领域逻辑(如引用《民法典》第X条)。(如法律需判例库),而非通用文本。数据需“小而精”,而非“大而杂”。例如,1000条标注的法律案例数据,可能比100万条通用文本更有效。微调:注入领域专属知识(如医疗术语、金融逻辑),使模型具备特定场景下的专业能力。预训练模型:已在大规模无标注数据上学习通用特征(如语言规则、物体识别)。
2025-05-19 19:36:14
627
原创 惊爆!调参黑科技曝光,导师为何刻意隐瞒?错过再等一年
当你深入深度学习,调参却成 “拦路虎”。学习率、权重系数等参数稍调不对,模型就 “罢工”,最优参数组合更是难寻。花大量时间调参,模型准确率却 “原地踏步”,过拟合、欠拟合还常来捣乱,不禁让人感叹:调参咋这么难?神经网络架构复杂,参数设置变化无穷,尝试新组合不仅耗费资源,效果还不理想,调参痛点亟待破解。今天就和大家好好聊聊调参这件事。本章节内容颇为丰富,我们会以多篇文章的形式,逐一展开讲述。接下来,为大家呈现关于深度学习调参指南的内容导图。在正式开始之前,我把我们整理的。
2025-05-17 15:40:59
925
原创 用AI写代码,怎么问问题啊!?大模型、机器学习入门到实战
别让大模型成你的遮羞布!90%开发者被AI坑在『不会问问题』一位高级工程师描述,他有次带人用AI优化SpringBoot接口,实习生兴奋地说:“大模型生成CRUD这样的基础内容太强了!根本就不用人来干预。”但我注意到生成的代码缺少事务管理,问他为什么不用@Transactional注解,实习生居然反问:"那个注解是干什么的?
2025-05-17 11:22:10
557
原创 【计算机视觉】从AlexNet到Vision Transformer
在正文开始之前,先给大家带来一个超值福利!为了方便同学们快速开启人工智能学习计划,在学习过程中少走弯路用最快的效率入门Ai并开始实战项目。我们整理了近200个Ai实战案例和项目,这些并不是网上搜集来的,而是我们这五年线上线下教学所开发和积累的案例。-* 可以说都是反复迭代更新出来的,适合同学们来进行循序渐进的学习与练手。需要的扫码。
2025-05-16 21:12:00
853
原创 为什么大厂都看重Kaggle竞赛?一文带你准备Kaggle!
打开各大厂算法岗招聘页面,“” 的要求屡见不鲜。在科技行业,Kaggle 竞赛成绩已成为数据科学家和 AI 工程师求职时的 “硬通货”。谷歌、微软、Meta 等大厂在招聘数据相关岗位时,常将 Kaggle 排名、Kernel 质量、竞赛成果作为核心筛选标准。
2025-05-16 20:53:04
1221
原创 面试官必问:一文读懂VGG、GoogleNet、ResNet到底是什么?
VGG(Visual Geometry Group)是由牛津大学视觉几何组提出的深度卷积神经网络,它在 2014 年的 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得了优异的成绩。VGG 的主要贡献在于证明了增加网络的深度可以显著提高模型的性能,其网络结构简单且规整,具有很强的可扩展性。GoogleNet(也称为 Inception 网络)是由 Google 团队在 2014 年提出的深度卷积神经网络,它在 ImageNet 挑战赛中夺冠。
2025-05-15 16:52:06
743
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人