
程序人生
文章平均质量分 86
人工智能-研究所
SCI/论文带读/本硕博毕业论文/中文核心期刊/EI会议/期刊/顶会发刊论文指导
文章相关资源可关注V.X【服务号】:AI技术星球 发送:211C 自取
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
终于把 LSTM 算法搞懂了!
LSTM (长短期记忆网络) 是一种特殊的循环神经网络算法 (RNN),旨在解决传统 RNN 在处理长序列数据时面临的梯度消失和梯度爆炸问题,从而更好地捕捉序列中的长期依赖关系。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】原创 2025-06-21 14:23:45 · 296 阅读 · 0 评论 -
一文弄懂扩散模型diffusion models
生成式人工智能(Generative AI)是当今最受关注的热门术语之一。近年来,涉及文本、图像、音频和视频生成的应用不断增加,呈现出一股蓬勃发展的趋势。在图像创作方面,扩散模型(diffusion models)已成为内容生成的前沿技术。虽然它们最早在2015年被提出,但经过不断的创新和发展,如今已成为诸如DALLE、Midjourney等知名模型的核心机制。什么是扩散模型?为什么扩散比自回归效果更好?stable diffusion原理精讲+代码实现,Diffusion Model。原创 2025-06-19 10:55:22 · 764 阅读 · 0 评论 -
我如何用一份模型地图,避开了90%的深度学习坑
本课程课程内容是按照互联网大厂公司的架构体系设计的,符合企业以及市场的要求。全程实战源代码讲解,课程通俗易懂,所有算法均给出相应的实战案例及应用项目,内容覆盖200+案例30+应用场景。课程根据市场需求不断升级。目前已更新到第十二期。原创 2025-06-18 09:38:26 · 387 阅读 · 0 评论 -
彻底搞懂深度学习-正则化和归一化
|架构师带你玩转AI在深度学习模型训练中,你是否也遇到过这样的困扰:“为什么我的模型在训练集上表现完美,但在测试集上却一塌糊涂?”又或者"为什么我的神经网络训练了几百个epoch还是不收敛?" 这背后的原因在于,模型的成功不仅取决于网络架构的设计,更在于训练过程的精细调控。在这个调控过程中,有两个技术占据着举足轻重的地位:正则化与归一化。前者如同智慧的导师,防止模型过度拟合训练数据;后者如同稳定的基石,确保训练过程平稳高效。正则化(Regularization)是什么?正则化是一种减少模型过拟合风险的技术。原创 2025-06-18 09:28:34 · 757 阅读 · 0 评论 -
知识图谱入门:从概念架构到实践应用
知识图谱(Knowledge Graph)是一种用表示现实世界中实体及其关系的知识模型,核心是将离散的信息转化为关联的语义网络,让机器具备 “理解” 世界的能力。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】七、各阶段AI论文攻略合集【论文带读/代码指导/本硕博/SCI/EI/中文核心】原创 2025-06-16 11:59:52 · 612 阅读 · 0 评论 -
神经网络入门:从基础概念到核心原理
神经网络(Neural Network)的灵感源于生物大脑的神经元结构,是一种通过多层节点(神经元)相互连接实现信息处理的计算模型。其核心目标是通过 “学习” 从数据中提取模式,解决分类、回归、生成等复杂问题。资料包:一、 人工智能学习路线及大纲二、计算机视觉OpenCV【视频+书籍】三、AI基础+ 深度学习 + 机器学习 +NLP+ 机器视觉 教程四、李飞飞+吴恩达+李宏毅合集五、自动驾驶+知识图谱等资料六、人工智能电子书合集【西瓜书、花书等】原创 2025-06-16 11:32:05 · 788 阅读 · 0 评论 -
彻底搞懂深度学习-从神经网络入门(动图讲解)
深度学习“三巨头”——Geoffrey Hinton、Yann LeCun 和 Yoshua Bengio,为推动学术界更广泛地接纳深度学习,将 20 世纪 40 至 50 年代就已问世的神经网络重新包装,提出“深度学习”(Deep Learning)这一概念,本质上即深度的神经网络。原创 2025-06-05 14:16:13 · 916 阅读 · 0 评论 -
15种图神经网络变体GNN—GCN、GAT、GAE
选择适配的 GNN 变体或组合(如 RGCN + 图池化用于知识图谱分类),可显著提升模型性能。原创 2025-05-27 20:50:23 · 1035 阅读 · 0 评论 -
吴恩达:如何在人工智能领域打造你的职业生涯?
让每一天都有意义。每年我的生日,我都会思考过去的日子和可能到来的日子。也许你擅长数学;我相信你能通过快速计算回答以下问题。但让我问你一个问题,请凭直觉回答,不要计算。典型的人类寿命是几天?2万天?10万天?100万天?500万天?当我问朋友时,很多人选择了一个数十万计的数字。(其他很多人忍不住要算出答案,这让我很恼火!)当我还是个研究生的时候,我记得把我的统计数据输入一个死亡计算器,算出我的预期寿命。计算器说我可以活 27,649 天。这个数字让我震惊。原创 2025-05-26 21:14:24 · 928 阅读 · 0 评论 -
Transformer解码器如何使用编码器的输出?
将编码器输出的全局语义信息与解码器当前生成的局部信息动态结合,实现了 “根据输入内容指导目标序列生成” 的核心逻辑。与解码器自注意力的输出结合(通过残差连接和层归一化),输入到前馈神经网络(FFN),生成下一个位置的隐藏状态。Q、K、V 均来自解码器当前层输入 ,作用是建模目标序列内部的依赖关系(如已生成词的顺序)Q 来自解码器自注意力,K、V 来自编码器输出,作用是建立目标序列与输入序列的跨模态关联。,从而在生成目标序列时动态地关注输入序列的相关部分。在 Transformer 模型中,原创 2025-05-26 20:01:30 · 990 阅读 · 0 评论 -
如何选择神经网络?CNN、RNN、LSTM八大经典神经网络
终于有博士将深度学习顺序讲清楚了!深度神经网络算法入门到实战最佳学习路径!CNN RNN LSTM GAN一口气学爽!根据具体任务需求、数据类型和计算资源选择模型,并结合迁移学习、模型压缩等技术优化性能。以下是机器学习和深度学习中。原创 2025-05-21 21:05:11 · 779 阅读 · 0 评论 -
八年Java转AI算法工程师自学路线!别再看乱七八糟的教程了(人工智能/计算机视觉/深度学习系统)
精通机器学习算法,主攻计算机视觉方向,线上选课学员30W+,累计开发课程50余门覆盖人工智能热门方向。联通,移动,中信等公司特邀企业培训导师,全国高校教师培训讲师,开展线下与直播培训百余场,具有丰富的授课经验。课程风格通俗易懂,擅长有最接地气的方式讲解复杂的算法问题。具体了解这套计算机视觉【机器学习+深度学习】课程的微信扫码人工智能已从实验室的前沿技术演变为重塑社会的核心力量。它既是职业发展的 “硬通货”,也是参与全球竞争的 “入场券”;既是解决现实问题的工具,也是推动文明进步的杠杆。原创 2025-05-21 15:42:24 · 1150 阅读 · 0 评论 -
图解AI三大核心技术:RAG、大模型、智能体,大模型算法工程师
文章详细介绍了Transformer和混合专家(MoE)两种深度学习架构的差异,包括模型结构、工作原理、性能、计算资源与训练难度以及应用场景。Transformer以其自注意力机制在自然语言处理任务中表现出色,而MoE通过组合多个专家模型处理复杂任务,具有较好的泛化能力。此外,文章还探讨了五种大模型微调技术,如LORA及其变体,以及传统RAG与Agentic RAG的对比,智能体设计模式和文本分块策略。这些内容为Java开发者提供了全面的学习指南,帮助他们在AI大模型领域实现职业转型。原创 2025-05-20 21:08:07 · 740 阅读 · 0 评论 -
Java转行大模型工程师必看AI大模型零基础到商业实战全栈学习路线
人人都要学的AI大模型全栈课》,包含26+真实项目-案例实战演示、24+动手实践、4+原创项目部署大模型,从理论到实践,我们都将给予最大程度的支持,课程学习的目标是,可达到应聘大模型岗位的要求和标准,同时,也能完整掌握AI方面的技术技能,为自己的职业方向赋能。【终于有人讲透大模型工程师自学路线了】别再学乱七八糟的教程了,构建专属大模型!提示工程、 LangChain/NLP/神经网络/数据预处理/LLM生成模型。原创 2025-05-20 16:03:06 · 940 阅读 · 0 评论 -
大模型入门指南 - Prompt Engineering:小白也能看懂的“提示词工程”全解析
通过身份设定框定AI的思考边界,让输出更专业。用于规避通用型废话,提升行业针对性,适用场景:法律文书生成、医疗报告撰写、营销文案创作。【角色】你现在是拥有10年经验的母婴电商运营【任务】分析2024年Q3纸尿裤销售数据【要求】用小红书爆款笔记风格总结增长亮点。原创 2025-05-19 19:50:29 · 817 阅读 · 0 评论 -
大模型入门指南 - MoE:小白也能看懂的“模型架构”全解析
随着国产模型DeepSeekMoE、Qwen-2.5 Max、国际标杆GPT-4的实践验证,MoE已成为下一代大模型的核心架构。路由器(Router)输出概率,用于混合专家(MoE)模型选择最佳匹配专家(Expert),选择的专家(Expert)也是一个前馈神经网络(FFNN)。混合专家(MoE)模型的路由器(Router)是什么?MoE模型:可以堆叠1000个专家,但每次只激活10个(“脑容量”飙升,耗电量不变)。稠密模型:参数越多,计算越慢(“脑容量”和“耗电量”同步增长)。(2)专家越多,能力越强。原创 2025-05-19 19:43:34 · 388 阅读 · 0 评论 -
惊爆!调参黑科技曝光,导师为何刻意隐瞒?错过再等一年
当你深入深度学习,调参却成 “拦路虎”。学习率、权重系数等参数稍调不对,模型就 “罢工”,最优参数组合更是难寻。花大量时间调参,模型准确率却 “原地踏步”,过拟合、欠拟合还常来捣乱,不禁让人感叹:调参咋这么难?神经网络架构复杂,参数设置变化无穷,尝试新组合不仅耗费资源,效果还不理想,调参痛点亟待破解。今天就和大家好好聊聊调参这件事。本章节内容颇为丰富,我们会以多篇文章的形式,逐一展开讲述。接下来,为大家呈现关于深度学习调参指南的内容导图。在正式开始之前,我把我们整理的。原创 2025-05-17 15:40:59 · 925 阅读 · 0 评论 -
用AI写代码,怎么问问题啊!?大模型、机器学习入门到实战
别让大模型成你的遮羞布!90%开发者被AI坑在『不会问问题』一位高级工程师描述,他有次带人用AI优化SpringBoot接口,实习生兴奋地说:“大模型生成CRUD这样的基础内容太强了!根本就不用人来干预。”但我注意到生成的代码缺少事务管理,问他为什么不用@Transactional注解,实习生居然反问:"那个注解是干什么的?原创 2025-05-17 11:22:10 · 557 阅读 · 0 评论 -
【计算机视觉】从AlexNet到Vision Transformer
在正文开始之前,先给大家带来一个超值福利!为了方便同学们快速开启人工智能学习计划,在学习过程中少走弯路用最快的效率入门Ai并开始实战项目。我们整理了近200个Ai实战案例和项目,这些并不是网上搜集来的,而是我们这五年线上线下教学所开发和积累的案例。-* 可以说都是反复迭代更新出来的,适合同学们来进行循序渐进的学习与练手。需要的扫码。原创 2025-05-16 21:12:00 · 853 阅读 · 0 评论 -
面试官必问:一文读懂VGG、GoogleNet、ResNet到底是什么?
VGG(Visual Geometry Group)是由牛津大学视觉几何组提出的深度卷积神经网络,它在 2014 年的 ImageNet 大规模视觉识别挑战赛(ILSVRC)中取得了优异的成绩。VGG 的主要贡献在于证明了增加网络的深度可以显著提高模型的性能,其网络结构简单且规整,具有很强的可扩展性。GoogleNet(也称为 Inception 网络)是由 Google 团队在 2014 年提出的深度卷积神经网络,它在 ImageNet 挑战赛中夺冠。原创 2025-05-15 16:52:06 · 745 阅读 · 0 评论 -
掌握反向传播:神经网络综合指南
反向传播算法于 1970 年代推出,是一种根据前一次迭代或纪元中获得的误差率微调神经网络权重的方法,这是训练人工神经网络的标准方法。你可以把它看作是一个反馈系统,在每一轮训练或 “纪元” 之后,网络都会审查其在任务上的表现。它计算其输出与正确答案之间的差异,称为错误。然后,它会调整其内部参数或 'weights' 以减少下次的误差。这种方法对于调整神经网络的准确性至关重要,并且是学习做出更好预测或决策的基础策略。原创 2025-05-14 22:21:43 · 945 阅读 · 0 评论 -
频上Nature中科院一区!?多尺度注意力,显著涨点效果与强大的启发性
今天要给大家分享一个极具潜力的创新点 ——多尺度注意力,凭借其显著的涨点效果与强大的启发性,近来在学术界热度持续飙升。在目标检测领域,多尺度特征融合技术发挥着关键作用。将浅层网络细腻的细节特征,与深层网络富含语义的特征相结合,让小目标和遮挡目标无所遁形,显著提升检测性能。医学影像分割领域亦是如此,借助多尺度特征融合,能够精准捕捉病灶区域形态的多样性以及边界的模糊性,极大提高分割精度,为医疗诊断提供有力支持。不过,当下这一领域仍存在诸多挑战。原创 2025-04-28 15:30:26 · 671 阅读 · 0 评论 -
八年经验告诉你,强化学习的顺序千万不要学反了!
强化学习入门需要系统性掌握基础概念、核心算法、工具平台和实践路径。原创 2025-04-27 11:18:46 · 523 阅读 · 0 评论 -
使用 BERT 进行自然语言处理:动手指南
什么是自然语言处理 (NLP)?了解什么是自然语言处理 (NLP) 并发现其实际应用,使用 Google BERT 处理文本数据集。自然语言处理 (NLP) 通过使用机器学习来指示文本的结构和含义,从而改善了人类和计算机相互交流的方式。借助自然语言处理应用程序,组织可以通过分析文本和提取更有意义的信息来改善客户体验,从而提高工作效率并降低成本。读研期间如何快速入门NLP?博士花17小时精讲Transformer+Huggingface+自然语言处理12大项目实战—HMM、贝叶斯算法、LSTM。原创 2025-04-18 20:10:45 · 884 阅读 · 0 评论 -
初学者如何入门PyTorch
PyTorch是当前最受欢迎的深度学习框架之一,其动态计算图、直观的API设计和强大的GPU加速能力使其成为科研与工程领域的首选工具。以下从核心概念到实践应用的全方位解析将帮助你快速掌握PyTorch的核心技术。【转行分享】35+职场人破局AI领域,真的可行!详细图可关助我的V.X【服务号】AI技术星球 发送:211C 自取学习路线+200G资料包PyTorch的基础数据结构是多维数组张量,支持CPU/GPU运算。与NumPy的ndarray不同,PyTorch张量支持自动微分(Autograd):原创 2025-04-18 19:51:49 · 1058 阅读 · 0 评论 -
什么样的偏好,才叫好的偏好?——揭秘偏好对齐数据的「三驾马车」大模型LLM
这可能表明,在追求复杂标注流程时,过多的人类要求引入了噪音,而使用简约的标注 Prompt 并利用标注模型的固有判断力,比使用复杂的标注 Prompt 更契合真实世界的偏好信号,这和 DeepSeek-R1-Zero 在 Zero-RL 过程中使用的简约 prompt 有着异曲同工之妙。因此我们研究了不同混合策略的影响。:如图 4(中)所示,在控制各组分数差距的分布一致的前提下,高分回复对(正样本分数≥8)在所有基准测试中都取得了最显著的性能,总体上比低分回复对(正样本分数<7)高出 +9.35。原创 2025-04-17 14:34:04 · 1112 阅读 · 0 评论 -
ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
时间序列中的自相关性指的是「序列在不同时间步之间的相关性」,在时间序列预测中,这种自相关性既存在于模型的输入序列(历史观测值之间的相关性),也存在于标签序列(不同步标签之间的相关性)。通过可视化预测序列发现,FreDF 生成的预测序列与真实标签序列之间的拟合度更高,能够更准确地捕捉到标签序列中的高频成分,同时抑制明显的噪声和异常波动。进一步,提出一种基于频域标签训练的新范式——FreDF,只需加入一行代码,即可在主流模型上实现预测精度的稳定提升。:第 t 时刻的标签不仅和输入有关,也和上一时刻的状态有关。原创 2025-04-17 14:26:17 · 740 阅读 · 0 评论 -
【转行分享】35+职场人破局AI领域,真的可行!
有学员反馈,老师在课堂上分享的实际项目案例,对理解和应用知识帮助巨大,感觉就像有了行业内的领路人。而且,现在报名还有超多福利!,在这个行业摸爬滚打多年,虽然积累了不少经验,但随着行业发展,他越发觉得遇到了职业瓶颈,晋升空间有限,每天重复着相似的工作,看不到未来的方向。💰 价格方面也很友好,考虑到大家的经济压力,提供了多种分期方式,像花呗、信用卡分期免息,还有咕泡专属教育分期,让你可以轻松无压力地开启学习之旅。如果你也像王俭一样,在 35 + 的年纪渴望突破职业瓶颈,想转行人工智能,那就别再犹豫啦!原创 2025-04-17 14:05:08 · 715 阅读 · 0 评论 -
一文搞懂自注意力(PyTorch)
自注意力机制是Transformer模型的核心组件,它允许模型在处理序列数据时,通过计算序列中不同位置元素之间的相关性得分,动态地调整对每个元素的关注程度,从而捕捉到序列内部的复杂依赖关系。自注意力机制(Self- Attention)是什么?自注意力机制能够动态地捕捉序列中不同位置元素之间的依赖关系,并根据这些依赖关系生成新的序列表示。它之所以被称为“自注意力”,是因为它在单一序列中通过计算序列元素之间的相互依赖关系来生成新的特征表示。这与传统的注意力机制有所不同,后者通常涉及两个序列之间的交互。自注意力原创 2025-04-16 19:36:18 · 560 阅读 · 0 评论 -
最强组合!随机森林和LSTM!进行时间序列预测
咱们今天和大家聊聊在机器学习和深度学习领域,(Random Forest)和(LSTM)各自在处理数据时具有独特的优势。那么,将两者结合可以发挥它们各自的优点,从而提升模型的性能~:随机森林能够通过集成多个决策树来提高泛化能力,减少过拟合。而LSTM擅长处理时间序列数据,通过在时间维度上捕捉长期依赖关系。将两者结合,可以利用随机森林的集成优势和LSTM的序列建模能力。:LSTM在时序数据中的表现非常优秀,但它可能会受到梯度消失和爆炸的影响。原创 2025-04-16 13:59:03 · 1398 阅读 · 0 评论 -
一文搞懂基于知识图谱的多模态推理
基于知识图谱的推理通常依赖于神经网络模型来捕捉图谱中的结构信息,这些模型通过前向传播过程进行推理预测。例如,采用基于图神经网络(GNN)的推理方法,特别是基于注意力机制的图卷积神经网络(Graph Attention Network,GAT),该方法通过计算实体之间的相似度并为它们分配相应的权重,从而推断出实体之间的关系。原创 2025-04-14 14:19:50 · 509 阅读 · 0 评论 -
一文搞懂多模态学习(多模态融合 + 跨模态对齐)
数据级融合是在预处理阶段将不同模态的原始数据直接合并,适用于高度相关和互补的数据场景。原创 2025-04-11 14:20:49 · 894 阅读 · 0 评论 -
时间序列预测,out!!Informer、TimesNet、TimeLLM
大佬Christoph Bergmeir的PPT讨论了多个时间序列模型的问题,讲了一些常见时间序列模型的问题以及一些trick:常见模型问题总结接下来是常见的深度学习时间序列模型存在的问题。。也是老生长谈的问题了,公开数据集杀疯了,一测一个sota;私有数据集上拉跨,一测一个不吱声。原创 2025-04-10 19:48:46 · 348 阅读 · 0 评论 -
新手小白如何快速入门深度学习
深度学习是机器学习的一个子集,通过构建多层神经网络模拟人脑的抽象和推理能力,特别擅长处理图像、语音、文本等非结构化数据。其核心优势在于自动特征提取能力,相比传统机器学习依赖人工设计特征,深度学习通过多层非线性变换自动发现数据中的隐藏规律。原创 2025-03-20 21:14:51 · 819 阅读 · 0 评论 -
YOLO遇到Transformer:天花板在哪?
YOLO与Transformer的融合在精度-效率平衡和复杂场景泛化上仍有提升空间,其天花板受限于硬件算力与算法创新的协同突破。当前最适配人群为需高精度检测且具备计算资源的工业与科研团队,而医疗与无人机领域是近期落地热点。原创 2025-03-19 19:40:53 · 560 阅读 · 0 评论 -
机器学习的分类有哪些常见的方式?监督学习、无监督学习
特点:将已学知识迁移到新任务(如用ImageNet预训练模型做医学图像分类)。通过组合不同分类方式,可灵活应对实际问题(如用生成模型做半监督分类)。特点:不假设数据分布,模型复杂度随数据量增长(如KNN、决策树)。特点:结合多个弱模型提升性能(如随机森林、XGBoost)。特点:利用数据自身构造监督信号(如BERT通过掩码预测学习)。特点:用极少量样本训练模型(如Meta-Learning)。特点:数据逐步输入,模型动态更新(如实时广告点击预测)。监督学习(Supervised Learning)原创 2025-03-13 20:11:16 · 844 阅读 · 0 评论 -
刚读研一,打算学YOLO目标检测,请问要怎么入门?
要系统学习YOLO(You Only Look Once)算法,需要从理论基础、编程实践、框架应用及项目实战四个维度展开。原创 2025-03-04 17:45:19 · 967 阅读 · 0 评论 -
AI书籍:强化学习的艺术:Python 第一版的基础、数学和实现
通过这份全面的指南,释放强化学习 (RL) 的全部潜力,这是人工智能的一个重要子领域。本书深入探讨了 RL 的核心概念、数学和实用算法,帮助您全面了解这项尖端技术。本书首先概述了马尔可夫决策过程、动态规划、蒙特卡洛方法和时间差异学习等基本概念,并使用清晰简洁的示例来解释 RL 理论的基础知识。以下部分介绍价值函数近似,这是 RL 中的一种关键技术,并探讨了各种策略近似,例如策略梯度方法和高级算法,如近端策略优化 (PPO)。原创 2025-03-03 20:55:54 · 482 阅读 · 0 评论 -
DeepSeek15天指导手册一从入门到精通
在自动驾驶领域,它通过深度视觉技术帮助汽车实时感知和理解环境,结合多模态数据融合技术,实现更安全、高效的自动驾驶。同时,DeepSeek的智能视频处理能力也在安防、应急指挥等领域发挥重要作用,通过高精度的目标检测和图像分割,提升公共安全水平。:DeepSeek展现出巨大潜力。:DeepSeek通过优化生产流程中的设备操作和维护,结合传感器数据实时监控生产线状态,有效提升了生产效率和产品质量。这些应用场景充分展示了DeepSeek大模型在不同领域的强大适应性和创新潜力,为各行各业的智能化转型提供了有力支持。原创 2025-02-11 13:46:07 · 469 阅读 · 0 评论 -
使用ppo算法解决两足机器人的步行问题,该从什么开始学呢?
通过以上步骤,从基础理论到实践案例,逐步掌握使用PPO算法解决两足机器人步行问题的关键技术和实现方法。结合仿真平台和现有工具,进行实践操作,进一步深化理解和应用能力。2024年零基础AI学习路线部分新增内容。原创 2024-12-26 17:01:14 · 1115 阅读 · 0 评论