自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(99)
  • 收藏
  • 关注

原创 AI学的好,轻松拿高薪--人工智能大厂面试题

导读:现在有很多的程序员都想转行做人工智能工资高这方面的,特别是许多的研究生们也是有想走人工智能这条路,的确,对于他们来说,想要更高的薪酬,走这条路就是一个不错的选择!进大厂是不是都是大家的梦想,这里整理了一些面试题目感兴趣的可以了解一下,如若整理不当,大家可以踊跃留言还有哪些面试问题的呀!以下15个机器学习工程师面试题你是否能全部回答呢?1、你会在时间序列数据集上使用什么交叉验证技术?是用k倍或LOOCV?2、你是怎么理解偏差方差的平衡的?3、给你一个有1000列和1百万列的

2021-11-03 15:28:31 2815

原创 人工智能对图像处理常用的四大算法

欢迎大家扫描文末的二维码进行咨询(学习交流、大牛答疑、大厂内推)另外我还整理了整整200G的人工智能学习笔记、课程视频、面试宝典一并可以无套路免费分享给大家!这是小编的其他文章,希望对大家有所帮助,点击即可阅读人工智能常用的十大算法 人工智能数学基础(一) 人工智能数学基础(二)人工智能数学基础(三) 人工智能数学基础(四)遗传算法(Genetic Algorithm,GA)遗传算法是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。进化算法最初是...

2021-10-08 19:20:56 7886

原创 人工智能必备数学基础(一)

导读:数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上,要了解人工智能,首先要掌握必备的数学基础知识。整理了有关人工智能的资料,有python基础,图像处理opencv\自然语言处理、机器学习数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生也非常实用,无任何套路免费提供,,加我裙【966367816】下载,或者扫码+vx 也可以领取的内部资源,人工智能题库,大厂面试题 学习大纲 自学课程大纲还有200G人工智

2021-09-18 14:31:16 2653

原创 人工智能的常用十种算法

导读人工智能发展速度非常的快,

2021-09-15 15:32:34 21915

原创 新手小白如何快速入门深度学习

深度学习是机器学习的一个子集,通过构建多层神经网络模拟人脑的抽象和推理能力,特别擅长处理图像、语音、文本等非结构化数据。其核心优势在于自动特征提取能力,相比传统机器学习依赖人工设计特征,深度学习通过多层非线性变换自动发现数据中的隐藏规律。

2025-03-20 21:14:51 725

原创 YOLO遇到Transformer:天花板在哪?

YOLO与Transformer的融合在精度-效率平衡和复杂场景泛化上仍有提升空间,其天花板受限于硬件算力与算法创新的协同突破。当前最适配人群为需高精度检测且具备计算资源的工业与科研团队,而医疗与无人机领域是近期落地热点。

2025-03-19 19:40:53 360

原创 机器学习的分类有哪些常见的方式?监督学习、无监督学习

特点:将已学知识迁移到新任务(如用ImageNet预训练模型做医学图像分类)。通过组合不同分类方式,可灵活应对实际问题(如用生成模型做半监督分类)。特点:不假设数据分布,模型复杂度随数据量增长(如KNN、决策树)。特点:结合多个弱模型提升性能(如随机森林、XGBoost)。特点:利用数据自身构造监督信号(如BERT通过掩码预测学习)。特点:用极少量样本训练模型(如Meta-Learning)。特点:数据逐步输入,模型动态更新(如实时广告点击预测)。监督学习(Supervised Learning)

2025-03-13 20:11:16 765

原创 刚读研一,打算学YOLO目标检测,请问要怎么入门?

要系统学习YOLO(You Only Look Once)算法,需要从理论基础、编程实践、框架应用及项目实战四个维度展开。

2025-03-04 17:45:19 920

原创 AI书籍:强化学习的艺术:Python 第一版的基础、数学和实现

通过这份全面的指南,释放强化学习 (RL) 的全部潜力,这是人工智能的一个重要子领域。本书深入探讨了 RL 的核心概念、数学和实用算法,帮助您全面了解这项尖端技术。本书首先概述了马尔可夫决策过程、动态规划、蒙特卡洛方法和时间差异学习等基本概念,并使用清晰简洁的示例来解释 RL 理论的基础知识。以下部分介绍价值函数近似,这是 RL 中的一种关键技术,并探讨了各种策略近似,例如策略梯度方法和高级算法,如近端策略优化 (PPO)。

2025-03-03 20:55:54 465

原创 DeepSeek15天指导手册一从入门到精通

在自动驾驶领域,它通过深度视觉技术帮助汽车实时感知和理解环境,结合多模态数据融合技术,实现更安全、高效的自动驾驶。同时,DeepSeek的智能视频处理能力也在安防、应急指挥等领域发挥重要作用,通过高精度的目标检测和图像分割,提升公共安全水平。:DeepSeek展现出巨大潜力。:DeepSeek通过优化生产流程中的设备操作和维护,结合传感器数据实时监控生产线状态,有效提升了生产效率和产品质量。这些应用场景充分展示了DeepSeek大模型在不同领域的强大适应性和创新潜力,为各行各业的智能化转型提供了有力支持。

2025-02-11 13:46:07 376

原创 使用ppo算法解决两足机器人的步行问题,该从什么开始学呢?

通过以上步骤,从基础理论到实践案例,逐步掌握使用PPO算法解决两足机器人步行问题的关键技术和实现方法。结合仿真平台和现有工具,进行实践操作,进一步深化理解和应用能力。2024年零基础AI学习路线部分新增内容。

2024-12-26 17:01:14 989

原创 机器学习中有哪些形式简单却很巧妙的idea?

在机器学习领域,有许多形式简单却非常巧妙的想法(idea)。这些想法往往能够在保证算法简洁性的同时,解决复杂的问题。下面列出了一些典型的例子:原理:Isolation Forest通过递归地将数据空间分割成子空间,来识别异常点。异常点通常更容易被孤立,因为在空间中与其他点的距离更远。通过构建多棵随机分割的二叉树(隔离树),那些在少数几步分割中就被孤立的点更可能被标记为异常点。 应用场景:异常检测在金融欺诈识别、网络安全等领域有着广泛应用。 原理:Word2Vec通过训练神经网络来预测词语在句子中的出现概率

2024-12-19 16:51:20 948

原创 硕士论文写YOLO可以毕业吗?

YOLO算法是一种革命性的目标检测方法,它巧妙地将复杂的问题转化为简单的回归任务。通过,每个网格负责预测位于其中心的目标,实现了端到端的目标检测。这种方法不仅简化了问题,还显著提升了检测速度。YOLO的核心创新在于,无需额外的候选区域生成步骤。这种统一的框架使得YOLO能够在保证较高准确率的同时,实现极高的检测速度,成为实时目标检测领域的里程碑式算法。YOLO算法自2016年问世以来,经历了多个重要版本的演进,不断推动着实时目标检测技术的进步。以下是各版本的主要特点和发展时间线:YOLOv6。

2024-12-07 17:00:14 1450

原创 行为识别:基于3D卷积的视频分析与动作识别,Openpose、姿态估计

3D卷积是一种扩展自2D卷积的技术,专门设计用于处理三维数据。它在三个维度上操作,特别适用于处理视频或医学影像等三维数据。其核心思想是在输入数据上滑动一个三维卷积核,执行元素乘法并求和,生成新的三维输出数据块。这一过程可以用数学公式表示为:其中,I代表输入数据,K代表卷积核,O代表输出数据。这种操作使3D卷积能够有效捕捉时空特征,为后续的高级视觉任务提供强大支持。在深度学习领域,2D卷积和3D卷积都是处理图像和视频数据的重要工具,但它们在原理和应用上有显著差异。

2024-12-03 15:44:51 858

原创 注意力机制中生成的类似热力图或者柱状图是如何生成的

注意力机制是深度学习中的一种关键机制,模拟人类视觉系统的聚焦功能。它通过评估元素间相关性并分配权重,使模型能专注于处理最相关信息。这一机制不仅提高了模型效率,还增强了其解释性。在自然语言处理和计算机视觉等领域,注意力机制已成为提升模型性能的重要工具,尤其在处理序列数据时表现突出。通过引入注意力机制,模型能在复杂的输入数据中快速定位关键信息,实现更精准的任务执行。

2024-11-27 18:47:23 1422

原创 在 CV 领域里 low-level vision 前景怎么样?

在计算机视觉的研究体系中,

2024-11-26 18:42:51 785

原创 只想水篇sci毕业,现在做医学图像分割改UNet网络还能行吗?

在结论部分,再次强调研究的主要创新点。这不仅是对全文的总结,也是对读者的提醒,确保他们记住研究的核心贡献。如果适用,可以提及这些创新在未来研究中的潜在应用,进一步强化其重要性。

2024-11-20 15:45:55 909

原创 研究生如何写图像分类方向的论文

图像分类是计算机视觉领域的核心问题,涉及将图像分配到预定义类别。近年来,,尤其是卷积神经网络(CNN),显著提升了分类精度。当前研究热点聚焦于和。同时,为应对计算成本和数据需求高的挑战,和成为关键研究方向。这些进展不仅提高了分类效率,还拓展了图像分类在医疗诊断、自动驾驶和安全监控等领域的应用前景。:研究如何改进现有的深度学习模型,如卷积神经网络(CNN)。可以探索新的网络架构,如自注意力机制或可变形卷积,以提高模型的特征提取能力。

2024-11-16 17:16:35 1272

原创 一文详解缺陷检测

缺陷检测是指通过各种技术手段,对工业产品的表面或内部进行检测,以识别出可能存在的缺陷,如裂纹、划痕、污渍、尺寸偏差等。随着科技的发展,缺陷检测技术也在不断进步,从传统的人工检测逐渐向智能化、自动化的检测方式转变。缺陷检测技术在多个行业中扮演着至关重要的角色,尤其在和中表现突出。在制造业中,该技术广泛应用于,如识别金属零件的划痕、涂层瑕疵等。同时,在方面也发挥着重要作用,确保产品符合严格的标准。在电子产业中,特别是制造方面,缺陷检测技术更是不可或缺。它能有效识别PCB上的各种缺陷,如。

2024-11-15 16:47:45 1700

原创 研究生如何写YOLO方面的论文

对于特定研究需求,可能需要构建自定义数据集。这涉及图像采集、标注和数据清洗等工作。在构建过程中,应注意保持数据的多样性和代表性,以确保模型的泛化能力。

2024-11-15 14:46:51 2141

原创 大模型+强化学习(PPO算法、RLHF、DPO技术)

大模型是人工智能领域的重要突破,代表了机器学习模型向更大规模、更强能力发展的趋势。这些模型通常具有。

2024-11-12 16:06:24 3080

原创 OpenCV停车场车位检测详解

综合以上讨论,基于OpenCV的停车场车位检测技术通过一系列图像处理和机器学习算法,实现了高效的车位识别。传统方法如SVM和LBP在特定环境下表现良好,但在复杂场景中存在局限。深度学习特别是CNN和YOLOv5的应用,大大提高了系统的实时性和鲁棒性,能够应对各种复杂环境。未来的研究方向将继续围绕如何提升低质量图像的识别率、增强模型的泛化能力和优化计算效率展开。

2024-11-08 14:12:16 1464 1

原创 3D点云原理及应用

3D点云是。

2024-11-08 13:42:03 2139

原创 一文了解机器学习算法原理及应用(回归算法、神经网络、聚类算法...)

机器学习是人工智能领域的核心技术之一,它通过。

2024-11-05 11:31:53 1626

原创 如何使用 PyTorch 构建具有真实数据集的神经网络,使用 FitBit Fitness Tracker 数据集构建和训练神经网络的分步指南

现在,我们将开始从 PyTorch nn.模块。没有特定的规则来规定层数和每层中的节点数。通常,需要多轮反复试验才能找到有效的正确数字。一条经验法则是,网络应该足够小以便快速处理,并且应该足够大以高精度解决预期问题。我们的模型由 3 层、3 个激活函数和 1 个输出层组成。1、模型的第一层。

2024-10-29 16:56:31 633

原创 ICML 2024 顶级论文:机器学习领域的新变化

最佳论文奖获得者今年的决议之一是分享来自领先 AI 会议的论文,以了解最新更新。这些场合通常是 ML 和计算机视觉等领域的趋势和创新出现的地方。此外,夏季是理想的时间,因为在此期间会举办许多此类活动。ICML 是机器学习国际会议,目前正在奥地利首都维也纳举行。与每年一样,与其他顶级 AI 会议一样,提交了数千篇论文,接受率相对较低(过去三年不到 28%)。例如,今年的版本提交了 9,653 篇论文,仅接受 2,609 篇,接受率为 27.03%。

2024-10-29 11:29:10 2112

原创 研究生如何写图像处理论文!选题、研究方法、撰写、投稿、学术道德

明确指出本文解决了什么问题,有何创新。

2024-10-28 14:20:00 1400

原创 在 PyTorch 中实现 Vision Transformer 分类器

我决定研究常规变压器的扩展:视觉变压器。顾名思义,这种类型的 transformer 将图像作为输入,而不是单词序列。本博客将概述 Vision Transformer 的架构,并在 CIFAR100 数据集上实现基于 Vision Transformer 的分类器。顾名思义,视觉转换器是应用于图像数据的转换器。它们通常是基于编码器的,这意味着不需要自注意力掩码。每个查询向量都可以使用每个关键向量来生成注意力权重。与文本序列不同,图像天生不适合输入到 transformer 中。

2024-10-26 15:19:24 1261

原创 使用 PyTorch 深入了解图神经网络:简单指南

想象一下你有一个朋友网络。每个朋友 (节点) 都有特定的特征,而友谊 (边缘) 将它们连接起来。GNN 通过查看每个朋友的特征以及他们的联系方式来帮助我们了解这个网络。把它想象成根据谁认识谁和他们的个性来弄清楚谁受欢迎。GNN 类似于卷积神经网络 (CNN),但它们不是处理图像,而是处理图形 — 互连点的网络。它们通过在节点之间传递消息来学习,根据每个节点的邻居更新他们对每个节点的理解。

2024-10-26 14:43:59 673

原创 还是原装Transformer好!北大清华团队同时揭示Mamba等推理短板

然而,输出序列的可能性指数级增长,这使得这些架构无法以较小的模型尺寸正确生成所有可能的输出。来自清华的研究团队则在 Mamba 和 Transformer 上使用判定图是否为树的任务进行训练,表明 Transformer 结构在此问题上相比于 Mamba 所具有的显著优势,以及在 RNN 上使用上下文检索对性能的影响。同时,他们的实验结果也表明了良好的推理局部性(下图右列)能够增强多种 Efficient Transformers 的思维链推理能力,表现在使用相同尺寸的模型时能够解决规模更大的推理任务。

2024-10-24 16:36:23 524

原创 时间序列预测原理、方法、应用案例

例如,Evolutionary attention-based LSTM(EA-LSTM)通过进化计算启发的竞争随机搜索方法配置注意力层参数,提高了模型的泛化能力和预测精度。:分布式光伏电站的发电量受天气和地理位置的影响较大,通过融合多种时间序列特征和模型(如M2E-DPV模型),可以提高中长期预测的准确性。时间序列数据的核心对象是序列中的数据点,按时间递增排序,即按时间的自然顺序排列。:通过引入核函数(如径向基函数RBF),SVM能够有效地处理复杂的非线性关系,这对于许多现实世界的时间序列数据尤为重要。

2024-10-22 17:02:14 1712

原创 没数据?不做实验?临床医生如何发文章?

1、优点:认可度比较高,除某些特殊要求外,不需要学习特定的软件。2、缺点:疾病种类有限,大样本的数据能够帮我们获得更加可靠的结论,同时也能提高文章的档次,认可度很不错。不过,遗憾的是,目前相关的数据库并不是很多。

2024-10-18 17:31:20 1134

原创 一文了解深度学习模型:CNN、RNN、GAN、transformer

深度学习是一种模仿人脑神经网络结构和功能的机器学习方法,通过构建多层神经网络模型,自动从大规模数据中学习复杂的特征表示。其核心原理包括和层次化特征提取:通过多层非线性变换,逐步提取数据的高级语义特征端到端学习:直接学习输入与输出间的映射关系,无需人工干预这种机制使深度学习能有效处理高维、非线性数据,在图像识别、语音识别和自然语言处理等领域展现出卓越性能。

2024-10-17 17:22:18 7827

原创 什么是Transformers?详解“Attention is All You Need” — Transformer 架构

尽管围绕等生成使用如 GPT、BERT、Cohere、LLAMA、Mistral 等)的所有嗡嗡声,看看影响这一切的工作至关重要。💡让我们深入了解变形金刚的世界——不,不是来自外太空的变形机器人(撇开这个愚蠢的笑话不谈)——而是自然语言处理 (NLP) 领域的底层模型,它改变了机器理解和生成类似人类文本的方式。让我们从了解开始。准备了一份人工智能入门到进阶的学习攻略包,还有一份论文攻略包。需要哪个可以看下图获取。

2024-10-10 15:02:49 1039

原创 ECCV 2024 | 像ChatGPT一样,聊聊天就能实现三维场景编辑

完成 3D 场景映射到 2D 图集后,可以在图集上完成场景的编辑,然而直接编辑两个图集再将其映射回场景视图,通常不会得到令人满意的编辑结果,这主要是因为单个图集包含的场景信息不完整,尤其是在稀疏的前景图集中。为了实现任意视觉模型的集成,本文先设计 Hash-Atlas 的映射网络,将对 3D 场景的编辑转换为对 2D 空间内的图集编辑操作,从而实现了 2D 多视角编辑与 3D 场景重建过程的完全解耦,因此,本文将无需固定的 3D 表示形式和 2D 编辑方法。(3)需要更快、更精确的映射,以便于高效编辑。

2024-10-07 16:58:35 1147

原创 ECCV2024奖项公布,哥大摘最佳论文,微软COCO数据集获经典论文奖

这种技术消除了对渲染近似或前向传递其他修改的需求,保持了渲染图像的完整性,使其适用于光栅化的掩码、深度和法线图像,而在这些情况下滤波是不可行的。我们的方法通过精心设计的近似策略,优雅地简化了传统上复杂的问题,从而实现了一个直接、有效且高性能的解决方案。这种创新方法在保护隐私和节能方面展现出巨大潜力,同时又能有效完成特定的视觉任务,为未来视觉技术的发展提供了新的思路。出于伦理和法律考虑,科学界正在积极开发方法,以限制文本到图像扩散模型的滥用,防止在生成的图像中复制受版权保护的、暴力的、露骨的或个人信息。

2024-10-06 16:42:53 1161

原创 LongLLaVA:首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

多模态大语言模型(MLLMs)的快速进步展示了它们在各个应用领域中的显著能力。然而,多图像理解场景仍然是一个重要但尚未充分探索的方面。特别是,将 MLLMs 的应用场景扩展到理解更长的视频、更高分辨率的图像以及基于更多历史信息的决策,对于提升用户体验和进一步拓展 MLLMs 的应用范围至关重要。然而,将 MLLM 的上下文长度扩展以提高其可用性,面临着处理更多图像时性能下降和计算成本高昂的挑战。一些研究专注于构造包含多个图像的长上下文训练数据,以增强性能。其他研究探索了创新性的训练策略,以减轻性能下降。

2024-09-30 16:27:30 1199

原创 李飞飞团队发布ReKep:机器人“空间智能”获突破性进展,整合GPT-4o

什么是关系关键点约束(Relational Keypoint Constraints,ReKep):这部分讨论了ReKep的定义,它是一种用于表示机器人操作任务中关键点之间空间关系的方法。如何使用ReKep将操作表述为一个带约束的优化问题:这部分介绍了如何将机器人操作过程中的约束条件整合到优化问题中,通过ReKep定义目标关键点关系和路径约束。我们的算法实例能够实时解决优化问题:此处提到了一种算法实现,它能够实时解决上述定义的优化问题,从而指导机器人的动作。

2024-09-30 14:11:22 1281

原创 用于知识图谱集成的 LLM 提示工程技术

大型语言模型 (LLM) 通常通过自我监督深度学习技术对数万亿个单词进行训练。从头开始培训 LLM 需要大量的时间和资源。幸运的是,有几种技术可以根据自定义要求调整模型。

2024-09-26 16:43:56 832

原创 检索增强一代 (RAG) 使用 LangChain、LlamaIndex 和 OpenAI从基础到高级

在本文中,我们探讨了 RAG 的基本原理,并使用 LangChain 和 LlamaIndex 成功开发了基础和高级 RAG 系统。我希望这篇文章对您有所帮助。我建议探索其他高级 RAG 技术并使用不同的数据类型(如 CSV)以获得更多经验。

2024-09-24 17:36:59 1001

SCI论文idea形成方法

SCI论文idea形成方法 1、大量阅读论文 2、模仿复现 3、深度思考 4、频繁交流 5、反复迭代

2024-09-25

研一刚结束,图像处理哪个方向比较好做,只想水论文毕业?

如何准备一篇论文思维导图

2024-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除