- 博客(735)
- 资源 (49)
- 收藏
- 关注
原创 机器学习中的自监督学习概述与实现过程
这种学习方式通过使用带有标签的数据集进行训练,目的是使机器能够学习到数据之间的关联性,并能够对新的、未见过的数据做出预测或分类。应用领域包括语音识别、图像识别、医学诊断等。监督学习通常需要大量的标注数据,因此获取和维护这些数据集可能非常昂贵和耗时。:非监督式学习使用未标注的数据,通过算法来发现数据中的结构和模式。这种学习方式适合于市场细分、社交网络分析、异常检测等任务。自监督学习 (Self-Supervised Learning) 是非监督学习的一种,它通过从数据本身生成伪标签来训练模型。
2025-04-01 23:08:53
350
原创 深度学习——深入解读各种卷积的应用场景优劣势与实现细节
本文介绍了深度学习中常见的多种卷积类型,包括它们的定义、工作原理、优缺点以及应用场景。通过这些介绍,希望能帮助读者更好地理解卷积在深度学习中的作用,以及如何根据具体需求选择合适的卷积类型。
2025-03-31 14:02:00
721
原创 计算机视觉——传统数字图像处理中图像去噪原理与代码实现细节
在现实世界中捕获的图像常常受到噪声的影响,这些噪声可能来源于环境因素、信号不稳定、相机传感器问题、照明条件差、电损失等多种因素。为了进一步处理这些图像并对结果进行准确解释,拥有尽可能低噪声的图像至关重要。图像去噪是数字图像处理中的一个关键过程,其目标是通过减少噪声来提高图像的视觉质量。这一领域具有挑战性,因为它不仅需要理解图像中的噪声类型,还需要应用能够有效减少噪声并提供更准确原始图像表示的去噪方法。
2025-03-31 11:07:00
818
原创 Python实现概率分布公式及可视化
在机器学习或者深度学习课题里,时常要频繁地使用统计概率的理论来辅助进行数据处理与研究。因此,理解和掌握一定的统计概率知识是非常必要的。在科学研究和城市研究领域,统计概率理论的应用也十分常见。随机变量 (Random Variable):一个随机变量是一个可以取多个可能值的量,这些值是根据某种概率分布来确定的。密度函数 (Density Functions):在连续随机变量中,密度函数描述了随机变量的可能取值范围内每个值出现的概率密度。它通常用于计算概率、期望值等。
2025-03-30 19:36:39
948
原创 图像相似性搜索算法比较 ——对比EfficientNet、 ViT、 VINO 、 CLIP 、 BLIP2算法优劣与场景测试
EfficientNet(CNN 架构):不擅长捕捉超出像素信息的语义。:比 CNN 更好,但仍然专注于像素信息而不是图像的含义。DINO-v2:可以捕捉图像的语义,并且倾向于专注于前景物体。CLIP:可以捕捉语义,但有时可能会受到可以从图像中读取的语言信息的强烈影响。BLIP-2:可以捕捉语义,是其他模型中最优越的结果。综上所述,在进行图像相似性搜索时,应该优先选择 DINO-v2 或 BLIP-2 以获得更好的结果。如果专注于图像中的物体,应该使用 DINO-v2。
2025-03-30 10:09:40
1044
原创 DeepSeek-R1私有化部署——DeepSeek-R1模型微调原理与代码实现
在微调大语言模型(LLM)的过程中,开发者常常会面临一系列技术挑战。显存不足?如果显存资源有限,可以采用 LoRA(低秩适配)技术结合 4-bit 量化,显著降低显存占用,同时保持模型性能。此外,云端训练也是一个不错的选择,借助强大的云服务资源,可以轻松应对大规模模型的训练需求。数据集太小?当数据集规模较小时,模型容易出现过拟合现象,导致无法泛化到新的数据。此时,可以运用数据增强技术,如同义词替换、句子重组等,增加数据的多样性。
2025-03-20 16:40:29
702
原创 DeepSeek-R1私有化部署——基于 DeepSeek R1 和 Ollama 构建本地知识库(RAG)系统
随着人工智能(AI)、自然语言处理(NLP)、大语言模型(LLM)技术的不断进步,传统的 LLM 虽然强大,但存在知识有限、准确性不足等问题。而检索增强生成(RAG)的出现,大大弥补了 LLM 的不足,有效克服了这些缺点。
2025-03-18 10:57:20
821
原创 基于YOLOv8与SKU110K数据集实现超市货架物品目标检测与计算
本文旨在基于检测到的物品位置信息,分析、计数并提取相关目标。通过对检测结果的坐标数据进行分析,将确定货架的数量以及货架上的物品数量。为此,这里将使用 SKU110K 数据集来训练目标检测模型。该数据集包含商店货架上物品的边界框标注,仅包含一个名为“物品”的类别。
2025-03-17 09:58:55
580
原创 计算机视觉——深入理解卷积神经网络与使用卷积神经网络创建图像分类算法
卷积神经网络(Convolutional Neural Networks,简称 CNNs)是一种深度学习架构,专门用于处理具有网格结构的数据,如图像、视频等。它们在计算机视觉领域取得了巨大成功,成为图像分类、目标检测、图像分割等任务的核心技术。CNNs 的核心思想是利用卷积操作(convolution)来提取数据中的局部特征,并通过层次化的结构逐步学习更复杂的模式。
2025-03-16 14:41:32
3193
6
原创 3D点云目标检测——KITTI数据集读取与处理
KITTI数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创建的一个大规模自动驾驶场景下的计算机视觉算法评测数据集。KITTI数据集采集自德国卡尔斯鲁厄市,涵盖了市区、郊区、高速公路等多种交通场景。数据采集时间为 2011 年 09 月 26 日、28 日、29 日、30 日及 10 月 03 日的白天。KITTI数据采集平台如下图所示:IMU/GPS总结来说,KITTI数据集由 4 个相机、1 个激光雷达、1 个IMU/GPS惯导系统共同组成。
2025-03-14 19:53:32
1549
原创 利用稳定扩散模型和控制网架构调整生成物体背景
本文介绍了一种基于扩散模型的方法,用于在不改变对象边界的情况下生成背景。在设计和电子商务等应用中,保持对象特征至关重要。文章指出了对象扩展的问题,并提供了一种测量方法来捕捉这一问题。对不太突出的物体进行背景生成仍然是未来的挑战,这可能需要高质量的实例或全景分割掩码。此外,将调制 U-Net 编码器的 T2I 适配器作为 ControlNet 的替代品,与用于对象感知背景生成任务的新控制架构相结合,也能提高生成图像的整体精度和质量。
2025-03-13 09:00:00
978
原创 探索在生成扩散模型中基于RAG增强生成的实现与未来
这是一篇关于图像检索多模态生成系统的代表性而非穷尽性概述。一些此类系统仅使用检索来改善视觉理解或数据集策划,而不是寻求生成图像,例如。文献中还有许多其他基于 RAG 的项目尚未发布。只有发表研究论文的原型,例如Re-Imagen,尽管它来自谷歌,但只能访问本地自定义数据库中的图像。此外,2024 年 11 月,百度宣布了基于图像检索的增强生成(iRAG),这是一个使用“数据库”检索图像的新平台。尽管据报道 iRAG 可在 Ernie 平台上使用,但关于检索过程的细节似乎很少,它似乎依赖于一个本地数据库。
2025-03-10 22:12:21
756
原创 探索在直播中的面部吸引力预测新的基准和多模态方法
迄今为止,面部吸引力预测(FAP)主要是在心理学研究、美容化妆品行业以及整形手术领域进行研究。这是一个具有挑战性的研究领域,因为美的标准往往是。这意味着没有一个单一有效的基于人工智能的数据集是可行的,因为从所有文化中采样面部/评分得到的平均值会存在很大偏差(人口较多的国家会获得更多关注),否则就可能对任何文化都不适用(多种族/评分的平均值可能并不代表任何实际的种族)。相反,挑战在于开发出概念性的方法和工作流程,以便能够处理特定国家或文化的数据,从而开发出针对各个地区的有效FAP模型。
2025-03-09 21:28:15
912
原创 DeepSeek-R1私有化部署——基于Ollama与FastApi部署DeepSeek-R1-Distill-Qwen服务器
在前面的博客中,介绍了基于python私有化部署了DeepSeek-R1-Distill-Qwen的命令行对话与服务器客服端访问的方式,这两种方法都要基于torch算法框架,安装时还要对应torch的版本,假设安装的torch的版本小2.2,那么可以加载模型时可能获取到"triu_tril_cuda_template" not implemented for 'BFloat16'这个错误。
2025-03-04 20:50:43
675
原创 计算机视觉——YOLO11原理代码分块解读与模型基准对比测试
YOLO11 是 Ultralytics 推出的 YOLO 系列的最新版本。YOLO11 拥有超轻量级的模型,比之前的 YOLO 模型更快、更高效。YOLO11 能够处理更广泛的计算机视觉任务。Ultralytics 根据模型大小发布了五款 YOLO11 模型,涵盖所有任务的模型共有 25 款
2025-03-03 10:28:44
957
原创 DeepSeek-R1私有化部署——基于FastApi实现DeepSeek-R1-Distill-Qwen服务器部署与流式输出
上个实现了在命令行终端下DeepSeek-R1-Distill-Qwen的模型部署与流式输出,但在日常的生产环境中,基本上是会把模型推理部署在一个服务器上,然后使用客户端调用api接口实现对话。API 是软件间相互传输数据的接口。它在生活中十分常见,比如博物馆订票系统中就使用了 API. 当你在手机应用上订票时,手机实际上发送了一个 HTTP 请求给远程服务器。远程服务器解析该请求。当确认所有字段信息均准确无误后,它才会把你的订票信息录入数据库,并回调成功标识。
2025-03-02 10:37:49
1081
原创 DeepSeek-R1私有化部署——使用Python实现DeepSeek-R1-Distill-Qwen模型部署调用与流式输出
DeepSeek-R1-Distill-Qwen 是 DeepSeek 团队基于 DeepSeek-R1 模型通过蒸馏技术生成的一系列轻量化模型。这些模型在保持高性能推理能力的同时,显著降低了计算资源和内存需求,适合在资源受限的环境中部署。DeepSeek-R1-Distill-Qwen 系列模型是通过从 DeepSeek-R1 模型中提取推理模式并迁移到更小的模型架构中生成的。
2025-03-01 11:55:47
1152
原创 YOLOv12 ——基于卷积神经网络的快速推理速度与注意力机制带来的增强性能结合
实时目标检测对于许多实际应用来说已经变得至关重要,而Ultralytics公司开发的YOLO(You Only Look Once,只看一次)系列一直是最先进的模型系列,在速度和准确性之间提供了稳健的平衡。注意力机制的低效阻碍了它们在像YOLO这样的高速系统中的应用。YOLOv12旨在通过将注意力机制集成到YOLO框架中来改变这一现状。
2025-02-26 22:19:31
1952
4
原创 在不使用对抗性物体一种可规避街道摄像头行人检测的算法实现
以色列和日本的一项新的合作研究认为,行人检测系统存在固有弱点,这使得消息灵通的人能够通过精心规划路线,穿过监控网络效果最差的区域,从而避开人脸识别系统。借助来自东京、纽约和旧金山的,研究人员开发出了一种自动计算此类路线的方法,该方法基于公共网络中可能使用的最流行的物体识别系统。研究中使用的三个十字路口:日本东京的涩谷十字路口、纽约的百老汇和旧金山的卡斯特罗区。
2025-02-24 13:46:34
828
原创 大语言模型常用微调与基于SFT微调DeepSeek R1指南
方法特点适用场景优点缺点SFT全参数微调数据量大,资源充足完全适应任务计算成本高LoRA低秩分解,部分参数微调资源有限参数效率高,显存占用低需要额外实现P-tuning提示优化,不修改模型参数少样本学习显存占用低需要设计提示模板Freeze冻结大部分参数,微调部分层资源有限,数据量小计算成本低模型适应能力有限。
2025-02-15 14:28:16
1987
原创 Vript-Hard——一个基于高分辨率和详细字幕的视频理解算法
近年来,多模态学习的进步使人们越来越关注理解和生成视频的模型。这导致了对具有高分辨率视频和详细说明的高质量视频文本数据集的需求激增。然而,由于视频中增加了时间成分,因此获取和注释视频-文本对要比获取和注释图像-文本对更加困难。例如,旅游视频博客包含许多事件,每个事件由不同的场景组成,如准备旅行或参观目的地。视频字幕需要花费大量的时间和精力来查看整个视频并标注细节。因此,传统的视频文本数据集通常只包含简短粗糙的描述。
2025-02-13 19:23:17
1373
原创 RecRecNet——基于薄板样条模型自由度的课程学习的广角图像畸变矫正算法实现与模型部署
广角镜头在VR技术等领域有着诱人的应用,但它会使拍摄的图像产生严重的径向畸变。为了还原真实场景,以往的工作致力于校正广角图像的内容。然而,这种校正方法不可避免地会扭曲图像边界,改变相关的几何分布,并误导当前的视觉感知模型。在这项工作中,我们通过提出一种新的学习模型,即矩形校正网络(RecRecNet),探索在内容和边界上构建一种双赢的表示。
2025-02-10 15:59:50
774
原创 数据集——个人收集的目标检测数据集待续更新
收集的目标检测数据集,包括鸟类检测,无人机检测,道路坑洼检测,地上烟头检测,骑车行人检测,施工现场安全帽检测
2025-02-09 15:10:46
1039
原创 基于Real3D-AD点云表面异常数据集与点云表面异常检测模型训练与测试
高精度点云异常检测是识别先进加工和精密制造缺陷的黄金标准。尽管该领域在方法上取得了一些进展,但数据集的稀缺和缺乏系统的基准阻碍了其发展。我们引入了 Real3D-AD,这是一个具有挑战性的高精度点云异常检测数据集,旨在解决该领域的局限性。Real3D-AD 包含 1254 个高分辨率 3D 物品(每个物品的点数从四万到数百万不等),是迄今为止用于高精度 3D 工业异常检测的最大数据集。
2025-02-08 22:00:43
407
原创 Windows下从零开始基于Ollama与Open-WebUI本地部署deepseek R1详细指南(包含软件包和模型网盘下载)
最近国产大模型DeepSeek很火,但有时因为访问人数过多导致反应慢甚至宕机。但好在DeepSeek是开源的,可以本地部署,这样就不用联网也能用了。但本地部署需要考虑硬件需求,比如是否有足够的GPU资源,存储空间,以及是否熟悉相关的技术步骤。本地部署的优势,比如离线使用、数据隐私、响应速度。是于本地部署,对硬件有一定的要求,特别是GPU,显然,GPU显存越大,就能部署参数更多的模型,通俗的讲,显存越大,模型越聪明。
2025-02-05 11:30:58
3073
1
原创 MVANet——小范围内捕捉高分辨率细节而在大范围内不损失精度的强大的背景消除模型
在这篇评论文章中,我们将高精度前景提取(背景去除)建模为一个多视角物体识别问题,提供了一个高效、简单的多视角聚合网络。这样做的目的是更好地平衡模型设计、准确性和推理速度。为解决多视图的目标对准问题,提出了多视图完成定位模块,以联合计算目标的共同关注区域。此外,提出的多视图完成细化模块被嵌入到每个解码器块中,以充分整合互补的本地信息,减少单视图补丁中语义的缺失。这样,只需一个卷积层就能实现最终的视图细化。广泛的实验表明,所提出的方法性能良好。
2025-02-02 19:23:11
1115
原创 智能鞋利用机器学习和深度学习技术进行患者监测和步态分析的演变与挑战
智能鞋是可穿戴技术领域的一大进步,在医疗保健、辅助技术和医疗应用方面有许多潜在的应用。先进的传感器技术、能量收集系统和机器学习算法的集成有望彻底改变个人医疗保健,并显著提高残疾人的生活质量。然而,在广泛采用这项技术之前,仍有一些挑战需要克服。改善智能鞋的舒适度和设计、降低成本以及确保数据隐私和安全都非常重要。未来还需要研究如何将智能鞋与其他智能设备集成,如何采用可持续材料和制造工艺,以及开发更高效的能量收集和储存系统。
2025-01-21 11:06:34
1054
1
原创 基于深度学习的Lidar 3D点云表面缺陷检测方法
三维点云异常检测旨在从训练集中检测异常数据点,常用的点云异常检测方法通常采用多个特征记忆库来完全保留局部和全局表示,这种要考虑高昂的计算复杂度和特征间的不匹配问题。
2025-01-20 20:59:25
1290
1
原创 基于ADAS 与关键点特征金字塔网络融合的3D LiDAR目标检测原理与算法实现
3D LiDAR目标检测是一种在三维空间中识别和定位感兴趣目标的技术。在自动驾驶系统和先进的空间分析中,目标检测方法的不断演进至关重要。3D LiDAR目标检测作为一种变革性的技术,在环境感知方面提供了前所未有的准确性和深度信息.在这里,我们将深入探讨使用关键点特征金字塔网络(K-FPN)结合KITTI 360 Vision数据集,融合RGB相机和3D LiDAR数据,实现自动驾驶的详细过程和训练方法。
2025-01-08 09:54:18
1126
原创 基于ViT、CLIP、EfficientNet、DINO-v2和BLIP-2构建AI图像相似性搜索
为了深入探究图像相似性,这里决定采用多种先进的人工智能模型进行分析。这些模型包括视觉变换器(ViT)、对比语言-图像预训练模型(CLIP)、基于双向编码器表示的图像描述模型(BLIP)、高效网络(EfficientNet)、DINO-v2以及经典的卷积神经网络VGG16。通过这些模型,能够从不同角度和层面捕捉到图像之间的相似之处。例如,视觉变换器(ViT)通过将图像分割成多个小块,并利用自注意力机制来分析这些图像块之间的关系,从而揭示出图像的内在相似性;
2025-01-07 12:56:29
1129
原创 基于CLIP和DINOv2实现图像相似性方面的比较
在人工智能领域,CLIP和DINOv2是计算机视觉领域的两大巨头。CLIP彻底改变了图像理解,而DINOv2为自监督学习带来了新的方法。在本文中,我们将踏上一段旅程,揭示定义CLIP和DINOv2的优势和微妙之处。我们的目标是发现这些模型中哪一个在图像相似性任务的世界中真正表现出色。让我们见证巨头的碰撞,看看哪个模型会脱颖而出。
2025-01-06 09:23:06
1259
1
原创 安卓NDK视觉开发——手机拍照文档边缘检测实现方法与库封装
安卓NDK开发,基于深度学习与OpenCV实现文档拍照扫描,实现边缘检测与边缘校正,可使用GPU进行推理,速度和精度都到商用级别。
2025-01-03 21:44:33
1008
2
原创 DBNet——基于区域分割的文本检测算法原理与实践
基于分割的文本检测方法对分割结果的概率图进行二值化后处理,然后来提取文本区域,可以检测任意形状的文本区域。但基于分割的文本检测算法一般都需要复杂的后处理,影响推理的性能。上图中,蓝色的路径表示传统的基于分割的文本检测,完整流程包括得到分割概率图,使用阈值二值化,然后通过像素聚类等手段得到最终的文本检测结果,红色路径是作者提出的新的方法,同时输出分割概率图和进行二值化使用的阈值图,之后,其中虚线表示操作只发生在预测阶段,实线表示在训练和预测阶段都会发生。
2024-12-31 21:23:25
1177
原创 SGOOL——侧重于优化图像的最有可能引起人类注意的区域用于改善人工智能生成的图像
传统方法,优化整个图像而新方法利用显著性检测器来识别和优先处理更“重要”的区域,就像人类一样。在定量和定性测试中,研究人员的方法在图像质量和文本提示的保真度方面都能够胜过以前基于扩散的模型。
2024-12-30 20:18:46
869
原创 TKG-DM – 基于Latent Diffusion模型的“原生”色度提取生成具有透明通道的图像
这篇新论文最值得注意的一点可能是潜在扩散模型的纠缠程度,这与公众普遍认为的在生成新内容时可以毫不费力地分离图像和视频的各个方面形成了鲜明对比。该研究进一步强调了研究和爱好者社区在多大程度上将微调作为事后修复模型的缺点——解决方案始终针对特定类别和类型的对象。在这种情况下,经过微调的模型要么在有限数量的类别上工作得很好,要么在有限数量的类别上工作得很好可以忍受根据训练集中的大量数据,可以很好地处理更多可能的类别和对象。因此,看到至少有一个不依赖于这种费力且可能不诚实的解决方案是令人欣慰的。
2024-12-29 15:50:45
1002
原创 Whiteboard-of-Thought——让大语言模型在白板上写下它们的推理过程,可以大大提高模型在视觉推理能力
近年来,以 ChatGPT 为代表的**大型语言模型(LLMs)通过思维链(CoT)**在文本中表示中间推理部分,在算术和符号推理中取得了优异的成绩。另一方面,即使进行了大量的多模态预训练,但无法回答人类通过视觉推理就能轻松解决的文本查询这一难题仍然令许多研究人员头疼不已。在此背景下,本文。
2024-12-28 13:34:48
1093
原创 MicroDiffusion——采用新的掩码方法和改进的 Transformer 架构,实现了低预算的扩散模型
现代图像生成模型擅长创建自然、高质量的内容,每年生成的图像超过十亿幅。然而,从头开始训练这些模型极其昂贵和耗时。文本到图像(T2I)扩散模型降低了部分计算成本,但仍需要大量资源。目前最先进的技术需要大约 18 000 个 A100 GPU 小时,而使用 8 个 H100 GPU 进行训练则需要一个多月的时间。此外,该技术通常依赖于大型或专有数据集,因此难以普及。在这篇评论性论文中,我们开发了一种低成本、端到端文本到图像扩散建模管道,目的是在没有大型数据集的情况下显著降低成本。
2024-12-26 13:34:44
1324
原创 整合语音命令与大型语言模型 (LLM) 及传感器在人类和机器人之间进行有效的自然语言交流 以简化装配操作并提高生产车间的安全性
本研究提出了一个使用大规模语言模型(LLM)的框架,以改善人机协作制造系统中的通信。在制造过程中,人类操作员要灵活应对动态情况,而机器人则要执行精确的重复性任务。然而,人类与机器人之间的沟通障碍阻碍了双方的协作。在这项研究中,我们提出了一个将自然语言语音命令整合到任务管理中的框架。一项装配任务案例研究表明,该框架可以处理自然语言输入并处理实时装配任务。研究结果表明,LLM 有潜力改善制造装配应用中的人机互动。介绍机器人技术的进步大大提高了生产效率,降低了成本,提高了生产率。
2024-12-25 13:41:27
1514
1
原创 Binoculars——分析证实大语言模型生成文本的检测和引用量按学科和国家明确显示了使用偏差的多样性和对内容类型的影响
人工智能技术的进步正在改变数字内容生产和消费的格局。尤其值得注意的是生成式人工智能的快速发展,包括大规模语言模型,如 ChatGPT,它出现于 2022 年,是基于 GPT-3 的大规模语言模型,能够生成质量非常接近人类文本的文本。这些模型可以自由生成考虑到用法、语气和上下文的文本,因此被广泛应用于内容创作。但与此同时,大规模语言模型所生成内容的可靠性、原创性和质量也引起了人们的关注。此外,人们还讨论了这些技术快速生成大量内容所导致的信息超载问题。
2024-12-24 12:50:40
1052
DeepSeek FastApi部署代码实现流式输出
2025-03-01
使用代码部署DeepSeek-R1开源模型
2025-02-28
边缘与中线实例分割数据集2264张
2025-02-12
猫实例分割数据集509张
2025-02-11
手机拍照文档版面分析1244张
2025-02-11
气球实例分割数据集380张
2025-02-11
视觉圆点标定板圆语义分割77张
2025-02-11
文档阴影语义分割数据集600张
2025-02-11
手指纹斗与簸箕目标分割142张
2025-02-11
广角图像畸变矫正python模型部署
2025-02-10
基于OpenCV部署RecRecNet广角图像畸变矫正C++代码
2025-02-10
水面漂浮物目标检测数据集2400张
2025-02-09
施工现场行人与佩带安全帽检测7544张txt格式
2025-02-09
地上的烟头目标检测1023张xml格式
2025-02-09
骑摩托车行人与安全头盔检测5448张.part2
2025-02-09
骑摩托车行人与安全头盔检测5448张.part1
2025-02-09
道路缺陷目标检测xml格式共665张
2025-02-09
无人机目标检测识别无人机
2025-02-09
MVANet最强大的前景抠图模型
2025-02-02
基于人脸检测与人脸关键点检测的人脸3维重建
2024-10-29
单目深度估计DepthAnything C++模型部署
2024-08-05
基于yolov8的面部七种表情识别C++部署工程
2024-08-04
万物分割(Segment Anything Model)C++模型推理部署
2024-08-02
盲道检测分割C++推理代码
2024-08-01
低光照图像增强vs2019 C++代码
2024-07-31
深度学习图像处理客户端与服务器.rar
2024-07-29
yolov5-v7.0河道漂浮物检测.rar
2024-04-24
YOLOv8与DeepSORT实现目标追踪
2024-04-18
手机目标检测数据集.rar
2024-04-14
标注扑克牌目标识别数据集
2024-04-13
实时语义分割ENet算法Pytorch复现与模型训练
2024-04-10
基于深度学习实现的复杂背景文档二值化的算法实现
2024-04-10
夜晚图像雾霾图像增强C++/python部署
2024-04-10
基于NCNN轻量级PaddleOCRv4模型C++推理
2024-04-02
检测出图像中的几何形状并测量出边长、直径、内角(python和opencv实现)
2024-03-29
YOLOv8目标检测、语义分割、状态估计、目标追踪模型部署带GUI界面
2024-03-26
图像抠图DIS-自然图像中高精度二分图像抠图的方法(C++推理代码)
2024-03-24
百度人像抠图C++模型部署完整包
2024-03-23
人像自动抠图LFM训练代码与C++推理部署代码
2024-03-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人