自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 python3.6报错: ModuleNotFoundError: No module named ‘pip._vendor.six‘

python3.6报错:ModuleNotFoundError: No module named 'pip._vendor.six'

2025-01-03 15:30:11 239

原创 国内如何使用suno luma midjourney 国内API接入调用

suno国内使用 API接入

2024-12-28 15:54:11 384

原创 InceptionNeXt: When Inception Meets ConvNeXt

这篇文章提出了一种新的卷积神经网络结构,叫做InceptionNeXt,它是在ConvNeXt的基础上,将大核深度卷积分解为四个并行的分支,即小方形核、两个正交的带状核和一个恒等映射。这样做的目的是提高模型的效率和性能,因为大核深度卷积在强大的计算设备上会造成高昂的内存访问开销。(1) 没有对Inception深度卷积的分支设计进行更深入的分析和探索,例如是否可以使用更多或更少的分支,是否可以使用不同形状或大小的核,是否可以使用不同类型或数量的激活函数等。单位:NUS, Sea AI Lab(颜水成等人)

2024-12-28 15:49:43 235

原创 Turning a CLIP Model into a Scene Text Detector

本文介绍了一篇名为《将CLIP模型转化为场景文本检测器》的论文,该论文提出了一种新的方法,称为TCM,专注于直接利用预训练的视觉和语言知识来进行文本检测,而无需额外的预训练过程。然后,通过视觉提示学习设计了一种跨模态交互机制,从CLIP的图像编码器中恢复局部特征,该特征可以捕获细粒度信息,以响应后续的文本实例和语言之间的匹配。这篇文章介绍了一种利用CLIP模型进行场景文本检测的方法,该方法无需训练额外的文本检测器,只需将CLIP模型的输出与预定义的文本类别进行匹配,即可实现对图像中的文本区域的定位和识别。

2024-12-28 15:48:53 374

原创 suno luma midjourney 国内 在线 国内 API接入调用

suno 接入 suno 国内使用访问以下链接,注册就可以免费体验推荐:界面版本点击下方链接↓点击此处体验开发人员:API版本↓点击此处体验

2024-10-10 11:10:15 514

原创 LUMA 最强视频生成 国内使用 国内API接入

访问以下链接,注册就可以免费体验推荐:界面版本点击下方链接↓点击此处体验开发人员:API版本↓点击此处体验

2024-10-10 11:05:42 199

原创 Symbolic Discovery of Optimization Algorithms

它比Adam更节省内存,因为它只跟踪动量。在视觉-语言对比学习方面,我们在ImageNet上达到了88.3%的零样本和91.1%的微调准确率,分别超过了之前最好的结果2%和0.1%。在视觉-语言对比学习方面,我们在ImageNet上达到了88.3%的零样本和91.1%的微调准确率,分别超过了之前最好的结果2%和0.1%。此外,文章还检验了Lion的局限性,并确定了它的改进很小或不具有统计意义的情况。文章对Lion进行了详细且全面的分析,揭示了它与其他优化器之间的差异和联系,并探讨了它适用和不适用的场景。

2024-07-23 21:18:59 447

原创 SegGPT: Segmenting Everything In Context

目标是根据上下文完成不同的任务,而不是依赖于特定的颜色。在多个公开数据集上进行了广泛的实验,验证了SegGPT在少样本语义分割、视频物体分割、语义分割和全景分割等任务上的优越性能,并展示了其在处理域外目标和复杂场景时的强大能力。(3)在多个分割任务上取得了令人印象深刻的结果,包括少样本语义分割、视频物体分割、语义分割和全景分割,展示了模型在域内和域外目标上的强大能力。提出了一种通用的上下文学习框架,将各种分割任务统一为一个上下文着色问题,使得模型可以在不需要额外标注或预训练的情况下处理多种类型的分割数据。

2024-07-23 21:17:45 436

原创 TinyDet:轻量级通用检测器中的精确小物体检测

(2)特征金字塔结构可以提高小物体检测的性能。因此,TinyDet采用了一种新颖的轻量级特征金字塔网络(LFPN),它能够在保持感受野的同时,有效地融合多尺度的特征。(3)TinyDet在多个公开数据集上进行了实验,与其他轻量级通用目标检测器相比,TinyDet在小目标检测方面表现出了显著的优势,同时也保持了较高的运行速度和较低的模型大小。(2)TinyDet还使用了一种自适应的锚框生成策略,称为AAG,它能够根据输入图像的内容和分辨率,动态地生成合适的锚框,减少无效的候选框,提高检测效率。

2024-07-22 18:00:06 570

原创 midjourney教程(1)运营型,国内使用AI工具,国内使用chatgpt4全家桶,midjourney,艺术二维码,知识库

推荐:界面版本点击下方链接↓点击此处开发人员:API版本↓点击此处

2024-07-22 00:06:01 679

原创 CVPR 2023 Detecting Everything in the Open World: Towards Universal Object Detection

(2)它提出了一个有效且创新的方法,即UniDetector,利用图像和文本信息的融合,实现了对开放世界中海量类别的检测和识别。(3)它在多个数据集上进行了充分且合理的实验,验证了UniDetector的优越性能和泛化能力,并与其他方法进行了对比分析。这篇文章正式提出了通用目标检测的问题,即在开放世界中检测每一个场景和预测每一个类别,这是一个具有挑战性和前瞻性的研究方向。它利用多源图像和异构标签空间进行训练,通过图像和文本空间的对齐,保证了通用表示的充分信息。

2024-07-21 23:30:40 507

原创 CVPR 2023 Slide-Transformer: Hierarchical Vision Transformer with Local Self-Attention

相比之下,局部注意力,即将每个查询的感受野限制在其自身的邻域像素内,既具有卷积的局部归纳偏置,又具有自注意力的动态特征选择能力。为了解决这个问题,论文提出了一种新颖的局部注意力模块,Slide Attention,它利用常见的卷积操作来实现高效、灵活和通用的局部注意力机制。这样,该模块既实现了高效又实现了灵活的局部注意力范式。Slide Attention模块还通过重参数化技术提出了一个变形移位模块,进一步放松了固定的键/值位置,使其适应局部区域内的变形特征,增强了局部注意力的灵活性和自适应性。

2024-07-21 23:29:42 313

原创 CVPR 2023 Slide-Transformer: Hierarchical Vision Transformer with Local Self-Attention

然而,现有的自注意力方法要么采用稀疏的全局注意力,要么采用窗口注意力来降低计算复杂度,这可能会损害局部特征的学习或者依赖于一些人为设计的约束。相比之下,局部注意力,即将每个查询的感受野限制在其自身的邻域像素内,既具有卷积的局部归纳偏置,又具有自注意力的动态特征选择能力。为了解决这个问题,论文提出了一种新颖的局部注意力模块,Slide Attention,它利用常见的卷积操作来实现高效、灵活和通用的局部注意力机制。该模块可以应用于各种先进的视觉变换器模型,并在多个视觉任务上取得了一致的性能提升。

2024-02-22 16:52:50 561 1

原创 改进YOLOv7 | CVPR 2023 DynamicDet: A Unified Dynamic Architecture for Object Detection

然而,设计一个强大的动态检测器是具有挑战性的,因为目前没有合适的动态架构和退出标准来适应目标检测任务。我们还提出了一种基于检测损失的退出标准的新颖优化策略,用于优化我们的动态检测器。在COCO数据集上进行的广泛实验表明,我们提出的DynamicDet实现了新的最先进的准确性-速度折中。例如,在准确性相当的情况下,我们的动态检测器Dy-YOLOv7-W6的推理速度比YOLOv7-E6快12%,比YOLOv7-D6快17%,比YOLOv7-E6E快39%。第六节总结了本文的贡献和未来的工作方向。

2024-02-22 16:52:10 549 1

原创 AI国内接入集合,国内使用chatgpt4,chatgpt4o,midjourney

chatgpt4全家桶,midjourney,艺术二维码等

2024-02-19 20:43:51 675 1

原创 国内如何使用midjourney,MJ,文生图,文字生成图片

访问以下链接,扫码领取试用。

2024-02-19 20:39:49 1330 1

原创 linux word(docx)转pdf 安装及代码-最全方案

参考链接:https://juejin.cn/post/6844904155308359694?参考链接:https://blog.youkuaiyun.com/lucky_chaichai/article/details/129747563。

2023-08-29 16:18:31 696 1

原创 MidJourney国内API接入调用

会发现是4张图合成一张图,这其实是midjourney的一种节省资源的策略,之后我们可以对这张图做两种操作,分别是变换和放大,对接也十分简单,也支持垫图就是上传参考图再生成。可以白嫖30次midjourney出图,我这里精简一下接入流程,方便大家快速接入。话不多说,先上最终出图效果。

2023-07-01 10:51:28 1900

原创 人脸识别 指标汇总

人脸识别 指标 评价

2022-10-14 11:50:21 492

原创 cuda so编译

cuda编译so

2022-06-20 10:43:32 95

原创 Linux CentOS 编译安装ffmpeg Opencv

编译安装ffmpeg1.官网下载linux版本的ffmpeg源码包 ffmpeg-4.1.tar.xzhttps://johnvansickle.com/ffmpeg/release-source/2.解压至usr/local/ffmpeg目录sudo cp ffmpeg-4.1.tar.xz /usr/localsudo tar -xvjf ffmpeg-4.1.tar.xz3.安装ffmpeg./configure --enable-shared --enable-pic --enabl

2021-06-10 20:40:37 1841 3

原创 ubuntu(linux) 离线更新显卡驱动

本步骤适用于更新驱动,非新安装驱动1.查看cuda对应驱动版本,并下载https://www.nvidia.com/Download/index.aspx?lang=en-us2.以450驱动更新为例(1)卸载已有驱动sudo sh NVIDIA-Linux-x86_64-390.116.run --uninstall或sudo /usr/bin/nvidia-uninstall如果没有对应的驱动文件,需要再官网下载(2)重启sudo reboot(3)安装新驱动sudo chmo

2021-03-15 16:42:25 1919

原创 多线程视频抽帧 python

转载注明出处谢谢# -*- coding: utf-8 -*-import shutilimport numpy as npimport cv2import osfrom multiprocessing import Pooldef do_capture(src_path, path, name): output_path = path + os.sep + name if not os.path.exists(output_path): os.mkdir

2021-01-07 11:01:25 503

原创 TypeError: forward() missing 1 required positional argument: ‘x‘ #1074

TypeError: forward() missing 1 required positional argument: ‘x’ #1074在yolov4 pytorch训练时遇到此错误解决方法:测试集的数据量要能被BatchSize整除,简单方法是直接删除valid.txt里的标签路径。转载请注明出处,谢谢...

2020-07-24 15:17:49 5851

转载 Python中:self和__init__的含义 + 为何要有self和__init__

转载自:在路上 » 【整理】Python中:self和__init__的含义 + 为何要有self和__init__关于self的使用作者给出的错误和正确的例子讲解如下:如果没有在__init__中初始化对应的实例变量的话,导致后续引用实例变量会出错如下代码,完整的演示了,如果没有在类Class的最初的__init__函数中,正确的初始化实例变量,则会导致后续没有变量可用,因而出现Attri...

2018-11-06 12:10:09 390 2

resnet18-5c106cde resnet34-333f7ec4 resnet50-19c8e357 resnet101-5d3b4d8f

百度网盘 resnet18-5c106cde resnet34-333f7ec4 resnet50-19c8e357 resnet101-5d3b4d8f r esnet152-b121ed2d

2021-06-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除