自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 multiprocessing 多进程

【代码】multiprocessing 多进程。

2025-02-27 22:10:04 166

原创 百万人像视频数据集

今天偶然在twitter上看到了一个数据博主,感觉这一批人像数据如果用在AI训练上可能还能发出不少paper!

2024-08-22 11:45:55 230

原创 【PHP 教程】

PHP 提供了一些预定义常量,可以在脚本中直接使用。这些常量通常用于获取 PHP 的配置信息、版本信息等。PHP_VERSION:当前 PHP 解析器的版本。PHP_OS:服务器的操作系统。PHP_INT_MAX:最大的整数值。E_ERROR、E_WARNING、E_PARSE 等:错误报告级别。

2024-07-01 15:53:54 398

原创 【如何获取高质量素材网无水印1080P视频!】

1.istock2. shutterstock

2024-06-30 10:19:03 287

原创 【如何更改yaml文件来让clash每隔30s切换节点】

有些时候一些如果使用一个节点的代理来爬取某些网站数据会被封,所以使用clash均衡的切换不同节点很重要!亲测有效!!

2024-06-30 00:21:05 5624

原创 【Linux 打印文件指定行数】

【代码】【Linux 打印文件指定行数】

2024-06-29 13:49:20 194

原创 LINUX杀死所有僵尸进程

【代码】LINUX杀死所有僵尸进程。

2024-06-27 18:59:31 629

原创 【利用three.js渲染外部3D动画模型gltf文件,将渲染出的动画录制为视频】

点击VSCode右下角的“Go Live”按钮(一个绿色的播放按钮),或者右键点击文件并选择“Open with Live Server”。在VSCode中,打开扩展视图(点击左侧的扩展图标或使用快捷键Ctrl+Shift+X),搜索并安装Live Server扩展。浏览器将打开一个新的标签页,显示你的Canvas动画。将你提供的JavaScript代码粘贴到。打开index.html文件。

2024-06-24 11:23:25 396

原创 python–随机生成汉字、数字「建议收藏」

gbk2312对字符的编码采用两个字节相组合,第一个字节的范围是0xB0-0xF7, 第二个字节的范围是0xA1-0xFE.这个方法比较简单,但是有个小问题,unicode码中收录了2万多个汉字,包含很多生僻的繁体字.在unicode码中,汉字的范围是(0x4E00, 9FBF)GBK2312收录了6千多常用汉字.两种方法的取舍就看需求了.对GBK2312编码方式详细的解释请参看GBK2312编码。

2024-06-16 13:06:31 1124

原创 linux环境下使用命令行,从百度网盘上传、下载数据

此时,百度云盘的‘我的应用数据’文件夹中会多出一个“bypy文件夹”,将需要下载的数据放在“bypy”文件夹中。这时浏览器会打开一个网页,得到一个授权码,复制此授权码,粘贴到linux命令行。即可将bypy中所有的文件下载到Linux中,下载到的位置就是你当前所在位置。亦可以 bypy downdir dirname -v。然后输入 bypy downdir -v。得到一个链接,复制到浏览器打开,

2024-06-15 22:27:32 1196

原创 将中文作文写入csv中,每行20个字符

【代码】将中文作文写入csv中,每行20个字符。

2024-04-24 21:38:18 146

原创 MAE 代码实战详解

MAE debug学习

2022-08-02 12:20:33 3560 2

原创 【计算机网络】

计算机网络计算机网络计算机网络考试图片:

2022-06-01 10:04:11 1954

原创 夏令营机试训练PAT版本

这里写目录标题C语言学习1.基础知识1.0快捷键1.1头文件1.2 顺序结构1.2.1 scanf函数的使用2.1 数组2.1.1 冒泡排序2.1.2 数组填充三级目录C语言学习1.基础知识1.0快捷键ctrl+shift+c 注释多行1.1头文件#include<stdio.h> //头文件,其中stdio.h是标准输入输出库,只要有输入输出,就需要这个头文件 standard input output#include<math.h> //数学函数 头文件#in

2022-04-16 20:55:41 1170

原创 Linux知识

Linux知识一级目录二级目录解压与压缩 .tar.gz一级目录二级目录解压与压缩 .tar.gzzip对应的解压缩命令为unzip命令格式:unzip [选项] 压缩包名选项: -d:指定解压缩位置。示例:unzip -d /tmp/ test.zip将tar.gz文件解压到指定的目录中tar -zxvf tmp.tar.gz -C /tmp在Linux系统的维护、管理中,tar命令是一个使用频率很高的命令,tar命令的功能主要是将众多文件打包成一个tar文件并压缩,并且能保持文件的权

2022-04-16 19:12:54 833

原创 pdb 断点调试学习

这里写目录标题pdb调用pdb调用import pdbpdb.set_trace()符号作用ll展示所有代码(可以输出当前的函数的源码)l可以看周围的代码默认是上5行、下5行。n(next)执行下一行i直接输入变量i可以看到当前的值where通过命令where(简写w)可以得出正在执行哪一行,以及程序的调用栈的位置u返回到上一个栈帧,初步尝试发现是可以回退执行s (step)函数单步执行,如果遇到函数会进入函数内部继续调试

2022-03-18 21:13:43 431

原创 Transformer

这里写目录标题一级目录二级目录三级目录一级目录二级目录三级目录引用:https://www.bilibili.com/video/BV1h4411g7Pz/?spm_id_from=333.788.videocard.18我们如何将输出的b1能够看到a1,a2,a3,a4,…所有的sequence呢?self-attention layer可以做到这一点。首先通过q,k计算出a1与所有aj的相似度权重α1,j ,这样在训练的过程中,b1与谁相似、或者说想与谁的关系增强一点,就可以通过反向传播更

2022-03-06 20:15:52 455

原创 Pytorch 学习笔记-自定义激活函数

Pytorch 学习笔记-自定义激活函数1.Variable与Function(自动梯度计算)0.本章内容1. pytorch如何构建计算图(`Variable`与`Function`)2. Variable与Tensor差别3. 动态图机制是如何进行的(Variable和Function的关系)4.PyTorch中Variable的使用方法5. Variable的require_grad与volatile参数6. 对计算图进行可视化7. 例子** 引用:**https://zhuanlan.zhihu

2022-02-21 22:00:01 9609 2

原创 Masked Feature Prediction for Self-Supervised Visual Pre-Training

Masked Feature Prediction for Self-Supervised Visual Pre-Training0.背景1.自监督代表——BEiTBERT方法讲解BEiT方法讲解2.MaskFeat 详解MaskFeat预测流程目标特征实验设置和结果One-stage methodsTwo-stage methodsExperiments: Image Recognition0.背景监督学习:利用大量的标注数据来训练模型,模型的预测和数据的真实标签产生损失后进行反向传播(计算梯度、更

2022-02-10 22:16:44 2177

原创 【无标题】

Model( (model): Sequential( (0): Focus( (conv): Conv( (conv): Conv2d(12, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False) (bn): BatchNorm2d(32, eps=0.001, momentum=0.03, affine=True, track_running_stats=True)

2022-01-25 13:44:01 108

原创 【 group convolution (分组卷积)详解】

@[TOC]( group convolution (分组卷积)详解)group convolution (分组卷积)详解1.普通卷积:上图为普通卷积示意图,为方便理解,图中只有一个卷积核,此时输入输出数据为:输入feature map尺寸: W×H×C ,分别对应feature map的宽,高,通道数;单个卷积核尺寸: k×k×C ,分别对应单个卷积核的宽,高,通道数;输出feature map尺寸 :W’×H’ ,输出通道数等于卷积核数量,输出的宽和高与卷积步长有关,这里不关心这两个值

2022-01-23 11:33:52 8922

原创 【日志--v5s结构重参数化记录】

这里写目录标题repvgg-v5s1repvgg-v5s2repvgg-v5s1这个部分我将只讲C3-Bottleneck的cv1-cv2进行了替换,其他部分没有替换。效果提升的不是很明显。 #batchsize=128 v5s 结构重参数化bottleneck #95M 参数量 FLOPs 22.4 epoch, train/box_loss, train/obj_loss, train/

2022-01-21 19:50:13 659

原创 【RepVGG重参数化-Yolov5】

RepVGG重参数化-Yolov5Yolov5-记录RepVGG 代码复现Yolov5-记录#detect.py #Load modelmodel = DetectMultiBackend(weights, device=device, dnn=dnn, data=data)for i in model.model.modules(): if type(i) is C3: i._switch_to_deploy() else: pass在这里我们可以有多种选择来进

2022-01-20 15:07:32 2617 2

原创 【pytorch修改预训练pt文件】

pytorch修改预训练pt文件前言使用步骤使用nn.module的model.children()的函数,重新定义自己model的层前言使用步骤使用nn.module的model.children()的函数,重新定义自己model的层那么对于网络的修改怎样可以快速的去除model本身的网络层呢?一个继承nn.module的model它包含一个叫做children()的函数,这个函数可以用来提取出model每一层的网络结构,在此基础上进行修改即可,修改方法如下(去除后两层):1 resnet

2022-01-19 15:57:58 4295

原创 【RepVGG代码复现】

RepVGG代码复现去链接页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.```javascriptimport torchfrom torch import mean, nnfrom collections import OrderedDictfrom torch.nn import functional as Fimport numpy as npfrom numpy import randomfrom se_block import SEBlockdef set

2022-01-19 11:34:01 2015 1

AI+RealEstate10K

RealEstate10K is a large dataset of camera poses corresponding to 10 million frames derived from about 80,000 video clips, gathered from about 10,000 YouTube videos. For each clip, the poses form a trajectory where each pose specifies the camera position and orientation along the trajectory. These poses are derived by running SLAM and bundle adjustment algorithms on a large set of videos. This dataset helped power a SIGGRAPH 2018 paper from Google, Stereo Magnification: Learning view synthesis

2024-08-08

多模态+大模型+LLaVA1.5数据集

Please download the annotation of the final mixture our instruction tuning data llava_v1_5_mix665k.json, and download the images from constituting datasets: COCO: train2017 GQA: images OCR-VQA: download script, we save all files as .jpg TextVQA: train_val_images VisualGenome: part1, part2

2024-06-30

LLaVA Visual Instruct 150K is a set of GPT-generated multimodal

LLaVA Visual Instruct 150K is a set of GPT-generated multimodal instruction-following data. It is constructed for visual instruction tuning and for building large multimodal towards GPT-4 vision/language capability.

2024-06-30

RefCOCOg : Referring expression comprehension常用数据集

标注方式上: RefCOCOg采用的是非交互式标注法,选定区域请人标注,再请另外一批人根据标注的expression选择对应的region; RefCOCO和RefCOCO+采用的是双人游戏 (Refer it game)的方式. 数据划分方式上: RefCOCO和RefCOCO+包含train, val, testA, testB。testA的图片包含多个人;testB的图片包含多个除人之外的物体。同一个图片的object-expression样本对要么全在训练集,要么全在验证\测试集。 RefCOCOg包含train, val, test。是按照object进行划分的,同一个图片的object-expression样本对集合可能会在训练集一部分,在验证\测试集另一部分。 图片选择上: RefCOCO:图像包含同一类别的多个物体。 RefCOCO+:图像包含同一类别的多个物体,并且expression不能有绝对位置(e.g., left)的词。 RefCOCOg:图像包含同一类别的2-4个物体,覆盖面积超过图片面积的5%

2024-06-30

RefCOCO+ 数据集是一个引用表达生成 (REG)数据集,用于理解引用图像中特定对象的自然语言表达的相关任务

标注方式上: RefCOCOg采用的是非交互式标注法,选定区域请人标注,再请另外一批人根据标注的expression选择对应的region; RefCOCO和RefCOCO+采用的是双人游戏 (Refer it game)的方式. 数据划分方式上: RefCOCO和RefCOCO+包含train, val, testA, testB。testA的图片包含多个人;testB的图片包含多个除人之外的物体。同一个图片的object-expression样本对要么全在训练集,要么全在验证\测试集。 RefCOCOg包含train, val, test。是按照object进行划分的,同一个图片的object-expression样本对集合可能会在训练集一部分,在验证\测试集另一部分。 图片选择上: RefCOCO:图像包含同一类别的多个物体。 RefCOCO+:图像包含同一类别的多个物体,并且expression不能有绝对位置(e.g., left)的词。 RefCOCOg:图像包含同一类别的2-4个物体,覆盖面积超过图片面积的5%

2024-06-30

RefCOCO 数据集是一个引用表达生成 (REG)数据集,用于理解引用图像中特定对象的自然语言表达的相关任务

RefCOCO 数据集是一个引用表达生成 (REG)数据集,用于理解引用图像中特定对象的自然语言表达的相关任务。以下是有关 RefCOCO 的关键细节: 收集方法:数据集是使用双人游戏ReferitGame收集的。在这个游戏中,第一个玩家查看带有分割目标对象的图像,并写出引用该对象的自然语言表达。第二个玩家只能看到图像和引用表达,并且必须单击相应的对象。如果两个玩家都表现正确,他们将获得积分并交换角色;否则,他们将收到一个新的对象和图像以供描述。 数据集变体: RefCOCO :包含 19,994 张图像中50,000个对象的 142,209 个引用表达式。RefCOCO +:包含 19,992 张图像中 49,856 个对象的 141,564 个表达式。RefCOCOg :此变体有 25,799 张图像、95,010 个引用表达式和 49,822 个对象实例。 语言和限制:RefCOCO 允许在引用表达式中使用任何类型的语言。RefCOCO+ 不允许在表达式中使用位置词,而应仅关注基于外观的描述(例如,“穿黄色圆点衬衫的男人”),而不是基于观察者的描述(例如,“左边第二个男人”

2024-06-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除