- 博客(58)
- 资源 (2)
- 收藏
- 关注
原创 从cv的角度看transformers中的注意力——Attention is all you need读后感
注意力函数是 a query 和 a set of key-value pairs 到 an output的映射, key和value一一对应,一个query需要和一组key-value对计算,ouput是values的加权和,每个value对应的权重是由value对应的key和query计算出来的。
2022-10-26 11:57:42
585
原创 视频理解论文实验笔记2014-2022
看了李沐团队的视频,其中关于视频理解的串讲()讲的太好了,按照他的顺序看了这些论文,并做了重点针对实验部分的笔记。
2022-09-15 23:02:06
1542
原创 【人脸生成】HiSD-通过层级风格解耦实现图到图的迁移
这是我看的第一篇人脸生成相关的论文,对这个领域不熟悉,因此会更多关注该领域的问题,做法,套路。乍一看这个标题,可能是想把一张图里的风格(style)迁移到另一张图,把这些风格按层级划分,目的是解耦同一张图里的风格,这里的图指的是人脸,进一步你就能想到,人脸上有多种风格,解耦它们是为了可控地只迁移一种特定的风格,同时要维持其他风格不变。...
2022-07-31 18:01:34
1704
原创 【论文阅读】LUPerson-NL
这是一篇主要讲预训练的文章,使用大尺度自动标注的数据预训练,再在reid任务中监督训练。主要的工作在于预训练的方法,可以归类位弱监督吧。前人为reid任务预训练模型时在ImageNet上做,这不能带来什么提升,他们认为是由于imagenet里图片和reid任务中的图片有着很大的domain gap。......
2022-07-11 16:17:02
1492
原创 【论文快读】人群计数FIDTM
最近接触了一个人群密度估计的工作,就看了这篇去年的论文。标题中的Focal Inverse Distance Transform Maps(FIDT map)就点出了他们的工作,目的是要做人群的定位和密集人群计数。一般来说,基于CNN的人群密度估计的方法有三种:基于检测的,基于回归的,Density map的。这篇是属于Density map的,预测每个像素存在人头点的概率分布,他的标注一般是在人头出点一个点,这种方法计数精度高,位置精度中等,缺点是低密度场景计数精度差(相对另.............
2022-07-07 10:48:19
3310
1
原创 论文阅读: A Unified Sequence Interface for Vision Tasks
追求一般的广泛的人工智能,把各种视觉任务(detection, segmentation, keypoint, captioning)统一到一个框架里。
2022-06-24 09:46:22
822
原创 论文快读:DETReg(CVPR2022)
这是以色列特拉维夫大学和Microsoft Research搞的一篇关于自监督预训练检测任务的文章,DETReg: Unsupervised Pretraining withRegion Priors for Object Detectionh, 代码https://www.amirbar.net/detreg/他们关注的是目标检测自监督训练领域,他们觉得当前如SwAV, ReSim, InsLoc这些工作,给DETR检测网络做自监督预训练时只是训练了CNN主干,而检测部分没有预训练,限制了自监督训练期
2022-05-29 22:02:45
1420
原创 论文快读:AdaptFormer
AdaptFormer港大,腾讯AI实验室,港中文贡献的文章:AdaptFormer: Adapting Vision Transformers forScalable Visual Recognition ( arXiv:2205.13535v1 [cs.CV] 26 May 2022 )他们觉得最新的transformer文章做的same network with task-specific weight工作,用的是同样的网络,但是对每个下游任务都要fine-tune模型,这样的模型是不可
2022-05-29 01:10:40
807
原创 HCSC:具有层级结构的图像表征自学习框架
前几天看了一篇公众号的文章,,也是关于自学习,无监督方面的,闪光点非常明确,就是在对比学习选取负样本时避免选择同类样本,很有启发价值,就写了这篇读书笔记。论文地址: https://arxiv.org/abs/2202.00455项目地址: https://github.com/gyfastas/HCSC提出问题该文认为类别的预计是有层级的,如ImageNet的类别是基于WordNet层级形成的,如拉布拉多犬 -> 犬类 -> 哺乳动物的层级关系。目前地位显赫的自监督预训练模型:
2022-03-17 12:04:58
1295
原创 使用Object-Centric图片处理长尾目标检测问题
这里写自定义目录标题使用Object-Centric图片处理长尾目标检测问题他们的方法实验结果我的收获看不太懂的地方使用Object-Centric图片处理长尾目标检测问题昨天看了一下篇关于长尾问题的文章A Simple and Effective Use of Object-Centric Images for Long-Tailed Object Detection arXiv:2102.08884v1。对于长尾目标问题的处理方法有re-weighting, re-sampling,当做类别不平
2022-03-12 00:04:39
5608
1
原创 密集目标检测-Precise Detection in Densely Packed Scenes
https://arxiv.org/pdf/1904.00853v3.pdf使用场景densely packed scenes,图片中包含很多物体,看起来相似甚至一样,位置非常接近。如超市货架,交通,城市景观。难点位置非常接近的相似物体的bounding box预测不准,容易重叠本文贡献Soft-IoU layer, 增加估计物体和ground true的iou的层,输出Soft......
2020-02-24 01:30:50
7640
原创 2017阿里秋招内推在线编程题解法
题目看了好久才看懂题目,下面是原题的回忆: 有一个取货机器可以在各个巷道间来回移动,同一个巷道里取货不用移动(所以移动是一维的),只需要伸机械臂。告诉你机器此时在哪条巷道(初始位置),告诉你这个机器要取哪些货物(K种货物),每种货物取多少个(长度为K的数组),再告诉你每个巷道里各种货物的数量(KxN的矩阵,我猜有N条巷道)。最后问取完这些货物需要移动的最短距离 思路设想远处的巷道有许多货物,那么
2017-07-15 11:05:03
7027
原创 前端实时更新后端处理进度
交互逻辑:点击页面的“提交”button,向后台发送数据处理请求;后台处理数据;前端根据后台的处理进度实时更新进度条。功能实现:HTMLHtml页面用boostrap的进度条, 进度条由2个div嵌套而成,修改内层div的width可以更新进度,外层div(id="prog_out") , 内层div(id="prog_in");给button绑定一个onclick方法”submit_query
2017-05-24 19:38:17
48624
16
原创 理解EM算法
介绍EM算法的材料里,我目前看过且觉得看了之后豁然开朗的就是NG老师的CS229讲义。 JerryLead 那里有中文版 结合混合高斯分布,在这两位牛人的基础上,谈一点自己觉得看待EM算法很重要的2个必须弄清楚的问题:为什么要有EM算法,为什么要分E步和M步。其中解释了一些介绍EM算法免不了要用到公式。为什么要有EM算法我把EM算法当做最大似然估计的拓展,解决难以给出解析解的最大似然估计(
2017-05-02 10:16:14
1309
1
原创 logistic回归
1. 逻辑回归的建模1.1.sigmoid函数说道建模,总有一些粗暴的地方,即强行给真实模型ff指定某种形式f^\hat f,像线性回归里就强行指定了f^(x)=βTx,x∈Rp,β∈Rp+1\hat f(x)=\beta^T x, x \in R^p, \beta \in R^{p+1}这种形式,然后依靠所找到的最优的β\beta使f^\hat f尽量接近ff。 分类问题与回归的问题的不同在于
2017-05-01 19:53:48
762
原创 bufbomb实验心得及详细步骤
——写给跨考计算机并尝试做csapplabs的同学bufbomb是一个很有意思的,带有游戏性质的缓冲区溢出实验, 能够帮助你加深理解《Computer Systems A Programmer’s Perspective》书中第三章《Machine-Level Representation of Programs》中的内容。 点 Self-Study Handout下载。 或者,到下载地址找到B
2017-04-01 10:06:16
10343
3
翻译 50个概率题
1. 袜子抽屉一个抽屉有红袜子和黑袜子,随机取出两支袜子都是红袜子的概率是0.5,(a)抽屉里最少有几只袜子?(b)如果抽屉中黑袜子的数量是偶数,抽屉里最少有几只袜子? (a)4 (b)21 2. 连胜为了激励小明的网球生涯,如果他在三盘中连赢2盘,他爹就给他奖励,小明每盘可从他爹和俱乐部冠军中选一个作为对手,但不能连续选择一个人2次,即“爹-冠军-爹”或“冠军-爹-冠军”。冠军的水平比他爹高
2017-03-04 16:41:49
28415
2
原创 scipy求一些统计量的p值和分位数
scipy.stats模块中有不少涉及计算统计量的子模块 如 scipy.stats.uniform scipy.stats.norm scipy.stats.t scipy.stats.chi2 scipy.stats.f 更多子模块参见这里其中scipy.stats.f内有如下方法: 来自于这里这些方法在其他子模块中都大同小异。这里重点介绍求F统计量的p值和分位数,t统计量,
2016-10-06 11:05:33
19152
1
原创 redhat/centos安装caret包失败
我的redhat用的是centos源,跟centos情况应该差不多。R提示我以下这些以来包安装失败 ‘car’‘nloptr’, ‘lme4’, ‘pbkrtest’‘minqa’理清依赖关系,最根源的问题是minqa和nloptr安装失败。安装minqa安装minqa失败的原因是ld找不到libgfortran.so, 由于我已经安装了gcc, 应该有libgfortran.so的。后来我在/
2016-08-28 10:02:28
2775
转载 使用EPEL YUM源安装R
第一步:安装epel-release yum install epel-release 第二步:修改源配置文件/etc/yum.repos.d/epel.repo ,把基础的恢复,镜像的地址注释掉,使用命令 vim /etc/yum.repos.d/epel.repo,进入插入模式后把所有的#baseurlmirrorlist改成baseurl#mirrorlist (centos7此步
2016-08-25 20:35:06
1977
原创 python解压rar文件
应用场景在数据预处理阶段,有时候会发现我们的数据存储在大量杂乱无章的压缩文件中,这些压缩文件还可能处在复杂的目录树结构下。这时候你可能会想写个python脚本来处理。
2016-07-08 11:49:03
9781
原创 sqlcmd操作总结
前提sql server 2008注意1433端口是否打开1登陆数据库sqlcmd -S 数据库地址 -U 用户名 -P 密码 或 sqlcmd -S 数据库地址\数据库实例名 -U 用户名 -P 密码查询数据库查看有哪些数据库 >1 select name from sys.databases >2 go 每次输入sql语句都要打一行go, 下面不再赘述,sys.database
2016-05-27 13:51:55
1084
原创 OSPF协议
概念Open Shortest Path First,开放最短路由优先协议一个基于链路状态(Link status)的内部网关协议。
2016-05-16 22:49:28
6519
原创 PPP协议
PPP(Point to Point Protocol)即点对点协议,是一种广域网链路层协议,可以帮助隔了很多个异构网络的两端实现逻辑直连。
2016-05-16 20:18:34
4313
2
原创 端口聚合
概念将交换机的多个物理端口捆绑在一起,成为一个逻辑端口,这一组端口可以被看做一个端口使用。这样,这个聚合的端口 1. 有了更大的带宽(总带宽等于组内各端口带宽之和) 2. 增加了端口冗余(只要剩一个没坏就能通信) 3. 可以将负载均衡到组内的各个端口上。两个交换机间的链路两端都使用端口聚合,他们之间的链路就成为了聚合链路,同样具备上述3个特点,即更多带宽,更多冗余,负载均衡。
2016-05-14 17:33:42
10635
原创 地址转换NAT
为了解决IPv4地址短缺的问题,通过内网到外网出口的NAT路由器(有NAT功能的路由器), 将许多的内网IP地址映射为少数的几个外网IP地址,使得内网只有私有地址的计算机也能上网。
2016-05-13 22:34:50
908
原创 pthread
1. 计时使用pthread编写的多线程程序,若是用clock_t结构体和clock()函数计时,多线程程序的运行时间会偏大,如#include <time.h>clock_t begin, end;begin = clock();// pthread多线程代码end = clock();printf("%f秒\n", (double)(t1 - t0) / CLOCKS_PER_SEC
2016-04-06 15:01:32
746
原创 OpenMP
1 在vs2008上编译OpenMP试了好多方法,感觉直接在vs2008上写最简单,右键点击解决方案下面的项目名,在弹出的右键菜单选择最后一个“属性”。 依次点击 配置属性 =》C/C++ =》语言,把右侧的OpenMP支持一栏的否改为是。这样你的OpenMP程序就可以编译了。 如果运行程序时报错,找不到vcomp90.dll或者vcomp90d.dll,那么就到c:\windows\winsxs
2016-03-23 11:37:23
834
转载 Jupyter的安装和配置
在python中生成密码>>> from notebook.auth import passwd>>> passwd('123456')'sha1:1996ed5b2fc6:40da178c53092195aab3e1ce840e8c5c9e335fab'c = get_config() c.NotebookApp.ip = ‘*’ c.NotebookApp.password = u’sh
2016-03-16 16:51:47
1099
原创 怎么在mac终端上执行R脚本
创建file.R文件在文件首行键入: #! /usr/bin/R 设置工作目录也是不错的选择,因为记录执行过程的.Rout文件会自动输出到工作目录 setwd('/path/to/workdir/') 在下面的行中,键入R代码在输出图像(而非保存文本)如png(),jpeg(),…等函数后,一定要加上一行 dev.off() 注意将数据处理结果输出到文件
2016-03-06 10:31:57
10020
原创 matplotlib cannot import name _thread on mac
最后的2行错误信息是 from six.moves import _threadImportError: cannot import name _thread发现是six出现了问题,用pip更新一下six,问题并没有解决,原因是并没有真正更新six的文件。 在python下输入:import sixprint six.__file__/System/Library/Frameworks/
2016-03-01 19:55:11
5470
mac_Yosemite_hadoop2.6_eclipse插件
2015-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人