- 博客(87)
- 资源 (6)
- 收藏
- 关注
原创 AI期末复习(PolyU)
Best-first Search (Greedy Search贪心算法)Exercise 1同 Tutorial 3的Exercise 4。P的行,与Q的列逐个元素求最小值,然后选择最小值里的最大值。Breadth-first search宽度优先搜索。Depth-first search深度优先搜索。open表由queue队列实现,因此加在尾部。open表由stack栈实现,因此加在头部。按列两两求最小,然后整列求最大。
2024-05-01 17:36:09
894
1
原创 OR-NeRF论文笔记
用于新视图合成的神经辐射场(Neural Radiance Fields,NeRF)的出现提高了人们对三维场景编辑的兴趣。编辑的一项基本任务是从场景中移除目标,同时确保视觉合理性和多视图一致性。然而,当前的方法面临着一些挑战,如耗时的对象标记、移除特定目标的能力有限以及移除后的渲染质量受到影响。本文提出了一种名为 ORNeRF 的新型物体移除pipeline,它能在单个视图上通过用户给出的点或文本提示移除三维场景中的物体,与之前的作品相比,能在更短的时间内实现更好的性能。
2023-12-29 22:36:44
1577
1
原创 RO-NeRF论文笔记
以基于置信度的视图选择程序为基础。它选择在创建 NeRF 时使用那些单独的 2D 修复图像,以便生成的修复 NeRF 是 3D 一致的
2023-12-29 20:35:35
1397
1
原创 Focal Loss-解决样本标签分布不平衡问题
样本不平衡造成的问题就是,样本数少的类别分类难度大,因此Focal Loss聚焦于难分样本,解决了样本少的类别分类精度不高的问题,对于难分样本中样本多的类别,也会被Focal Loss聚焦。对于样本不平衡造成的损失函数倾斜,最直接的方法就是添加权重因子,提高少数类别在损失函数中的权重,从而平衡损失函数的分布。若Loss中难分类样本的权重较高,但是难分类样本的Loss梯度为0,难分类样本就不会影响到模型的参数更新。Focal Loss从样本难易分类的角度出发,解决了样本不平衡导致模型性能较低的问题。
2023-08-28 15:56:27
1051
1
原创 STTran: Spatial-Temporal Transformer for Dynamic Scene Graph Generation
动态场景图生成的目标是在给定的视频中生成场景图。与静态图片的场景图生成相比之下,它由于动态关系和时间依赖,能够获得更丰富的语义解释。本文提出STTran,包含了spatial encoder和temporal decoderspatial encoder:对输入的每一帧提取空间上下文以及视觉关系。temporal decoder:以spatial encoder的输出作为输入,从而捕获帧与帧之间的时间依赖关系,并推理动态关系。STTran能适用于不同时长的视频,尤其是能对长视频能有不错的效果。
2023-08-26 19:09:05
1214
原创 ST-HOI: A Spatial-Temporal Baseline for Human-Object Interaction Detection in Videos
VidHOI的开山之作。大量研究都是检测静态图片中的human-object-interaction(HOI),在对视频推理时,跟时间相关的动态交互将无法判别,因为它们无法考虑到相邻帧之间的关系,只能对每一帧单独进行推理。然而,视频数据是有序且结构化的,动态交互(如push vs pull、open vs close)需要考虑多帧的特征才能准确推理。
2023-08-13 13:21:41
564
1
原创 ViT-vision transformer
Transformer最早是在NLP领域提出的,受此启发,Google将其用于图像,并对分类流程作尽量少的修改。
2023-07-28 18:19:08
1708
原创 MUREN(Relational Context Learning for Human-Object Interaction Detection)
参考目前的静态图片HOI的SOTA模型(MUREN),针对以往的1/2 branch的decoder的不足,它提出了three-branch architecture(human detection, object detection, interaction classification)
2023-07-25 17:16:46
387
原创 语义分割结果可视化(原图+语义掩码+图例)
由于实习工作需要把语义分割结果可视化出来,要使用自定义颜色来区分不同的label,并绘制出图例并插入在图像右端。本文将介绍如何实现这样的语义分割结果图。
2023-06-07 15:23:06
7130
1
原创 Segment Anything(2)
本期的内容将分为以下几个方面1. SAM自动化生成mask2. 压缩保存mask3. 超像素分割算法改进SAM(目前效果不佳,但可能以后能做出来)
2023-06-01 15:58:09
1281
原创 3D目标检测(室内)-TR3D
室内3D目标检测的数据集主要包括了ScanNet、SUN-RGBD和S3DIS。TR3D是最新的SOTA模型,本文将介绍如何在MMdetection3D框架上对自己的数据进行处理、并用预训练好的TR3D等模型进行推理。TR3D的github:https://github.com/SamsungLabs/tr3dMMdetection3D的github:https://github.com/open-mmlab/mmdetection3d。
2023-06-01 11:41:51
1780
8
原创 StrongSORT_文献翻译
StrongSORT【摘要】现有的MOT方法可以被分为tracking-by-detection和joint-detection-association。后者引起了更多的关注,但对于跟踪精度而言,前者仍是最优的解决方案。StrongSORT在DeepSORT的基础之上,更新了它的检测、嵌入和关联等多个方面,由此产生了StrongSORT追踪器,在MOT17和MOT20数据集上缺德了新的HOTA和IDF1记录。同时,作者还提出了两个轻量化且即插即用的算法去提升跟踪结果,分别是AFLink和GSI。AFLi
2023-05-12 15:08:21
1066
原创 在CUDA上使用多进程
在批量处理大量数据时,我们常常会选择使用多进程来提高代码运行速度,充分利用CPU/GPU。在此,记录了如何在CUDA上利用多进程来批量推理。
2023-05-12 14:56:23
904
原创 图像特征提取-Hough变换
应用背景已知目标区域由直线、曲线、圆等形状构成。目标检测问题转化为对直线、曲线、圆的检测问题 。而Hough变换就是将图像由图像空间变换为参数空间。原理图像空间中的一条线对应Hough空间中的一个点过点(x0,y0)和(x1,y1)的直线表示为Hough空间中两条线的交点图像空间中的点对应Hough空间中的一条线Hough变换的实现方式线性变换yi=mxi+b −>b=−xim+yiy_i = mx_i+b \ \ -> b = -x_im
2022-05-07 16:17:00
651
转载 Logic chain
BODY1雅思Part 2作文中往没有特别偏激的论述,经常是取中间立场,因此,body 1主要给出论述主体的一些积极点,在body 2中则会论述主体的一些消极点。下面就是关于Body 1的一些写作技巧。logic chain1做某件事或者某个趋势或者某个行为对于某类人的好处The reason for this trend may involve the recognitionthat a young adult passes directly from school to universit
2022-05-04 21:11:25
196
原创 文本相似度指标-基于词汇的相似度量
文章目录Jaccard相似度余弦相似度Dice系数匹配系数Jaccard相似度J(A,B)J(A,B)J(A,B)表示有限样本集之间的相似程度:J(A,B)=∣A∩B∣∣A∪B∣=∣A∩B∣∣A∣+∣B∣−∣A∩B∣J(A,B)=\frac{|A∩B|}{|A∪B|}=\frac{|A∩B|}{|A|+|B|-|A∩B|}J(A,B)=∣A∪B∣∣A∩B∣=∣A∣+∣B∣−∣A∩B∣∣A∩B∣Jaccard相似度:dj(A,B)=1−J(A,B)=∣A∪B∣−∣A∩B∣∣A∪B∣=AΔB∣A∪
2022-04-12 17:26:46
870
原创 词嵌入向量生成
词嵌入向量生成写出每个单词的one-hot encodingimport numpy as npX = np.eye(5)words = ['quick','fox','dog','lazy','brown']for i in range(5): print(words[i],"的one-hot编码:",X[i])quick 的one-hot编码: [1. 0. 0. 0. 0.]fox 的one-hot编码: [0. 1. 0. 0. 0.]dog 的one-hot编码: [
2022-04-11 00:08:55
1639
原创 GSDMM短文本聚类
文章目录优点例子代码测试结果[1] Yin J, Wang J. A dirichlet multinomial mixture model-based approach for short text clustering[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014: 233-242.与LDA不同,GSDMM针对较小文档,假设每
2022-04-09 17:03:52
2059
2
原创 seaborn/matplotlib/pandas画一些简单乐图(组合图)
文章目录一些设置单簇柱形图+折线图多簇条形图多簇柱形图+折线图堆积柱形图+折线图保存图像一些设置import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pdimport numpy as np%matplotlib inlineplt.rcParams['font.sans-serif'] = ['SimHei'] # 黑体plt.rcParams['axes.unicode_minus'] = False
2022-04-07 22:45:45
1080
2
机器学习算法代码(包括SVM、回归、降维、聚类、决策树、逻辑回归、贝叶斯、随机森林、数据处理与特征工程)
2021-06-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人