- 博客(51)
- 资源 (4)
- 收藏
- 关注

原创 微信小程序 在index.js中改变全局变量 使得index.wxml中的数据显示和隐藏
如何有效的改变全局变量??请各位大佬帮我看看 十分感谢index.wxml代码如下:在这里插入代码片<view class='message' bindtap='goToDetail' wx:for='{{messageList}}' wx:for-item='list' wx:key='{{list.id}}' data-id='{{list.id}}'> &l...
2019-05-25 16:26:20
3239
1
原创 video retrieval 论文阅读--Composed Video Retrieval via Enriched Context and Discriminative Embeddings
keywords: (自己总结)同方向论文:CoVR: Learning Composed Video Retrieval from Web Video Captions。
2024-06-04 17:34:43
860
1
原创 video retrieval 论文阅读--Prototype-based Aleatoric Uncertainty Quantification for Cross-modal Retrieval
跨模态检索
2024-06-04 16:59:25
962
1
原创 video retrieval 论文阅读---Text video Retrieval with Global-Local Semantic Consistent Learning
视频检索video retrieval
2024-06-04 16:44:49
1192
1
原创 多模态论文阅读-LLaVA
使用机器生成的instruction-following data 对大型语言模型(LLMs)进行指令调优已被证明可以提高新任务的zero-shot能力,但该想法在多模态领域的探索较少。我们首次尝试使用languguage-only GPT-4来生成multimodal language-image instruction-following data。
2024-02-29 21:39:37
1915
2
原创 多模态论文阅读--V*指导视觉搜索成为多模态大语言模型的核心机制
当我们环顾四周并且执行复杂任务时,我们如何看以及挑选看什么的过程是非常重要的。然而,当前的多模态大语言模型(MLLMs)缺乏这种视觉搜索机制,妨碍了它们关注重要特征的能力,尤其是处理高分辨率和视觉拥挤的图像时。为了解决这个问题,我们介绍了V*,一个LLM-guided 的视觉搜索机制,用LLMs中的世界知识有效的视觉索引(visual quering)。当和一个MLLM结合时,这个机制增强了合作推理(collaborative reasoning),上下文理解和特定视觉元素的精确定位。
2024-02-28 08:49:18
958
1
原创 Mixtra-8x7b finetuning on your device
Mixtral-8x7b finetuning on Ultrachat 数据集
2024-02-03 11:02:18
245
1
原创 Video Summarise 入门
“Video summarization” refers to the process of creating a concise and condensed representation of a video, capturing its essential content, key events, or highlights. The goal is to provide a shorter version of the video that retains its most important inf
2023-11-19 16:10:55
836
原创 多模态论文阅读之BLIP
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation
2023-11-03 20:23:28
806
原创 多模态论文阅读之VLMo
VLMo:Unified Vision_Langugae Pre-Training with Mixture-of-Modality-Experts
2023-11-03 17:18:00
823
原创 多模态论文学习之ALBEF(Align BEfore Fusing)
(becasue:目标检测器是提前训练好的,然后只用抽特征,没有进行end-to-end的训练,所以导致视觉特征和文本特征可能相隔很远。然后同时将这两个特征扔给编码器,编码器可能就学不好)。大多数多模态模型都是用transformer的编码器同时编码视觉的token(region-based image features)和文本的token。
2023-11-01 17:10:45
415
原创 CV论文阅读大合集
YearNameAreamodeldescriptiondrawback2021 ICMLClip (Contrastive Language-Image Pre-training)contrastive learning、zero-shot learing、mutimodel用文本作为监督信号来训练可迁移的视觉模型CLIP’s zero-shot performance, although comparable to supervised ResNet50, is n
2023-11-01 11:43:37
979
原创 为什么CNN自带位置信息,transformer没有
总的来说,CNN 和 Transformer 在设计上是为了处理不同类型的数据:CNN 适用于具有明显的空间结构的网格数据(如图像),而 Transformer 更适用于序列数据(如文本)。卷积神经网络(CNN)和变压器(Transformer)是两种在深度学习中广泛使用的神经网络架构,它们在处理数据的方式有一些重要的区别,其中之一是对位置信息的处理。由于卷积核的滑动操作,CNN 具有保留位置信息的特性,这使得它们非常适合处理需要考虑物体的空间结构或位置关系的任务,如图像分类、物体检测等。
2023-09-18 21:52:46
323
原创 NLP中的self-supervision是什么意思?
NLP(自然语言处理)中的"self-supervision"(自我监督)是一种训练模型的方法,其中模型从输入数据中自己生成标签或者目标,而无需依赖外部标注的数据。在自我监督的方法中,模型会被要求解决一个自己创建的任务,而不是依赖于人工标注的数据集。例如,在语言模型中,自我监督可以通过将一段文本中的某些词或短语遮掩,然后让模型预测被遮掩部分的内容。总的来说,自我监督是一种有效的训练方法,可以让模型在没有大量标注数据的情况下获得良好的性能,这对于许多现实世界的应用场景非常有用。
2023-09-18 21:43:15
330
原创 2D插值(2D interpolation)
具体来说,2D插值会根据已知的离散数据点的值,在空间上推断出这些点之间的数值,从而生成一个平滑的连续函数表达式。它假设在每个矩形的四个顶点上的数值构成了一个平面,并在矩形内部进行线性插值。选择合适的插值方法通常取决于数据的特性、所需的精度以及计算效率的考量。双三次插值是一种比双线性插值更复杂的方法,它使用周围16个像素的信息来进行插值。样条插值是一种通过拟合局部多项式来进行插值的方法,可以用于生成平滑的曲线或曲面。这种方法使用径向基函数来插值,其中每个基函数的形状决定了插值的性质。
2023-09-18 21:03:58
1064
原创 translation equivaiance 和 translation invariance 的异同
CNN中的translation equivariance是什么意思?
2023-09-18 20:24:23
463
原创 注意学术论文的时态!!
例子:This paper examines the impact of climate change on biodiversity in the Amazon rainforest.例子:This study highlights the importance of proactive conservation efforts in the face of climate change.总的来说,保持时态的一致性非常重要,以确保你的论文逻辑清晰,易于理解。
2023-09-14 17:38:59
1928
原创 zero-shot learning 和meta learning的异同
zero-shot learning、meta learning和few shot learning的异同
2023-09-13 16:30:26
206
原创 查看YOLO的模型大小和参数量的三种方式
要查看YOLO模型的大小和参数量,你可以使用相关的深度学习库和工具,比如TensorFlow、PyTorch或Darknet。
2023-09-09 19:57:58
8319
6
原创 jupyter notebook指向不同的文件夹
一台电脑多个人用,每个人都想把jupyter-notebook指向自己文件夹的位置。试了很多种方法,都不行。最后简单粗暴的解决。再运行jupyter notebook前,cd到想要去的文件夹再运行就ok!
2022-05-31 15:28:06
1031
原创 【已解决】sql server还原数据库时要还原的备份集不显示错误
sql server还原数据库时要还原的备份集不显示错误sql server还原数据库出错]看了网上很多方法,最后发现是sql server的版本不一样。我电脑上的版本是2008,源数据库的版本是2017.重新安装sql server后就可以了!sql server的安装方法参考:https://zhuanlan.zhihu.com/p/3768127852. sql server中实例是什么意思?https://www.cnblogs.com/pipci/p/15166874.html
2022-05-30 22:49:32
1508
原创 conda创建虚拟环境后,anaconda中找不到,虚拟环境存在C盘
两种解决方法:conda create -p D:\software\anaconda3\envs\virtualname打开.condarc文件 一般在C:\User\xxx.condarc下在文件后面添加:envs_dirs: -- D:\software\anaconda3\envs\总的来说,第二种方法是一劳永逸的,第一种方法相对来说比较麻烦...
2022-05-27 10:10:58
7845
4
原创 python基础知识
python基础知识注释单行注释:# 这是单行注释(注释和#之间添加一个空格)在代码后面增加注释。和代码之间有2个空格多行注释:""“这是多行注释”""单引号或双引号都可以函数的注释:在定义下面用多行注释。在函数调用文职,使用快捷键ctrl+q可以查看函数的说明信息。注意:因为函数体相对比较独立,函数定义的上方,应该和其他代码(包括注释)保留两个空行3.TODO注释算数运算符在python中*还可以用于字符串中print('--'*50)计算机中的三
2022-03-30 09:58:00
173
时间序列预测-Transformer,Informer,Autoformer,FEDformer复现结果
2023-11-15
大学生java实验(二)
2020-12-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人