- 博客(3)
- 收藏
- 关注
原创 【CVPR论文复现】VTimeLLM: Empower LLM to Grasp Video Moments
大型语言模型(Large language models, llm)已经显示出卓越的文本理解能力,并被扩展为视频语言模型(Video llm)来处理视频数据以理解视觉细节。然而,现有的视频LLM只能提供整个视频的粗略描述,无法捕捉到特定事件的精确开始和结束时间边界。在本文中,我们通过提出VTimeLLM来解决这个问题,VTimeLLM是一种新颖的视频LLM,旨在针对时间边界进行细粒度视频时刻理解和推理。
2024-12-24 19:28:59
1830
原创 【python绘图】绘制局部放大图
如下图所示:A、B用于固定局部放大图左下角的位置,C、D指定局部放大图大小。A越大,局部放大图越靠近右边;C、D越大,局部放大图相对于整个画布越大。选中原图中的一小部分矩形区域框出,然后放大,将原图和放大图都绘制在同一个画布上,并将对角线采用直线连接。zoom_array = [0.55, 0.10, 0.4, 0.4] # 即[A,B,C,D]根据局部放大图的位置,这部分参数可能需要调整。# 这里的意思是连接原图中的(x1, y2)点与局部放大图的(0, 0)点。# xyB:局部放大图的顶点坐标。
2024-04-02 19:06:49
1305
1
原创 连接远程服务器运行深度学习模型
这样当您租用一个新的容器实例时,可以不再选择基础镜像,然后上传文件等等,而是直接选择我的镜像,可以省去很多重复操作。这里的我的镜像可以在曾用实例关机后保存镜像,然后就可以在另一个实例上使用,不需要重新传文件和配环境了(暂时先不用管我的镜像)传输完成后回到AutoDL的界面,点击快捷工具中的JupyterLab,就可以看到上传上去的文件了,也可以查看代码。这里运行代码生成的文件都是在服务器上,如果需要保存的话,可以右键文件下载回自己的电脑上,需要保存数据的一定注意了。文件---站点管理器---新站点。
2024-03-17 11:56:01
1829
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人