VLM模型
VLM 模型(Vision–Language Model,视觉-语言模型)是一类同时理解图像与自然语言的多模态大模型。
VLM = 让模型“看懂图像 + 理解语言 + 跨模态推理与生成文本”
行如流水
具身智能算法工程师一枚,记录自己看的一些模型和论文
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
空空如也
分享