
Towhee
文章平均质量分 73
开源 embedding 框架与社区
Zilliz Planet
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AltCLIP:改变语言编码器,扩展语言功能
更强语言能力的CLIP 拓展模型 AltCLIP原创 2023-03-16 14:13:19 · 460 阅读 · 0 评论 -
如何跟聊天机器人一起绘画?
能够边聊天边绘画的 Visual ChatGPT原创 2023-03-13 17:44:23 · 236 阅读 · 0 评论 -
探究计算机视觉新兴能力:如何通过提示检索提高性能?
Visual Prompt Retrieval 通过新兴能力改进模型原创 2023-03-02 20:44:24 · 258 阅读 · 0 评论 -
根据文本描述生成视频,Tune-A-Video 效果惊艳
Tune-A-Video 学会用文字生成视频只需一个例子原创 2023-02-28 19:45:25 · 831 阅读 · 0 评论 -
【AAAI 2023】针对视频分类的知识迁移
针对视频分类研究知识迁移原创 2023-02-23 19:11:31 · 243 阅读 · 0 评论 -
【ECCV 2022】TeSTRa:稳定的流式视频识别
TeSTRa 实现稳定的流式视频识别原创 2023-02-21 15:04:41 · 299 阅读 · 0 评论 -
SVFormer:走进半监督动作识别的视觉 Transformer
SVFormer 用ViT进行半监督动作识别。原创 2023-02-17 11:41:45 · 679 阅读 · 0 评论 -
新型掩码自编码器 AdaMAE,自适应采样
AdaMAE 为MAE 引入自适应采样原创 2023-02-15 16:40:42 · 493 阅读 · 0 评论 -
PMR 提取视频特征,理解上下文
PMR 提取视频特征,理解上下文原创 2023-02-14 14:14:31 · 414 阅读 · 0 评论 -
BATMAN:将双边注意力用于视频对象分割
BATMAN 在视频分割中使用双边注意力原创 2023-02-13 19:28:47 · 206 阅读 · 0 评论 -
SparK 用稀疏掩码为卷积设计 Bert 预训练
SparK 用稀疏掩码为卷积设计 Bert 预训练原创 2023-02-07 15:52:00 · 346 阅读 · 0 评论 -
CMAE 结合对比学习和掩码,提高表征辨别力
CMAE 结合对比学习和掩码,提高表征辨别力原创 2023-02-02 17:32:34 · 779 阅读 · 0 评论 -
微软提出 TinyMIM,首次用掩码预训练改进小型 ViT
微软提出 TinyMIM,首次用掩码预训练改进小型 ViT原创 2023-02-02 17:30:50 · 311 阅读 · 0 评论 -
MixMIM 创建混合图像,提出新型掩码方案
MixMIM 混合图像进行掩码原创 2023-01-31 19:13:51 · 225 阅读 · 0 评论 -
视觉模型 ConvNeXt V2,结合纯卷积与MAE
ConvNeXt V2 结合MAE再出击!原创 2023-01-20 11:50:55 · 778 阅读 · 0 评论 -
光神经网络ONN:直接对光信号进行神经网络处理
ONN 在神经网络中引入光学技术原创 2023-01-18 15:12:51 · 1387 阅读 · 0 评论 -
CuPL 利用大规模的语言模型,更高效地生成提示
CuPL 利用大规模的语言模型,更高效地生成提示原创 2023-01-17 18:25:42 · 488 阅读 · 0 评论 -
Mega 改进序列模型,引入移动平均捕捉时空依赖
Mega 利用移动平均改进序列模型原创 2023-01-16 15:26:44 · 412 阅读 · 0 评论 -
CLIPPO:纯图像的CLIP,参数减半且更强大
CLIPPO:纯图像的CLIP,参数减半且更强大!原创 2023-01-11 17:49:37 · 529 阅读 · 0 评论 -
DiT:Transformers 与扩散模型强强联手
DiT:Transformers 与扩散模型强强联手原创 2023-01-10 18:20:43 · 5428 阅读 · 0 评论 -
微软提出通用解码器 X-Decoder,支持图像分割和语言分词
微软提出通用解码器 X-Decoder,支持图像分割和语言分词原创 2023-01-09 17:39:16 · 886 阅读 · 0 评论 -
手把手教你搭建视频去重系统
本文将介绍使用 Towhee 和 Milvus 搭建片段粒度的视频查重系统。原创 2022-12-09 14:41:42 · 3949 阅读 · 3 评论 -
5分钟搭建一个粗粒度「视频去重」系统
这篇文章将教你如何利用 Milvus 和 Towhee 搭建一个粗粒度「视频去重」系统!原创 2022-12-02 20:00:00 · 2030 阅读 · 0 评论 -
世界杯来了,让 Towhee 带你多语言「以文搜球」!
四年一度的世界杯已正式拉开战幕,不如让 Towhee 带你「以文搜球」,一览绿茵场上足球战将们的风采吧~原创 2022-11-26 18:13:24 · 999 阅读 · 1 评论 -
5分钟实现「视频检索」:基于内容理解,无需任何标签
在这篇文章中,我们将会使用 Milvus 和 Towhee 搭建一个基于内容理解的「视频检索」服务!原创 2022-11-18 20:30:00 · 3710 阅读 · 1 评论 -
5 分钟教你搭建「视频动作分类」系统
本文主要介绍了如何用非结构化数据处理 ETL 平台 Towhee 搭建一个视频动作分类系统。原创 2022-11-16 17:39:22 · 1455 阅读 · 0 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个计算机视觉领域的 SoTA 模型: Neuman 帮你创造新视频、PeRFception 助力三维重建、Xmodal-Ctx 输入辅助信息生成更好的图像描述、ExpansionNet 探索序列长度的影响、GRIT 用更多图像特征与文字交互。原创 2022-09-23 10:58:42 · 1649 阅读 · 0 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个视频相关的 SoTA 模型: VideoMAE 成功在视频模型中加入超高遮蔽率、ViS4mer 处理长视频高效又低成本、Flamingo 只需小样本就能胜任多种视觉语言任务,VDTN 用多模态的概念重新定义对话状态追踪任务,ActionFormer 率先将 Transformer 应用到时空动作定位任务。原创 2022-09-17 10:30:00 · 460 阅读 · 0 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个计算机视觉领域的 SoTA 模型,均于最近发表于全球顶会 ECCV 2022: AVS 提出新颖的视听分割任务,kMaX 有效利用经典聚类算法进行全景分割,WSG-VQA 用弱监督学习 Transformer 突破视觉问答 grounding任务,COST 理解视频内容实现 AI 对话,HorNet 将新型视觉骨干插入卷积和 Transformer 架构原创 2022-09-09 14:00:00 · 390 阅读 · 0 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个计算机视觉领域的 SoTA 模型,均于最近发表于2022年顶会 CPVR 和 ECCV: RepLKNet 特立独行专门研究大卷积核, PoolFormer 表示 Transformer 的核心在于架构,Shunted Transformer 提出能够分流的新型注意力机制,QnA 用学习查询加速视觉模型, CoOp 第一个在计算机视觉领域里探索可学习的提示。原创 2022-09-02 14:32:48 · 4961 阅读 · 2 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个计算机视觉领域的 SoTA 模型,均于最近发表于 2022 年顶会 CPVR 和 ECCV原创 2022-08-26 15:30:00 · 393 阅读 · 0 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个多模态的深度学习模型: CLIP 连接文本与图像、 BLIP 统一图文理解与生成、 LightningDot 加速图文跨模态检索、 Data2Vec 兼容文本与音频、 Perceiver 进一步模拟人类处理不同模态数据原创 2022-08-19 15:53:50 · 852 阅读 · 1 评论 -
搭建自己的以图搜图系统(二):深入优化搭建生产级别的图搜系统
接下来本文会从性能、模型和业务流程方面讨论如何解决这些痛点,从而优化我们的以图搜图系统,最后会介绍如何使用 FastAPI 实现简单高效的 Web 服务。原创 2022-08-17 14:15:11 · 2831 阅读 · 1 评论 -
2022 全球 AI 模型周报
本周介绍了 5 个计算机视觉领域的深度学习模型: 动作识别框架新范式 STRM, 智能计数重复动作新基准 TransRAC,高效且可拓展的注意力机制 MaxViT,新型图像检索网络 CVNet,文本与视觉专家联手视频检索 Collaborative Experts...原创 2022-08-12 15:19:22 · 1041 阅读 · 0 评论 -
2022 第四周全球 AI 模型周报
本周继续介绍 5 个计算机视觉领域的深度学习模型: 多尺度视觉模型 MViT, 能够处理更大图像的 Swin Transformer V2, 全能型多模态模型 CoCa, 端到端的视频语言学习 Violet, 实现视频理解大一统的 All in one......原创 2022-08-05 16:12:23 · 766 阅读 · 1 评论 -
Towhee 每周模型
MPViT 通过多嵌入和多路径探索多种视觉任务、 BridgeFormer 利用别样的选择题训练方式加速视频文本检索、 SVT 用自蒸馏让视觉 Transformer 训练摆脱对比学习、CoFormer 融合动作分类和物体检测来识别视频中的情境、ActionCLIP 用检索任务开拓动作识别新思路。...原创 2022-08-01 10:57:37 · 613 阅读 · 0 评论 -
搭建自己的以图搜图系统 (一):10 行代码以图搜图
本文将介绍如何快速搭建自己的图片搜索引擎,只要 10 行 Python 代码就能轻松搞定!原创 2022-07-28 11:03:19 · 6523 阅读 · 0 评论 -
Towhee 每周模型
本周我们分享 5 个视频相关的 AI 模型:轻便好用的视频动作识别模型系列 MoViNets、实现文本与视频跨模态搜索的 CLIP4Clip、比 CLIP4Clip 更好的视频检索模型 DRL、挣脱视频数据局限的 Frozen in Time、对冠军模型 MMT 再次升级的 MDMMT。......原创 2022-07-22 16:15:00 · 525 阅读 · 0 评论 -
多模态模型 CLIP4Clip 带你实现文本与视频互搜
无论是由文字寻找相关内容视频,还是自动为视频匹配最合适的描述,CLIP4Clip 都能帮你做到。原创 2022-07-19 16:53:12 · 1502 阅读 · 0 评论 -
Towhee 每日模型周报
本周一共介绍了 5 个视频相关的模型:“杂食者” Omnivore、“性价比之王” TSM、“进击的纯血” TimeSformer、“回归的高手” Video Swin Tranformer、“国产之光” UniFormer。无论是崛起的新生代,还是与时俱进的 OG,总有一款模型为你所爱。图像、视频、3D 数据一把抓,不挑食的 AI 模型 Omnivore !厌烦了不同数.........原创 2022-07-15 19:00:11 · 859 阅读 · 0 评论