
项目类-图像-以图搜图
TigerZ*
计算机视觉相关。接付费咨询开发。
算法:AIGC、分类、检测、特征、长尾、开集、聚类、传统图像算法。
语言:Python、C & C++。
工具:pytorch、TRT、CUDA、Triton、DeepStream、DALI。
展开
-
现有产品调研
现在以图搜图主要分为两大块:以服务的形式提供,在提供方的数据库里查找的,具体的形式就是几大搜索引擎提供的以图所图功能;以sdk的形式提供的,允许在使用者自建的数据库上进行搜索。 图搜服务相关能力,单纯通用图搜服务(微软、谷歌、百度、360),通用识图、猫狗识别、明星识别(搜狗)。 现有图搜相关sdk能力,主要分为:通用场景相同图搜索(百度),通用场景相...原创 2019-01-30 12:25:51 · 450 阅读 · 0 评论 -
方案一 感知哈希
第一步,缩小尺寸。将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。第二步,简化色彩。将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。第三步,计算平均值。计算所有64个像素的灰度平均值。第四步,比较像素的灰度。将每个像素的灰度,与平均值进行比较。大于或等于平均值,...原创 2019-01-30 12:26:45 · 429 阅读 · 0 评论 -
方案二 phash
phash具体的实现可以很多地方都有了,可以搜到很多差不多的内容,在这我也就简单的记录下,具体可以去谷歌或者百度搜下。 缩小尺寸 为了后边的步骤计算简单些 简化色彩 将图片转化成灰度图像,进一步简化计算量 计算DCT 计算图片的DCT变换,得到32*32的DCT系数矩阵。 缩小DCT 虽然DCT的结果是32*32大小的矩阵,但我们只要保留左上角的8*8的矩阵,这...原创 2019-01-30 12:27:30 · 503 阅读 · 0 评论 -
方案三 感知哈希&局部不变特征
思路:先把已标位正牌的图标特征(dhash,ahash,phash等)收集起来形成一个特征库,新图标来了则提取其特征去特征库里匹配,如果匹配到了相似度极高的则直接认定其为仿冒图标;如果匹配到了相似度较高的则转入sift,gist高级特征匹配。 提升性能和效果的关键点,坑本工程最终在单机完成了数百万官方图标库,每天新进数十万图标的检测。在构建过程中遇到了不少坑,这些坑一部分是计算速度...原创 2019-01-30 12:28:58 · 474 阅读 · 0 评论 -
方案四 orb&颜色直方图&hog
携程技术方案对于酒店中的相同/相似图像,大部分全局特征(比如颜色、纹理和HOG)不能很好地解决图像裁剪残缺和旋转变化等问题;一些局部特征(比如SIFT和SURF)与基于深度学习的特征虽然表达效果较好,但是由于特征提取复杂,计算速度过于缓慢。针对以上特征提取方法存在的缺陷,我们最终采用ORB特征作为图像的特征表达,并使用汉明距离进行相似度的计算。ORB特征具有以下优点:1)特征提取速度快...原创 2019-01-30 12:40:52 · 822 阅读 · 0 评论 -
方案五 CNN&cdvs
博云视觉 20161208 目前百度识图中相似结果是百度IDL通过深度学习提供,而识别结果则是先由深度学习进行语义分类,再由CDVS做精准搜索。之后,自己又在上面的过程中细化很多种具体是实施方案,并撰写相关的专利,网页链接:http://www.pss-system.gov.cn/sipopublicsearch/patentsearch/showViewList-jumpToVi...原创 2019-01-30 12:41:54 · 1085 阅读 · 1 评论 -
方案六 阿里商品搜索
图像搜索技术主要分为五个算法模块: 类目预测:仅通过图片特征进行图片的区分是有限制的,所以可以通过类目的预测进行目标判断,这样就无需对整个图像库进行全局搜索,只需搜索相应的某个类目图片。类目搜索不但可以提升搜索的效率,也可以提升搜索的精准程度。 主体检测:在一般情况下得到的图片主体目标较小并且背景较为复杂,为了减少背景以及其他主体的干扰,就需要进行主体检测。 特征提取...原创 2019-01-30 12:42:42 · 457 阅读 · 0 评论 -
方案六 V2 阿里拍照购方案 分级类目+triplet 多任务学习、one pass k_means聚类
20170808拍立淘的技术框架拍立淘存在典型的技术驱动,在过去的三年多时间,我们不断得通过技术的突破,来实验了业务的增长。拍立淘流程主要分为离线流程和在线流程,主要步骤如下:离线流程:主要是指拍立淘每天离线构建索引库的整个流程,涉及选品、离线抠图、离线抽取特征、构建索引等环节。执行完毕之后,每天会在规定时间完成线上图库的更新。在线流程:主要是指用户一张query图上传...原创 2019-01-30 12:43:41 · 997 阅读 · 0 评论 -
方案六 V3 阿里商品搜索最新版(2018paper)
阿里巴巴视觉搜索研发团队结合目前最先进的深度学习技术和自身的业务特点,经过4年的迭代研发,其目前视觉搜索系统的主要技术特点:1.结合分类建模与近邻搜索技术的精准有效的类别预测方法;2.通过弱监督学习实现目标检测和特征表示的CNN架构的联合学习;3.通过二值特征索引和重排序技术改进用户体验,实现移动端应用的毫秒级响应。离线部分涉及到商品类目选择、特征提取、索引构建,模型构建后每日指定...原创 2019-01-30 12:47:12 · 501 阅读 · 0 评论 -
方案七 bag of word
链接:https://cloud.tencent.com/developer/news/293017原创 2019-01-30 12:47:46 · 294 阅读 · 1 评论 -
方案八 CNN PQ
中科院2016年的专利本发明公开了一种基于CNN(卷积神经网络)的快速图像检索方法,第一阶段是利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征。第二阶段是在特征数据库中对此矢量特征进行k近邻检索。本发明选择基于GOOGLENET网络的CNN特征,这是深度学习兴起后在计算机视觉领域的一个突破,它具有鲁棒性较好的特点。提取CNN特征后,本发明基于PQ的快速检索思想,并加入文本检索中...原创 2019-01-31 09:31:41 · 290 阅读 · 0 评论 -
方案九 闲鱼 hessian-affine 特征点检测 + sift 描述子
数据集准备:1.图片库:取线上1000个视频,对每个视频每隔1秒抽一张视频帧图片,作为总图片库。2.待查询图片:定义7种图片变换方式:旋转、拉伸、调整亮度、裁剪、加字幕、无处理,每种变换生成100个样本。每个样本的生成方式为:从1000个视频里随机选取一个视频,并从所有图片帧里随机取一帧。这样总共得到700个待查询图片。局部特征提取包含两部分内容:特征点检测和特征点描述。3.2.1...原创 2019-01-31 09:32:32 · 2865 阅读 · 2 评论 -
方案十 百度识图 宏观直观分析
百度分为通用和细粒度识别通用识别如下细粒度识别如下原创 2019-01-31 09:33:27 · 568 阅读 · 0 评论