
深度学习
文章平均质量分 73
程序员.小富
这个作者很懒,什么都没留下…
展开
-
OCR相关资源整理
GitHub - hiroi-sora/Umi-OCR: OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。原创 2024-08-18 19:40:55 · 344 阅读 · 0 评论 -
【效率提升】论文写作神器,提高你的写作效率
论文最终展现出来的就是一个PDF格式的文档。当然可以使用word,但光排版这件事情,就能耗费你一半的精力。正确的答案是,使用latex,它是一个专业的排版工具,按照latex的语法进行写作,执行编译就能够得到PDF文件。它的语法包含了如何排版,虽然相比word上手要慢,但在排版这件事情上,入门级别的latex语法,你要达到精通word的水平。latex如何使用呢?当然,要安装编译器,再安装编辑器,本地一通配置,偶尔会遇到些问题,凭着强大的谷歌搜索,倒也不是什么难事。原创 2023-03-03 01:16:11 · 454 阅读 · 0 评论 -
【食品图像识别】跨模态菜谱检索
在「跨模态菜谱检索」任务中,给定一张菜品的图像作为模型的输入查询,模型需要检索出制作该菜品相应的菜谱,我们可以将该过程建模为「视觉-文本」的翻译。这项技术可以帮助我们进一步完成实物识别、营养成分估计、菜谱推荐等下游任务。从技术角度来说,「跨模态菜谱检索」任务要求我们首先识别菜品,再将输入图像与菜谱文本关联起来,并且针对结构化的菜谱文本学习高质量表征。因此,该任务涉及到图像识别与理解、跨模态学习、菜谱文本建模等研究领域。本文介绍了基于识别的菜谱检索、基于跨模态学习的菜谱检索、跨域食物迁移等方面的相关工作。原创 2023-03-03 01:06:53 · 1628 阅读 · 0 评论 -
【食品图像识别】Large Scale Visual Food Recognition
在本文中,我们提出了具有更多数据量、更大类别覆盖率和更高多样性的Food2K,它可以作为一个新的大规模食品图像识别基准。Food2K适用于各种视觉和多模态任务,包括食品图像识别、食品图像检索、检测、分割和跨模态菜谱-食品图像检索。在此基础上,我们进一步提出了一个面向食品图像识别的深度渐进式区域增强网络。该网络主要由渐进式局部特征学习模块和区域特征增强模块组成。原创 2023-03-03 00:42:11 · 2902 阅读 · 1 评论 -
【docker搭建pytorch环境及常用指令】
docker命令使用原创 2022-09-04 17:39:23 · 1128 阅读 · 0 评论 -
深度学习优化算法,Adam优缺点分析
优化算法首先我们来回顾一下各类优化算法。深度学习优化算法经历了 SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 这样的发展历程。Google一下就可以看到很多的教程文章,详细告诉你这些算法是如何一步一步演变而来的。在这里,我们换一个思路,用一个框架来梳理所有的优化算法,做一个更加高屋建瓴的对比。首先定义:待优化参数: www ,目标函数: f(w)f(w)f(w),初始学习率 α\alphaα。而原创 2020-07-19 11:42:54 · 23225 阅读 · 0 评论 -
Batch Normalization论文详解
翻译论文汇总Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate ShiftAbstractTraining Deep Neural Networks is complicated by the fact that the distribution of each laye...原创 2020-03-15 10:02:05 · 618 阅读 · 0 评论