言有三新书出版,第一本在Elsevier出版的英文书籍!

《Deep Learning for Image Recognition》出版

各位朋友,今天有三来发布新书了,名为《Deep Learning for Image Recognition》,本次书籍为我写作并出版的第8本书籍,也是第1本英文书籍。

前言

笔者在2023年出版了深度学习之图像识别:核心算法与实战案例(全彩版),从深度学习的背景和基础理论开始讲起,然后介绍了深度学习中的数据使用,以及计算机视觉的三大核心领域,图像分类、图像分割、目标检测,并介绍了深度学习模型的可视化、模型的优化和部署。

经Elsevier出版社引进,本书于2025年被翻译成英文,并正式于2025年10月出版。

【Elsevier出版社简介:Elsevier(爱思唯尔)成立于1880年,总部位于荷兰,是全球领先的科学、技术与医学(STM)信息分析及出版集团,以顶级学术声誉、高质量内容和深度嵌入全球科研评价体系而被广泛视为“含金量非常高”的出版机构。与Springer Nature和Wiley并称为全球三大学术出版社】

本书相关信息

下面给大家介绍本书的简要信息。

全书正文共计521页,分为9章,目录如下:

如果有兴趣购买英文版,可参考购买地址:https://shop.elsevier.com/books/deep-learning-for-image-recognition/long/978-0-443-43950-6

本书实拍图

如果想要在线阅读,可参考sciencedirect地址:

https://www.sciencedirect.com/book/monograph/9780443439506/deep-learning-for-image-recognition

【致谢:感谢欧振旭编辑与清华大学出版社以及Elsevier出版社的认可和协助,帮助本书顺利出版】

中文版

对于国内的朋友来说,获取中文版更加方便,书籍内容介绍如下。

第1章 神经网络与卷积神经网络基础

本章首先介绍了神经网络的生物基础与数学模型,然后介绍了卷积神经网络的基础知识,这也是当前深度学习模型的基础。

图片

第2章 深度学习优化基础

本章首先介绍了深度学习优化相关的内容,包括激活函数、标准化方法、正则化方法、最优化方法、参数初始化方法等。然后介绍了深度学习主流开源框架,包括Pytorch等,并对其特点与性能做了对比;本章旨在让大家对深度卷积神经网络的优化有一个较为全面的认识,给后续章节的学习打好基础。

图片

第3章 深度学习中的数据

本章首先介绍了深度学习发展过程中的几个数据集,给读者展示了数据集对深度学习的重要性;接着介绍了几大重要发展方向中的数据集;接着讲述了数据的收集、整理及标注、数据增强等相关问题;最后讲述了数据的可视化与分析。本章是工业项目中非常重要的环节,也是实践性很强的内容。

图片

第4章 图像分类

本章首先介绍了图像分类的基础、然后详细介绍了图像分类的各个研究领域,包括多类别图像分类,细粒度图像分类,多标签图像分类,半监督与无监督图像分类,零样本图像分类;在案例实践部分,首先以一个从零搭建的图像分类模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分类任务的实践流程;然后介绍了一个细粒度级别的图像分类任务,以一个较好的基准模型,展示了较难的图像分类任务特点以及模型训练调优。

图片

第5章  目标检测

本章首先介绍了目标检测的基础和基本流程,并讲述了一个经典的V-J目标检测框架;然后介绍了基于深度学习的目标检测任务的研究方法与发展现状,并重点总结了其中的二阶段目标检测方法与一阶段目标检测方法;最后给出了一个目标检测任务实践,使用当下比较主流的YOLO系列中的YOLO v3框架来进行模型训练与测试。

图片

第6章  图像分割

本章首先介绍了图像分割基础与研究方向,简单回顾了经典的图像分割方法;然后介绍了基于深度学习的图像分割方法的基本原理与核心技术,并重点总结了语义分割模型、实例分割模型、Image Matting模型;在案例实践部分,以一个从零搭建的图像分割模型和从零准备的数据集为例,展示了如何实现一个完整的工业级图像分割任务的实践流程;然后介绍了一个更加复杂的人像软分割任务,展示了典型Image Matting框架的代码实现与模型训练。

图片

第7章  模型可视化

本章首先对深度学习中的模型结构可视化做了介绍,然后对具有代表性的模型可视化分析方法进行了介绍;在案例实践部分,分别对梯度法可视化、反卷积可视化、激活热图可视化方法进行了代码分析与实践。

图片

第8章  模型压缩

本章首先介绍了轻量级模型设计的代表性方法,然后依次详细介绍了模型剪枝、模型量化、模型蒸馏的代表性模型;在案例实践部分,分别进行了基于缩放因子的结构化模型剪枝、基于KL散度的8bit模型量化、以及经典的知识蒸馏框架的代码实现与模型训练和压缩。

图片

第9章  模型部署

本章依托微信小程序平台从3个方面介绍了模型部署的问题。首先介绍了微信小程序的前端开发基础,然后介绍了微信小程序的服务端开发基础,最后介绍服务端算法功能代码的实现,完成了一个可供所有读者验证的工业级线上模型的部署。

图片


本书内容由浅入深,讲解图文并茂,紧随工业界和学术界的最新发展,理论和实践紧密结合,给出了大量的图表与案例分析。本书抛开了过多的数学理论,完整地剖析了深度学习在图像识别领域中各个维度的重要技术,而不是只停留于理论的阐述和简单的结果展示,更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习,将会对深度学习领域的图像识别技术和其在实际开发中的应用有更深的理解。本书所有实战代码统一使用Pytorch框架,适合新手使用学习。

该书籍的详细介绍如下:

言有三新书出版,《深度学习之图像识别(全彩版)》上市发行,配套超详细的原理讲解与丰富的实战案例!

2023年深度学习图像识别书(全彩色印刷,正文382页)

更多图像识别的视频学习资料

由于作者的水平和时间有限,书籍出版的时间滞后,以及图文形式本身的限制,因此在我们公众号还有针对本书的视频学习资料,部分如下:

图片

【总结】初学深度学习与CV,资料找的一塌糊涂,这个超过2000页PPT,有这个80小时讲解的CV核心内容就够了

有需要的朋友也可以跟随我们社区系统性地学习深度学习与计算机视觉相关课程,本书为配套辅导教材。

【一对一小组】2025年有三AI-CV初阶-基础算法组发布,助力夯实深度学习图像识别算法理论与实践

转载文章请后台联系

侵权必究

往期精选

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

言有三

三人行必有AI

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值