PaddlePaddle应用于百度视觉技术的工程实践

本文由百度视觉技术部主任研发架构师刘国翌分享,介绍PaddlePaddle如何支持百度视觉技术,包括图像识别、图像检索、视频理解、机器人视觉等方面的应用,并探讨了基于PaddlePaddle的模型研发、训练平台Paddle Cloud及其优化过程。

深度学习的出现,某种程度上改变了我们对计算机视觉的定义。而PaddlePaddle是百度开源的深度学习框架,它是如何支持百度视觉技术,有哪些工程实践,这篇文章将由百度视觉技术部主任研发架构师刘国翌为大家解答。

在这里插入图片描述
以下为刘国翌老师演讲实录

百度AI视觉能力

百度内部大规模应用计算机视觉的技术分为四个方面,第一是图像识别,包含图像分类、文字识别、人脸识别等。第二是图像检索,包含图文、相同图片、相似图片和商品图片检索。第三是视频理解,主要涉及视频分类、目标追踪、人体姿态跟踪,应用在商业、监控、安全、新零售等领域,。第四是机器人视觉,包括嵌入式视觉、SLAM、深度传感器。这是百度计算机视觉整体的划分,除机器人视觉大量应用深度学习技术,其余三个技术是从传统的机器视觉的方法逐渐过渡到现在最流行的深度学习的过程,是逐步替代的。

其中,图像识别是百度应用最广泛也是最重要的技术,包括无人车、推荐、图像配图等等。它的基础能力包含通用分类、文字识别、图像检索、细粒度识别、图像审核、视频内容分析六大能力。

在这里插入图片描述
图一:百度识图基础能力

 通用分类:在实际应用中,我们需要处理上万类的通用分类以及各种各样的目标检测,因此百度内部建设自己的分类体系。

 文字识别:和人脸识别一样,是图像识别的最主要的指令,是编码和解码的过程,方向是目标类检测。

 图像检索:用以覆盖广泛的需求,可以搜到互联网所有包含这张图片的网页,以及跟这张图片关联的商品,包括垂类的识别,比如商品、景点、红酒、外币等等,这些无法通过一个简单分类来解决。因此需要通过图像

PaddleX -- 飞桨全流程开发工具,以低代码的形式支持开发者快速实现产业实际项目落地。 PaddleX 集成飞桨智能视觉领域图像分类、目标检测、语义分割、实例分割任务能力,将深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通,并提供统一任务API接口及图形化开发界面Demo。开发者无需分别安装不同套件,以低代码的形式即可快速完成飞桨全流程开发。 PaddleX 经过质检、安防、巡检、遥感、零售、医疗等十多个行业实际应用场景验证,沉淀产业实际经验,并提供丰富的案例实践教程,全程助力开发者产业实践落地。 安装: PaddleX提供三种开发模式,满足用户的不同需求: 1、Python开发模式: 通过简洁易懂的Python API,在兼顾功能全面性、开发灵活性、集成方便性的基础上,给开发者最流畅的深度学习开发体验。 前置依赖 paddlepaddle >= 1.8.4 python >= 3.6 cython pycocotools pip install paddlex -i https://mirror.baidu.com/pypi/simple 详细安装方法请参考PaddleX安装 2、Padlde GUI模式: 无代码开发的可视化客户端,应用Paddle API实现,使开发者快速进行产业项目验证,并为用户开发自有深度学习软件/应用提供参照。 前往PaddleX官网,申请下载PaddleX GUI一键绿色安装包。 前往PaddleX GUI使用教程了解PaddleX GUI使用详情。 PaddleX GUI安装环境说明 3、PaddleX Restful: 使用基于RESTful API开发的GUI与Web Demo实现远程的深度学习全流程开发;同时开发者也可以基于RESTful API开发个性化的可视化界面 前往PaddleX RESTful API使用教程 PaddleX 更新日志: v2.0.0.rc0 全面支持飞桨2.0动态图,更易用的开发模式 目标检测任务新增PP-YOLOv2, COCO test数据集精度达到49.5%、V100预测速度达到68.9 FPS 目标检测任务新增4.2MB的超轻量级模型PP-YOLO tiny 语义分割任务新增实时分割模型BiSeNetV2 C++部署模块全面升级  PaddleInference部署适配2.0预测库  支持飞桨PaddleDetection、PaddleSeg、PaddleClas以及PaddleX的模型部署  新增基于PaddleInference的GPU多卡预测  GPU部署新增基于ONNX的的TensorRT高性能加速引擎部署方式  GPU部署新增基于ONNX的Triton服务化部署方式 Tags:PaddleX源码包 PaddleX2.0 pp飞桨 PaddleX
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值