
人工智能
文章平均质量分 86
数据饕餮
高级数据产品专家,人工智能等前沿技术领域探索者,15年+一线IT行业经验,主要从事金融、互联网广告和电商行业数据产品建设。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pytorch深度学习框架实战教程12:Pytorch混合精度推理,性能加速147%的技术实现
本文介绍了PyTorch混合精度推理技术,通过同时使用FP32和FP16/BF16等不同数值精度,在保证模型精度损失可控的前提下,显著提升推理速度并减少内存占用。文章对比了纯FP32和混合精度(FP16+FP32)两种推理方式,实验表明在NVIDIA GPU上混合精度可提速141.7%,而输出误差仅0.0032。混合精度推理特别适合计算密集型任务(如视觉、NLP模型),利用GPU TensorCores优化FP16计算,是PyTorch模型部署的重要优化手段。原创 2025-08-10 23:18:46 · 1065 阅读 · 0 评论 -
Pytorch深度学习框架实战教程11:Pytorch模型推理详解和指南
PyTorch模型推理是将训练好的模型应用于新数据预测的过程。根据应用场景可分为在线/离线推理、同步/异步推理、单样本/批处理推理;按硬件可分为CPU/GPU/专用加速器推理。提升推理性能的方法包括:模型剪枝、知识蒸馏等结构优化;混合精度和量化降低计算量;使用TorchScript、ONNX、TensorRT等推理引擎优化;合理选择硬件及批处理策略。这些方法可单独或组合使用,在保证精度的同时提升推理速度,实现模型从研发到落地的关键跨越。原创 2025-08-10 22:33:03 · 661 阅读 · 0 评论 -
Pytorch深度学习框架实战教程10:Pytorch模型保存详解和指南
PyTorch推荐保存模型权重而非整个模型,主要由于灵活性和兼容性优势。模型保存有两种方式:1)仅保存state_dict参数字典(推荐),文件小、兼容性好,加载时需重建相同结构;2)保存完整模型(不推荐),依赖pickle序列化,易受环境变化影响。加载权重时需严格匹配参数名称和结构,可通过map_location指定设备。优先使用.pth/.pt格式保存state_dict,配合model.eval()切换推理模式,确保模型可移植性和版本稳定性。原创 2025-08-10 19:31:40 · 1237 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇08-Pytorch超参数详解和实战指南
本文介绍了PyTorch深度学习中的超参数概念及其应用。超参数是训练前手动设置的参数,控制模型结构和训练过程,包括学习率、批大小、网络层数等。文章详细讲解了超参数的工作原理、作用及分类,并提供了PyTorch实现实例。通过一个非线性回归任务的代码示例,展示了如何设置模型结构、训练过程和优化器相关的超参数,以及简单的网格搜索调优方法。超参数调优是提升模型性能的关键,建议先使用默认参数验证可行性,再针对关键参数进行优化。原创 2025-08-10 12:40:48 · 929 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇07-Pytorch优化器详解和实战指南
摘要: 优化器是深度学习中调整模型参数以最小化损失函数的关键算法,通过梯度下降原理更新参数。核心流程包括计算梯度、更新参数和迭代优化,作用包括加速收敛、稳定训练和适配不同场景。常用优化器分为基础类(如SGD)、动量类(如SGD+Momentum)和自适应学习率类(如Adam、RMSprop),其中Adam综合性能优异,成为主流选择。PyTorch通过torch.optim模块实现优化器,典型使用步骤包括清零梯度、反向传播和参数更新。实际应用中需根据任务需求选择优化器:Adam适合快速收敛,SGD系列更利于精原创 2025-08-10 12:12:00 · 599 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇06:Pytorch损失函数原理、类型和案例
本文介绍了PyTorch深度学习中的损失函数概念与应用。首先阐述了损失函数的作用是量化模型预测值与真实值的差异,指导模型优化。然后详细讲解了回归任务(MSE、MAE、Huber)、分类任务(交叉熵、二元交叉熵)等常用损失函数的数学原理和适用场景。最后系统梳理了PyTorch中torch.nn模块提供的各类损失函数实现,包括回归、分类、序列、生成等任务专用函数,并给出了选择建议。文章强调应根据具体任务特点和数据分布选择合适的损失函数,必要时可自定义实现。原创 2025-08-10 11:56:39 · 568 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇05-Pytorch全连接层概念定义、工作原理和作用
全连接层是神经网络的核心组件,负责特征整合与决策输出。本文系统讲解了其工作原理:通过线性变换(矩阵乘法+偏置)和非线性激活实现特征映射,在CNN中承担全局特征整合与分类决策任务。PyTorch实战部分通过MNIST分类案例,演示了nn.Linear的参数配置和特征可视化,展示如何将28×28图像逐步降维为10类输出。文章指出全连接层虽参数量大但解释性强,建议配合Dropout等正则化方法使用。理解全连接层机制对设计高效神经网络架构至关重要。原创 2025-08-10 09:15:02 · 730 阅读 · 0 评论 -
PyTorch 深度学习实战教程-番外篇04:卷积层详解与实战指南
卷积层是CNN处理视觉任务的核心组件,通过局部感受野和参数共享实现高效特征提取。本文系统解析了卷积层的工作原理:1)卷积核作为特征提取工具;2)滑动窗口计算过程;3)填充策略控制输出尺寸;4)多通道处理机制。其核心优势包括局部特征提取、参数共享、平移不变性和特征抽象能力。PyTorch实现部分详解了nn.Conv2d参数配置、输出尺寸计算公式,并提供了可视化代码示例,帮助直观理解卷积核作用机制和特征图变化过程。掌握卷积层设计对构建高效CNN模型至关重要。原创 2025-08-10 08:41:54 · 864 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇02-Pytorch池化层概念定义、工作原理和作用
池化层是卷积神经网络(CNN)的核心组件,主要用于降维和特征提取。它通过滑动窗口对特征图进行聚合计算(如最大值或平均值),实现三大功能:1)降低计算量;2)增强平移不变性;3)扩大感受野。PyTorch提供多种池化层,包括MaxPool2d(保留显著特征)、AvgPool2d(平滑处理)和AdaptivePool(固定输出尺寸)。池化层与卷积层配合使用,能有效控制网络复杂度,逐步提取高层特征,是CNN架构中不可或缺的部分。原创 2025-08-10 08:26:04 · 1016 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇01-卷积神经网络概念定义、工作原理和作用
PyTorch卷积层实战指南:从原理到实现 本文系统介绍了卷积神经网络(CNN)的核心组件——卷积层。主要内容包括:卷积层的工作原理(局部感受野、参数共享、滑动计算)、作用(特征提取、降维抽象)及PyTorch实现方法。重点解析了nn.Conv2d的核心参数和输出尺寸计算公式,并通过完整代码示例展示了如何构建包含两个卷积层的网络。示例中详细演示了图片预处理、卷积操作、特征图可视化等关键步骤,直观呈现了卷积核如何从原始图像中提取边缘纹理等特征。文章强调卷积层能高效处理高维数据,通过多层叠加实现从低级到高级的特原创 2025-08-10 08:04:16 · 1068 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇03-什么是激活函数,激活函数的作用和常用激活函数
激活函数是神经网络的关键组件,用于引入非线性特性,使网络能够学习复杂模式。主要作用包括非线性映射、输出范围控制和梯度传播。常用激活函数有:Sigmoid(0-1输出)、Tanh(-1-1输出)、ReLU(简单高效)、LeakyReLU(解决"死亡神经元"问题)和Softmax(多分类概率输出)。文中提供了Python实现代码,通过可视化对比了各函数特性。实际应用中,ReLU系列常用于隐藏层,Sigmoid/Softmax多用于输出层。选择合适激活函数对网络性能至关重要。原创 2025-08-10 07:20:40 · 532 阅读 · 0 评论 -
Pytorch深度学习框架实战教程-番外篇10-PyTorch中的nn.Linear详解
本系列教程介绍了PyTorch中nn.Linear模块的核心功能与使用方法。作为神经网络中的全连接层,nn.Linear实现y=xA^T+b的线性变换。教程详细讲解了该模块的初始化方法、参数设置(in_features/out_features)及实际应用场景,包括如何将卷积层输出转换为分类结果。通过代码示例展示了输入输出的维度转换过程,并解释了全连接层在神经网络中的分类器作用。最后指出全连接层可通过1x1或全局卷积实现,帮助开发者更好地理解和运用这一重要组件。原创 2025-08-10 07:01:36 · 764 阅读 · 0 评论 -
TURN 和 STUN 的工作原理:
STUN和TURN是解决NAT穿透问题的两种协议。STUN通过获取公网IP地址实现P2P连接,适用于简单NAT环境;而TURN则通过中继服务器转发数据,适用于对称NAT等复杂场景。WebRTC技术通常结合使用两者,优先尝试STUN连接,失败时切换至TURN中继,确保通信可靠性的同时兼顾效率。STUN协议简单高效,TURN则能应对更复杂的网络环境,但会增加延迟和服务器负担。原创 2025-08-01 05:24:26 · 324 阅读 · 0 评论 -
五大开源OCR开源框架评估01-Tesseract:OCR 领域的远古巨神
本文评估了五大开源OCR框架中的Tesseract,这个由惠普实验室开发、后被Google赞助的开源OCR引擎,以其68K的GitHub星数展现了强大影响力。评估显示,Tesseract支持100多种语言,采用深度学习技术,在高质量扫描图像上表现优异,但在处理复杂布局和低质量图像时存在局限。身份证识别测试中,出现了性别后多标点、民族识别错误及身份证号异常逗号等问题,证明其在该场景"不可用"。尽管历史悠久且文档完善,但相比新兴OCR引擎,Tesseract在特定场景的准确度仍有提升空间。原创 2025-07-18 22:33:54 · 451 阅读 · 0 评论 -
AI大模型打造金融智能信审助手04.七大金融监管相关政策
金融监管政策是动态调整的,会根据经济金融形势的变化、金融创新的发展以及监管实践的经验不断完善和优化,以适应新的挑战和需求,保障银行业的稳健运行和金融体系的稳定。原创 2025-07-18 17:09:28 · 388 阅读 · 0 评论 -
Pytorch深度学习框架实战教程03:Tensor 的创建、属性、操作与转换详解
本文深入解析PyTorch中的Tensor数据结构,涵盖其创建、属性和操作。Tensor是PyTorch的核心多维数组,支持从Python列表、NumPy数组等多种方式创建,并可通过工厂函数生成特定形状的张量。文章详细介绍了Tensor的关键属性(shape、dtype、device等)、数学运算、索引切片、形状操作(view/reshape)、连接堆叠等核心功能,以及数据类型转换、设备迁移和与NumPy的互操作。特别强调了view与reshape的区别及内存连续性处理。掌握这些Tensor操作是使用PyT原创 2025-07-17 23:15:29 · 1314 阅读 · 0 评论 -
Pytorch深度学习框架实战教程02:开发环境部署
本文详细介绍了PyTorch CPU/GPU双版本的完整安装流程。首先明确硬件和软件环境要求,包括CPU/GPU配置和操作系统版本。接着分步骤讲解Python环境搭建(推荐Miniconda)、CPU版本安装、GPU版本安装(含CUDA和cuDNN配置)以及Docker部署方案。提供详细的安装验证方法,包括基础功能测试和性能基准测试。针对常见问题给出解决方案,并分享环境优化建议。最后根据不同应用场景推荐最佳安装方案,帮助用户快速搭建高效的深度学习开发环境。原创 2025-07-17 19:19:58 · 983 阅读 · 0 评论 -
Pytorch深度学习框架实战教程01:简介
PyTorch 是基于 Python 的深度学习框架,由 Facebook 开发维护,提供了动态计算图、GPU 加速等功能,被广泛应用于学术研究与工业界。原创 2025-07-14 06:39:15 · 1026 阅读 · 0 评论 -
Pytorch深度学习框架实战教程09:模型的保存和加载
本文介绍了PyTorch中模型保存与加载的两种方法:一是仅保存模型权重,通过state_dict和load_state_dict实现;二是同时保存模型结构和权重。第一种方法需先创建相同模型实例再加载权重,第二种方法可直接保存整个模型。文章强调了使用weights_only=True加载权重的最佳实践,并提醒导入模型类的重要性。这两种方式为深度学习模型部署提供了灵活性选择。原创 2025-07-17 07:08:52 · 382 阅读 · 0 评论 -
DeepSeek R1完全本地部署实战教程01-课程大纲
11.DeepSeek r1 外部访问身份认证api-key。12.DeepSeek r1 公网服务发布-内网穿透设置。8.DeepSeek r1 本地模型路径设置。9.DeepSeek r1 本地访问身份认证。5.DeepSeek r1配置外部网络访问。6.DeepSeek r1多任务并发配置。7.DeepSeek r1 访问性能优化。(1)deepseek r1 模型获取。(2)deepseek r1 模型配置。(1)webui可视化界面部署。(2)ollama安装和配置。4.webui安装和配置。原创 2025-02-10 15:52:49 · 680 阅读 · 0 评论 -
deepseek r1完全本地部署实战教程09
【代码】deepseek r1完全本地部署实战教程09。原创 2025-02-08 09:50:58 · 484 阅读 · 0 评论 -
专题1:AI大模型在汽车行业的应用现状与展望
其他车企目前比较普遍的做法是将大模型作为工具辅助汽车的智驾训练,如吉利、广汽等,利用大模型在大量corner case场景进行泛化,弥补真实数据不足的情况,解决智能驾驶场景中的难题,但大模型仍然存在可解释性差、需要海量高质量数据等劣势。汽车行业作为制造业的一个细分领域,除了车辆本身的智能化以外,大模型也将深入影响汽车行业价值链中的各个环节,例如在生产制造环节,宝马、奔驰、通用等国外车企均利用大模型提高生产效率和质量,且已有明显效果,可供国内车企进行参考。原创 2024-12-03 23:02:00 · 471 阅读 · 0 评论 -
《大模型在汽车行业的典型应用实践》100w字长文预告
当前大模型已经全面赋能汽车产业全链路并形成了典型的应用场景。,具体包括芯片、存储网络等基础设施、通用大模型、大模型开发平台等,上层应用涉及从研发、生产、销售、服务、车端应用等各个方向。,产品端的大模型技术部署早于企业内部的大模型变革,其中大模型支持的营销类应用、智能驾驶大模型、智能座舱大模型是车企投入的首选。原创 2024-12-03 21:39:56 · 1367 阅读 · 0 评论 -
揭秘语音识别巨头1:国内外顶尖技术服务商全解析01(万字长文)
解密语音识别巨头:国内顶尖技术服务商全解析00:学习地图解密语音识别巨头:国内顶尖技术服务商全解析01:微软语音,商业No.1解密语音识别巨头:国内顶尖技术服务商全解析02:百度语音,长跑选手解密语音识别巨头:国内顶尖技术服务商全解析03:火山引擎,番茄听书解密语音识别巨头:国内顶尖技术服务商全解析04:科大讯飞,方言之星解密语音识别巨头:国内顶尖技术服务商全解析05:Whisper,开源No.1解密语音识别巨头:国内顶尖技术服务商全解析06:SenseVoice,阿里巴巴新作。原创 2024-10-12 20:35:10 · 1028 阅读 · 0 评论 -
YOLOv11:重新定义实时目标检测的未来
Ultralytics YOLOv11 是备受赞誉的实时目标检测和图像分割模型的最新版本。YOLOv11 基于深度学习和计算机视觉领域的最先进进展,提供了无与伦比的速度和精度性能。其简洁的设计使其适用于各种应用场景,并且可以轻松适应从边缘设备到云端 API 的不同硬件平台。2024.10Ultralytics 团队自豪地宣布推出 YOLOv11,这是其备受赞誉的实时目标检测和图像分割模型系列的最新版本。YOLOv11 基于最新的深度学习和计算机视觉技术,提供了前所未有的速度和精度。原创 2024-10-02 07:24:39 · 4396 阅读 · 0 评论 -
YOLOv1–v11: 版本演进及其关键技术解析
YOLO (You Only Look Once) 是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。原创 2024-10-02 06:53:38 · 4012 阅读 · 0 评论 -
【AIGC】Stable Diffusion Prompt 每日一练0915:机车女孩
本文是一个系列,有点类似随笔,每天一次更新,重点就Stable Diffusion Prompt进行专项训练,本文是第一篇《Stable Diffusion Prompt 每日一练0915》。下一篇《Stable Diffusion Prompt 每日一练0916》.原创 2023-09-16 23:21:23 · 457 阅读 · 0 评论 -
【AIGC】Stable Diffusion Prompt 每日一练0916
本文是一个系列,有点类似随笔,每天一次更新,重点就Stable Diffusion Prompt进行专项训练,本文是第一篇《Stable Diffusion Prompt 每日一练0916》。本次需要重点记忆的知识点:1. 单词组合的使用;2. 逆向提示词模板的使用。原创 2023-09-16 21:44:48 · 751 阅读 · 0 评论 -
chatGPT小白快速入门-002:一文看懂什么是chatGPT
ChatGPT是什么?ChatGPT是由谁开发的?ChatGPT是一个什么样的语言模型?我们的业务目标非常明确,通过一篇文章,介绍清楚到底是什么?原创 2023-08-13 08:45:24 · 369 阅读 · 0 评论 -
Python3.8以上版本安装Tensorflow1.15.0教程
最近在探索基于三维重建的数字人开发,Ubuntu环境下,需要用到Tensorflow1.x版本,但是从Python 3.7 版本以后,pip已经不在支持tensorflow1.x版本。无奈四处求索,最终找到了python3.7以上版本安装Tensorflow1.x版本的方法,特此备注在此,算是笔记。原创 2023-01-03 13:20:01 · 5049 阅读 · 1 评论 -
Ubuntu18.04 如何安装2080ti显卡驱动【最终失败】
Ubuntu18.04 如何安装2080ti显卡驱动原创 2022-11-17 19:25:03 · 1324 阅读 · 0 评论 -
ESRGAN网络结构、论文和源码
图像增强处理框架ESRGAN网络结构、论文和源码原创 2022-11-12 07:31:43 · 1194 阅读 · 0 评论 -
国内外可用的知识图谱资源
一、前言 这是系列博文《知识图谱实战开发案例剖析》第5部分:知识图谱的获取,第2节:国内外可用的知识图谱资源。该系列内容同时已经录制成视频课程,感兴趣的可以访问网易云课堂。 QQ技术交流群:149933712。 二、国际知识图谱可用资源 2.1 Google知识图谱资源 Google倡导的行业标准化体系的价值在于:给大家提供了顶层知识类型划分的标准,并且提供了具体的实体类...原创 2018-03-13 13:34:16 · 5564 阅读 · 0 评论 -
LSTM工作原理和机制详解
转自http://www.jianshu.com/p/9dc9f41f0b29上面这篇长博文,作者真心花了很多心血来创作,写的详细,易懂,对于学习lstm有很大的帮助。读完后我觉得要理解几个门的作用,文中作者提到的三个例子恰到好处。个人认为这三个例子是弄明白lstm的关键。忘记门:作用对象:细胞状态作用:将细胞状态中的信息选择性的遗忘让我们回到语言模型的例子中来基于已经看到...转载 2019-04-02 10:04:37 · 16252 阅读 · 0 评论 -
13行代码实现:Python实时视频采集(附源码)
一、前言本文是《人脸识别完整项目实战》系列博文第3部分:程序设计篇(Python版),第1节《Python实时视频采集程序设计》,本章内容系统介绍:基于Python+opencv如何实现实时视频采集。完整的相关内容已录制成视频课程,点击跳转:《人脸识别完整项目实战(附源码)》整个《人脸识别完整项目实战》系统架构结构如下图所示:项目概述篇:系统介绍人脸识别项目的系统架构设计、项目...原创 2019-04-07 07:03:29 · 7419 阅读 · 2 评论 -
智能对话机器人实战开发(1)- 体系结构和分类
一、前言人工智能时代,以智能对话机器人为最核心的技术应用方向之一,实现人机之间通过自然语言的沟通和交流,是智能人机对话机器人的核心目标之一。尤其是Google Assistant 语音助手近期的卓越表现,如何开发智能对话机器人系统,成为一个新的热点。本文是系列文章的第一部分,旨在较少智能对话系统的进行一个全面和具体的介绍。相关内容已同步录制成视频课程,发布网易云课堂,优快云学院,《智能对话机...原创 2018-06-04 13:05:18 · 4244 阅读 · 2 评论 -
NLTK For Python3版本变化说明
1.Here are some changes you may need to make:grammar: ContextFreeGrammar → CFG, WeightedGrammar → PCFG, StatisticalDependencyGrammar → ProbabilisticDependencyGrammar, WeightedProduction → Probabilis...原创 2018-05-21 18:32:48 · 1696 阅读 · 0 评论 -
一张图看懂自然语言处理技术框架
一张图看懂自然语言处理技术框架一、前正在针对《人工智能产品经理最佳实践》视频课程第三部分,关键技术篇,进行相关的内容重构,今天整理的部分是自然语言处理技术框架,特地绘制了一张自然语言处理的技术框架图,在此分享给大家。二、正文三、未完待续个人梳理,未尽之处,欢迎指正。QQ技术交流群:149933712...原创 2018-05-17 19:12:12 · 14798 阅读 · 1 评论 -
一小时让你学会知识推理(上)- 附完整源码
一、前言 本文是《智能对话机器人实战开发案例剖析》系列文章的第三部分,第2篇:基于知识图谱的智能问答机器人关键技术。相关内容已录制成视频课程,课程地址:网易云课堂 配套开源框架代码已上传至Github:kgRobot,如需参与项目开发请联系作者QQ群:149933712. 二、正文 2.1 核心思想 通过自然语言处理,把用户输入的问题,基于规则映射模型,转换为知识图谱查询语言...原创 2018-04-12 11:08:44 · 8655 阅读 · 0 评论 -
基于知识图谱的智能问答机器人技术架构
一、前言 本文是《智能对话机器人实战开发案例剖析》系列文章的第三部分,第1篇:基于知识图谱的智能问答机器人技术架构。相关内容已录制成视频课程,课程地址:网易云课堂 配套开源框架代码已上传至Github:kgRobot,如需参与项目开发请联系作者:149933712. 二、技术架构图 三、未完待续 系列连载,持续更新。版权所有,转载请注明出处。多轮问答_知识图谱...原创 2018-04-02 09:36:11 · 11183 阅读 · 0 评论