- 博客(69)
- 收藏
- 关注
原创 AI笔记 - 网络模型 - mobileNet
在深度卷积的过程中得到8×8×3的输出特征图,用256个1×1×3的卷积核对输入特征图进行卷积操作,输出的特征图和标准的卷积操作一样都是8×8×256了。如上图:12×12×3的特征图,经过5×5×1×3的深度卷积后,得到8×8×3的输出特征图。与标准卷积网络区别是将卷积核拆分成为单通道形式,在不改变输入特征图像的深度的情况下,对每一通道进行卷积操作,得到和输入特征图。更少的参数,更少的运算,但是能达到差不多的结果;可分离卷积主要有两种类型:空间可分离卷积和深度可分离卷积,这里使用深度可分离卷积。
2025-05-31 23:19:56
440
原创 AI 笔记 - 模型优化 - 注意力机制在目标检测上的使用
挑战注意力机制的解决方案局部关键特征(如眼睛、嘴巴)空间注意力聚焦人脸局部区域多尺度人脸(大小差异)多尺度注意力或金字塔注意力遮挡问题动态抑制遮挡区域的权重背景干扰通道注意力增强人脸相关特征通道计算效率(实时性要求)稀疏注意力或局部窗口注意力。
2025-05-24 16:33:14
1109
原创 AI 理论- 模型优化 - 注意力机制
注意力机制是深度学习中一种模仿人类选择性关注重要信息的行为,通过动态分配权重来聚焦输入数据的关键部分,在自然语言处理(NLP)、计算机视觉(CV)和多模态任务中广泛应用,尤其因Transformer模型的成功而成为现代AI的核心组件。传统的序列模型(如RNN、LSTM)在处理长序列时,所有输入信息会被压缩成一个固定长度的向量,导致信息丢失或难以捕捉远距离依赖关系。选择性聚焦:模型可以自动学习输入中哪些部分对当前任务更重要。动态权重分配:根据输入和当前状态,为不同部分分配不同的重要性权重。
2025-05-24 16:09:46
995
原创 AI 笔记 -基于retinaface的FPN上采样替换为CARAFE
在每个位置上,CARAFE可以利用底层内容信息来预测重组核,并在预定义的附近区域内重新组合特征。得益于内容信息,CARAFE可以在不同位置使用自适应和优化的重组核,并且比主流上采样算子(如插值或反卷积)实现更好的性能。内容编码器将压缩后的特征图作为输入,对内容进行编码以生成重组核。核归一化对每个重组核应用softmax函数。核预测模块负责以内容感知的方式生成重组核,由三个子模块组成,即通道压缩器、内容编码器和核归一化;CARAFE作为具有内容感知核的重组算子,包含两个步骤。
2025-05-16 20:27:27
660
原创 芯片笔记 - 手册参数注释
芯片内模块的Crypto Engine是一个独立的硬件模块,可以与不同的处理器或芯片集成,具有更好的可扩展性和灵活性。组成结构上,eMMC存储芯片简化了存储器的设计,将Nand Flash芯片和控制芯片以MCP技术封装在一起,省去零组件耗用电路板的面积,同时提高手机或计算机厂商在设计新产品时的便利性。isp是对前端图像传感器输出的信号进行处理的单元,主要作用是线性纠正、噪声去除、坏点去除、AWB、AE、AF等,以匹配不同厂商的图像传感器,并实现较好的成像质量。
2025-05-08 19:14:51
675
原创 AI 笔记 - 开源轻量级人脸检测项目
轻量级人脸检测项目通常具有模型小、速度快、精度高的特点,非常适合在资源受限的设备上运行,如嵌入式设备、移动设备等。
2025-04-11 16:30:16
811
原创 AI 理论 - 模型优化 - 模型轻量化
处理遮挡和多尺度问题:在遮挡或多尺度人脸的情况下,注意力机制可以帮助模型聚焦于人脸的可见部分或关键特征(如眼睛、鼻子等)通道注意力(Channel Attention):学习特征图中不同通道的权重,增强与人脸相关的特征通道。空间注意力(Spatial Attention):学习特征图中不同空间位置的权重,增强人脸区域的特征。增强关键区域的特征:注意力机制能够动态调整特征图中不同区域的权重,使模型更关注人脸区域,抑制背景噪声。模型蒸馏:通过训练一个较小的模型来压缩一个较大的模型的方法。注意力机制的效率优化。
2025-03-14 14:04:36
968
原创 AI 理论 - 训练基础知识
改善过拟合的办法:数据增强,正则化,dropout将预训练的模型导入,然后将最后的分类全连接层换成适合自己问题的全连接层开始训练,可以固定卷积层的参数,也可以不固定进行训练,最后得到期望结果。
2025-03-10 13:41:32
307
原创 AI 实战 - pytorch框架基于retinaface实现face检测
GPU服务器:pytorchnvidia-smi 查看 CUDA 版本Wider Face数据集,标记使用retinaface_gt_v1.1.zip。
2025-03-07 21:54:47
374
原创 AI 实战 - face的数据集格式转换
人脸检测属于目标检测领域,目标检测领域分两大类:通用目标检测(n+1分类),特定类别目标检测(2分类)人脸检测算法:Faster-RCNN系列,YOLO系列,级联CNN系列评价指标:召回率,误检率,检测速度yolo 通过txt文件标注,标注内容:0 0.15 0.33 0.14 0.22对应:类别 归一化后中心点坐标 [x,y,w,h]
2025-03-01 21:02:24
608
原创 AI 实战2 - pytorch框架下基于CenterNet网络实现检测
【代码】AI 实战2 - pytorch框架下基于CenterNet网络实现检测。
2025-02-21 10:29:34
307
原创 gerrit 配置使用
代码由 gerrit 管理,开发者是没有权限直接推送到 develop 分支, 只能推送到 gerrit 的 refs/for/${branch_name} 上, 便于审核.
2023-03-21 10:18:16
325
原创 AI 理论 - 机器学习基础算法
分类算法简介k 近邻算法,kNN决策树朴素贝叶斯简介k 近邻算法,kNN采用测量不同特征值之间的距离方法进行分类(1)只选择样本数据集中前k个最相似的数据,这就是 k-近邻算法中k的出处,通常k<20;(2)选择k个最相似数据中出现次数最多的分类,作为新数据的分类;(3)适用数据范围:数值型和标称型;优缺点(1)优点:精度高、对异常值不敏感、无数据输入假定。(2)缺点:计算复杂度高、空间复杂度高,无法给出数据的内在含义。对未知类别属性的数据集中的每个点依次执行以
2022-05-21 23:33:07
1155
原创 AI 理论 - 主流深度学习框架简介
主流深度学习框架框架发展历程Google - TensorFlowGoogle - KerasBVLC - Caffe/Caffe2Facebook - PyTorchDMLC - MXNet框架发展历程Google - TensorFlow优点(1)最流行的深度学习框架,社区强大(2)功能强大(3)在生产模型和可扩展性方面比较好,适合生产环境(4)使用 TensorBoard 可视化训练(5)通过 TensorFlow serving 容易实现生产部署缺点(1)过于复杂的系统
2022-05-14 00:16:43
1922
原创 tools - window linux子系统 + cmder
window linux子系统 + cmder安装流程美化Linux终端安装流程下载cmder:cmder下载官网cmder 安装路径加入全局环境变量path:我的电脑–>属性–>高级系统设置–>环境变量设置右键快捷启动:管理员身份打开cmd:Cmder.exe /REGISTER ALL设置界面效果(1)将linux子系统的终端添加到Cmder中美化Linux终端安装zsh:sudo apt-get install zsh -y克隆oh-my-zsh的仓库
2022-04-08 17:06:41
1139
1
原创 IT - 软件工程
软件工程软件工程目标:生产具有正确性、可用性以及开销合宜的产品(1)正确性:软件产品达到预期功能的程度。(2)可用性:软件基本结构、实现及文档为用户可用的程度(3)开销合宜:指软件开发、运行的整个开销满足用户要求的程度。设计阶段的主要任务:给出软件解决方案演化模型与增量模型的主要区别:针对的需求完整性不同(1)相同点:基本思想都是非整体开发,以渐增方式开发系统(2)不同点: [1] 增量模型:产生结果给客户使用; [2] 演化模型:多次迭代,产生结果给测试。内聚:
2022-03-11 19:52:38
454
原创 AI 实战 - darknet框架实现目标检测
darknetdarknet简介darknet 环境准备darknet 训练darknet简介darknet官网 (1)比较小众的深度学习框架,没有社区,主要靠作者团队维护优点(1)易于安装:makefile配置需要的附加项(cuda,cudnn,opencv等)直接make完成安装;(2)没有任何依赖项:整个框架都用C语言进行编写,可以不依赖任何库(3)结构明晰,源代码查看、修改方便 [1] src:框架的基础文件 [2] include:框架的头文件 [3] examp
2022-03-10 17:57:51
4921
原创 linux - #define 使用
#definedefine 常用方法经典用法define 常用方法宏的字符拼接(1)“##”是一种分隔连接方式,作用是先分隔,然后进行强制连接。 [1] #define TYPE1(type,name) type name_##type##type a. TYPE1(int, c) --> int name_int_type ; b. "##"号将后面分为 name 、type 、 type三组,替换后强制连接 [2] #define TYPE2(ty
2022-03-09 16:42:23
1449
原创 教育 - 幼儿教育
幼儿教育BBunion金宝贝美吉姆红黄蓝小马快跑七田真积木宝贝东方爱婴亲亲袋鼠运动宝贝BBunion简介(1)0-3岁 性格教育品牌,沿用德国、犹太人早期家庭教育智慧(2)主题式课程体系主要包括:感官、情景、运动、艺术四大系列。(3)打造“633性格塑造体系”及“教玩乐模式”,以德国授权认证“多维感官课”为亮点,倡导学校、家庭、社会三者结合,引导孩子在游戏中学会观察、发现、思考、辩论、比较,培养坚毅、快乐、全面发展、拥有幸福能力的孩子。26大核心素养课程计划金宝贝简介(1)美国老
2022-03-07 17:21:46
664
原创 财务 - 注册会计师
注册会计师简介经济法公司战略与风险管理审计财务成本管理税法会计简介注册会计师:专业阶段考试和综合阶段考试。【1】专业阶段考试科目:《审计》、《财务成本管理》、《经济法》、《会计》、《公司战略与风险管理》、《税法》。【2】综合阶段考试科目:《职业能力综合测试(试卷一)》、《职业能力综合测试(试卷二)》。年均通过率经济法: 25.73%公司战略与风险管理:25.35%审计: 24.66%财务成本管理:
2022-03-06 23:53:16
363
原创 技术前言 - AI相关公司简介
IPC1. 海康威视 + AI开放平台(1)住宅建筑:智慧工地,智慧社区,智慧物业,老旧小区改造(2)商业地产:商业综合体,智慧酒店,公租房管理,智慧产业园区 [1] 商业综合体 a. 商显, 达到宣传和引流效果并增加科技感 b. 客流系统, 辅助精细化运营 c. 场景内容的互动, 达到卖货、激活客流的目的 d. 巡检(视频+AI),物业管理的数字化转型,提升效率和品质 [2] 智慧酒店 a. 自助入住机+刷脸开门等应用, 提高入住效率
2022-03-01 16:09:28
4132
原创 组合数学 - 01 排列与组合
排列与组合概念概念加法法则与乘法法则(1)组合数学最主要内容:对离散对象的计数,加法法则与乘法法则是两个常用基本法则。一一对应:计数时常用技巧,A容易,B困难,A-B一一对应,对B的计数转为A。Cayley定理:过n个有标志顶点的树的数目等于nn-2...
2022-01-17 23:55:22
253
原创 离散数学 - 04 图论
图论简介简介图论的基本概念、路与回路(1)图的基本概念与性质(2)图的代数表示 (3)途径、路、回路、迹的定义(4)欧拉环游(欧拉闭迹)与欧拉迹(5)汉密尔顿路与回路(6)最短路径(7)连通性(8)有向图树、平面图与图的着色(1)树的定义及等价条件(2)支撑树的计数(3)森林(4)最短树(5)平面图与极大平面图(6)对偶图(7)色数与色多项式...
2022-01-06 17:59:00
911
原创 linux - gobject使用
gobject简介sample*.h*.c简介Gobject 系统提供了一个灵活的、可扩展的、并且容易映射到其他语言的面向对象的 C 语言框架.(1)是Glib库的动态类型系统实现,它实现了: [1] 基于引用计数的内存管理 [2] 实例的构造和析构 [3] 通用的set/get的属性获取方法 [4] 简单易用的信号机制GObject 的动态类型系统允许程序在运行时进行类型注册,主要目的有两个:(1)使用面向对象的设计方法来编程,GObject 仅依赖于 GLib 和 li
2021-12-18 21:58:32
1494
原创 linux - glib使用
glib命令行参数解析命令行参数解析#include <unistd.h>#include <stdlib.h>#include <stdio.h>#include <string.h>#include <math.h>#include <glib.h>#include <glib/gstdio.h>#include <fcntl.h>#include <sys/types.h>
2021-12-15 17:08:31
3386
原创 流媒体 - UVC 协议
uvc 是传输协议,没有 ota 升级内容,升级通过 RNDIS 升级uvc解决方案带宽限制在 6M/s,按20fps计算分辨率小于30W,不能使用yuyv,需h264编码传输UVC功能的设备:一个 VC Interface,一个或多个 VS Interface。(1)VCInterface 用于进行配置,操控,设置UVC设备进入不同的功能状态(2)VSInterface则负责视频数据流的传输规范明确要求UVC设备必须使用一个Interface Association Descrip.
2021-12-08 16:12:45
17081
5
原创 AI 理论 - GPU环境搭建
环境搭建环境搭建linux 的 TensorFlow Docker 映像环境搭建查看安装信息:sudo dpkg --list | grep nvidia-*搜索安装信息:apt search nvidia-*查看GPU信息(型号,驱动,CUDA):nvidia-smi查看CUDA信息: nvcc -V移除GPU驱动:sudo apt-get autoremove --purge nvidia-*添加Graphic Drivers PPA: sudo add-apt-repository
2021-12-02 17:23:54
383
原创 AI 实战 - TensorFlow框架下运行姿态检测
姿态检测movenet 资料MoveNet 架构movenet 资料movenet实例分析TF Hub/运行singlepose Lightning 模型singlepose Thunder 模型浏览器实时演示版movenet官网MoveNet 架构谷歌推出的 MoveNet 模型是一个预训练模型,已在 TF Hub 上提供。(1)Lightning 适用于对延迟要求严格的应用(2)Thunder 适用于对准确性要求较高的应用(3)运行速度:笔记本电脑 / 手机 (50+ fps
2021-12-02 15:06:54
1924
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人