- 博客(55)
- 资源 (1)
- 收藏
- 关注
原创 ChatGLM系列解析(三)—— ChatGLM3 —— 多模态能力CogVLM
ChatGLM3中核心组件——CogVLM,多模态视觉语言模型
2024-09-05 16:05:43
1176
1
原创 ChatGLM系列解析(三)—— ChatGLM3 —— AgentTuning
本文作为ChatGLM系列的第三篇,主要讲到ChatGLM3做出的优化与改进,本篇核心是GLM3中的核心技术之一——AgentTuning
2024-09-02 14:57:05
1400
原创 MQA(Multi-Query Attention)详解
MQA(Multi-Query Attention):多头注意力机制MHA的优化版本,轻微牺牲性能,换取FLOPs的减少和KV Cache的显存占用的减少。
2024-08-01 17:36:17
1907
原创 使用 onnxruntime-gpu 进行推理,运行时间久显存逐渐递增无法减少
将onnx模型部署为接口后,使用 onnxruntime-gpu 进行持续推理,运行时间久显存逐渐递增无法减少
2024-06-26 15:35:34
2614
1
原创 解析Bert系列模型的输出结果?结构与形状是什么?如何更好地应用到‘微调下游任务’中?
Bert的主要输出都有哪些?这些输出的一般结构和形状都是什么?如何利用这些输出,使其更好地服务我们的下游任务?
2024-06-05 15:21:38
2023
3
原创 知识增强系列 ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Ge,论文解读
知识增强系列 ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Ge,论文解读:如何将世界知识融入到预训练模型中
2024-04-14 16:30:51
1020
原创 知识增强系列 ERNIE 2.0: A Continual Pre-training Framework for Language Understanding,论文解读
知识增强系列 ERNIE 2.0: A Continual Pre-training Framework for Language Understanding,论文解读
2024-04-07 15:53:04
944
原创 知识增强系列 ERNIE: Enhanced Representation through Knowledge Integration,论文解读
知识增强系列论文解读 ERNIE: Enhanced Representation through Knowledge Integration
2024-01-29 14:46:26
735
原创 标签正则化和硬标签、软标签、单标签、多标签
由任务出发,描述标签正则化 / 标签平滑的定义、实现和试验。顺便补充硬标签、软标签、单标签、多标签的概念
2023-12-21 16:53:45
1416
1
原创 Python使用Pandas判断csv等格式文件中缺失字段
python+pandas读取csv文件构建模型训练样本,但是行或者列中某个字段存在空值、缺失值的情况,影响样本构建
2023-11-29 15:16:11
2185
原创 传统机器学习聚类算法——总集篇
传统机器学习中的聚类算法——总集篇,描述了层次、划分、密度、网格、模型5种聚类算法,并附带了简单描述和相关经典算法。后续会针对不同类型聚类算法撰写博客
2023-10-04 17:12:23
882
原创 pandas dataframe 中 explode()函数用法及效果
python spark 处理数据时,经常使用pandas DataFrame这样的数据格式,这里解析常见的函数explode()
2023-05-18 22:14:16
4470
原创 使用sklearn,报错Library not loaded: @rpath/libgfortran.3.dylib
使用sklearn,报错库未能正确加载,提示Library not loaded: @rpath/libgfortran.3.dylib,解决方案。
2023-05-12 10:16:02
968
原创 Python中 re.findAll()、re.sub()、set()的使用
自然语言处理或数据挖掘不可避免会使用到python、使用到正则表达式对文本数据进行清洗和格式化,这里记录re.findAll()、re.sub()和set()的使用
2023-04-25 20:11:52
2605
原创 LightGBM 的优点(相较于XGBoost) + 细节操作 讲解 (二)单边梯度采样 和 互斥特征捆绑
LightGBM中单边梯度采样(Gradient-based One-Side Sampling,GOSS) 和互斥特征捆绑Exclusive Feature Bundling (EFB),算法具体操作与细节
2023-04-04 14:36:25
1354
原创 LightGBM 的优点(相较于XGBoost) + 细节操作 讲解 (一)
LightGBM相较于XGBoost的优势,以及各优势如何实现,实现的具体表现是什么。主要包含XGB的缺陷,LightGBM的优势,以及LightGBM中基于直方图的决策树最优分割点选取 + Leaf-wise叶子节点生成策略。
2023-04-02 23:46:59
1134
原创 将连续型特征离散化的需要 or 优势
越是离散的特征、越是非线性模型,其建模能力越强,泛化性也就越强。那么连续型特征在离散化后的具体优势在哪里呢
2023-03-28 16:04:58
440
原创 NLP中的Tokenization方法——BPE(Byte-Pair Encoding)
我们知道很多NLP模型(Transformer, Bert)输入的其中一部分是句子的token,然后结合位置编码进入到Mutil-Head Self Attention Layer,后者大家都很熟悉,但如何获得token,却很少有人讲解,这一部分也一度令我疑惑。获得句子的token,操作被称为:tokenization。是NLP任务中最基础、最先需要进行的一步,该操作的目的是将输入文本分割成单独的部分,然后结合词典进一步转化为token。
2023-03-19 23:02:28
6124
5
原创 回归模型中的多重共线性 + 危害 + 原因 + 判断标准 + 解决办法,回归系数
回归模型中的多重共线性 + 危害 + 原因 + 判断标准 + 解决办法,以及相关概念
2023-03-17 11:46:24
27001
6
原创 NLP领域中两种语言模型AR(AutoRegressive Language Modeling)和AE(AutoEncoding Language Modeling)
自然语言领域中语言模型一般划分为两类:AR(AutoRegressive Language Modeling)和AE(AutoEncoding Language Modeling),两类模型的定义、数学表示、代表作以及优缺点
2023-03-03 23:00:44
1655
原创 YOLOV1和Faster-R-CNN的区别
抽空总结一下Yolov1和Faster-r-cnn的区别。首先要知道 Yolov1:anchor-free的one-stage 目标检测算法;Faster:anchor-base的two-stage 目标检测算法。YOLOV1可以去看下我之前的博客Yolov1细节解读1. Yolov1并没有预先设置anchor,而是选择直接预测bounding box,并且仅对每一个特征点(模型最后的特征图是一张7 * 7 * 30)只预测2个候选框;Faster为feature map上的特征点预先设置了9.
2020-12-13 21:48:10
3357
原创 DenseNet 模型细节解读
论文:Densely Connected Convolutional Networks论文链接:https://arxiv.org/pdf/1608.06993.pdf代码的github链接:https://github.com/liuzhuang13/DenseNet文章是CVPR2017的oral。文章提出了一种密集连接机制:即互相连接所有的层,具体来说就是每个层都会接受其前面所有层作为其额外的输入,该结构主要还是和ResNet以及Inception网络的结构做对比。我们知道从2015...
2020-12-07 16:05:43
1642
1
原创 Docker容器单机多GPU训练,apex安装踩坑记录
用了一个下午来安装apex,按照官方的3步流程,总在最后一步报错。安装步骤如下(最好不要幻想用其它方式,因为其它方式大概率不报错但是用不了):$ git clone https://github.com/NVIDIA/apex $ cd apex $ pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./但是总是报下面这个错误,这个错误在github上非常常见,我去g
2020-12-03 20:43:24
1784
1
原创 FCOS目标检测论文各种细节解读
PDF:https://arxiv.org/pdf/1904.01355.pdf1. FCOS(Fully Convolutional One-Stage Object Detection)先要明确的知道,FCOS是一个基于FCN、一阶段(one stage)、anchor free、proposal free、参考语义分割思想 实现的逐像素目标检测的模型。...
2020-11-30 22:20:28
7892
13
原创 实例分割模型 YOLACT 和 YOLACT++
Paper:CVPR 2019YOLACT: Real-time Instance Segmentation,CVPR 2020YOLACT++: Better Real-time Instance Segmentation1. YOLACT先要明确的知道,YOLACT是一个一阶段(one stage)、全卷积(FCN)、实例分割(instance segmentation) 模型。核心关注点在实时性上,该模型在单个Titan Xp上以33 fps在MS COCO上实现了29.8 mAP。...
2020-11-25 15:40:47
7645
2
repository.rar
2020-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人