- 博客(8)
- 收藏
- 关注
原创 数据描述性统计之集中趋势和离散趋势
对于成功的数据预处理而言,把握数据的全貌是至关重要的,基本统计描述可以用来识别数据的性质,凸显哪些数据值应该视为噪声或者是离群点。这一节我们将要讨论三类数据的基本统计描述,包括数据的中心趋势的度量,数据的离散趋势度量以及基本的统计作图。数据的描述性统计旨在对数据集进行总结和描述,以便更好地理解数据的特征和分布。其中包括集中趋势(central tendency)和离散趋势(dispersion)这两个重要概念。
2023-12-03 21:41:24
4733
1
原创 爬取新浪新闻牛刀小试
爬虫流程获得请求地址python发送请求request服务器返回响应response#导入第三方发送请求的库,并用get方法发送请求#爬虫地址res = requests.get(url=url) #发送get请求res.encoding = res.apparent_encoding #编码方式按照自动识别的编码方式编码,或者直接设置成“utf8”#解析网页的第三方库:pip install beautifulsoup4#解析返回数据的文本#爬虫数据保存到本地#爬取文章标题。
2023-11-27 23:03:06
1129
1
原创 Anaconda、pycharm环境配置教程
许多新手在学习数据分析,机器学习,深度学习之前都需要将所需的环境搭建起来。由于python的友好生态圈,功能强大还简单易上手的优点,所以我们在学习之前面临的第一个问题就是搭建python环境。本文从0开始设置一个搭建Anaconda3和pycharm的python环境,其中的jupyter notebook更是可以实现交互式编程和调代码的优势条件。Anaconda是一个流行的开源发行版,主要用于数据科学、机器学习和科学计算。
2023-11-26 16:15:14
2138
1
原创 排序的一些算法
排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。我们这里说说八大排序就是内部排序。当n较大,则应采用时间复杂度为Onlog2n的排序方法:快速排序、堆排序或归并排序序。快速排序:是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
2023-11-25 23:48:18
829
原创 Group-wise Transformation 方法介绍
Transformer 在2017年自然语言领域一举得名大获全胜,以至于Transformer在处理序列数据方面已经独居首位。目前流行的ChatGPT背后的模型主干就是Transformer模型,但由于其庞大的数据训练学习已经庞大的参数量,使得训练成本大大增加,单单训练一轮的资金就高达十亿美金。随着Transformer在自然语言处理方面的成功应用,这种方法也被应用到了计算机视觉领域成为 Vision Transformer。
2023-11-24 23:55:44
1166
1
原创 Target-aware Transformer 知识蒸馏代码复现
Target-aware Transformer (TaT) 是一种改进的 Transformer 模型,专注于目标感知的序列到序列(sequence-to-sequence)建模。通过 TaT 算法对卷积神经网络的中间层进行知识蒸馏取得了目前加算计视觉领域知识蒸馏的 SOTA,这一只是蒸馏方法首先是在2022 CVPR 上的一篇题为《Knowledge Distillation via the Target-aware Transformer》的论文中提出的,本文主要讲解一些这篇论文的复现流程。数学符号。
2023-11-23 22:16:25
1869
原创 [CVPR2022] 《Knowledge Distillation via the Target-aware Transformer》论文详解
符号假设TTT和SSS分别表示教师网络和学生网络,都为卷积神经网络FT∈RH×W×CFT∈RH×W×C: 教师特征图FS∈RH×W×C′FS∈RH×W×C′: 学生特征图其中,HHHWWW表示特征图的高和宽,CCC表示通道数。Γ⋅Γ⋅: 将特征张量从3维转换成2维的函数fitfisfitfis: 分别表示教师网络和学生网络在同一空间位置的第iii个特征图。
2023-11-22 21:28:47
1487
2
原创 ImageNet数据集训练深度神经网络
最近在使用AutoDL算力云复现几个深度学习中知识蒸馏的代码,训练一个图像分类的模型时,用到了李飞飞教授的ImageNet1K数据集,所以想把这个数据集的介绍以及使用给刚入门深度学习图像分类的新手小白们分享一下,内容很简单,也算是做一个简单的笔记。ImageNet是一个大规模的图像数据库,由斯坦福大学的李飞飞教授团队创建。数据集包含超过1400万张带有标注的图像,涵盖超过2万个类别。这个数据集在计算机视觉领域中被广泛使用,特别是在图像分类、目标检测和语义分割等任务中。
2023-11-21 10:02:51
6656
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人