- 博客(59)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 transformer文章翻译【Attention is all you need】
(现状)主流的序列转换模型都是基于复杂的循环神经网络或卷积神经网络,且都包含一个encoder和一个decoder。表现最好的模型还通过attention机制把encoder和decoder联接起来。(创新点)我们提出了一个新的、简单的网络架构,Transformer. 它只基于单独的attention机制,完全避免使用循环和卷积。(优势)在两个翻译任务上表明,我们的模型在质量上更好,同时具有更高的并行性,且训练所需要的时间更少。(具体效果)
2023-12-11 10:40:32
294
原创 classification_report加入topk计算
官方文档:https://github.com/scikit-learn/scikit-learn/blob/7f9bad99d6e0a3e8ddf92a7e5561245224dab102/sklearn/metrics/_classification.py#L1551。参考:https://blog.youkuaiyun.com/dipizhong7224/article/details/104579159。
2023-09-07 14:23:01
299
原创 huggingface 自定义模型finetune训练测试--bert多任务
需要将bert改为多任务,但是官方仅支持多分类、二分类,并不支持多任务。改为多任务时我们需要修改输出层、loss、评测等。如果需要在bert结尾添加fc等也可以参考该添加方式。
2023-09-07 14:20:30
1062
原创 [conda报错]simplejson.errors.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
发现并不需要删除或者修改.condarc文件。看起来这个问题是channels的索引json文件出错导致的,我用conda clean -i命令移除了index cache,然后正常了。答案来源:https://github.com/conda/conda/issues/9590。(这里如果还不正常,可以在clean一下看看是否真的成功移除index)当安装新环境和安装新包时,报错。
2023-08-18 16:00:01
1800
3
原创 论文图表--pyecharts使用
pyecharts是echarts的python接口,echarts本身是基于javascript的,由于javascript搭建也比较麻烦,这里使用pyecharts来画图。echarts常用来ppt和论文画图。
2023-08-09 11:06:36
306
原创 /home/mobaxterm/anaconda3/conda.exe: cannot execute binary file
conda安装报错
2022-12-28 14:47:27
1057
原创 【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响
扩散模型生成的数据对图像识别的影响
2022-11-12 22:14:12
944
原创 【论文精读】The Missing Link: Finding label relations across datasets
探索不同数据集间标签关系,missing link
2022-08-15 18:56:19
897
原创 【论文精读】Grounded Language-Image Pre-training(GLIP)
glip(Grounded Language-Image Pre-training),可以做visual grounding和目标检测任务
2022-07-24 00:45:43
7959
3
原创 【论文摘要】标签合并Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy
Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy前言:论文链接:https://arxiv.org/pdf/2203.07845.pdfgithub链接:https://github.com/Davidzhangyuanhan/Bamboo商汤2022.3发表,主要内容为如何对开源数据集进行合并论文分为摘要、背景介绍、相关工作、标签系统、Bamboo数据集构建、数据集数据、验证集实验
2022-05-10 14:35:45
950
原创 【论文摘要】ImageNet:A Large-Scale Hierarchical Image Database
imagenet论文解读博客
2022-05-02 21:45:08
10520
原创 【论文笔记】Model soups模型汤google
论文地址:https://arxiv.org/pdf/2203.05482.pdf论文相关讲解:https://baijiahao.baidu.com/s?id=1727838067837303006&wfr=spider&for=pc论文贡献:在imagenet上通过该方法对于ViT-G模型,达到sota 90.94%的效果模型汤方法可以用在图像分类和NLP领域,提高下游的out-of-distribution和zero-shot效果Finally, we analytical
2022-03-27 21:33:09
2841
原创 【论文精读】AlexNet
跟李沐学AI的b站视频视频—论文精读笔记第三期包含alexnet论文精读第一遍和论文精读第二遍蓝色为第一遍,绿色为第二遍
2022-01-02 22:04:00
399
原创 yolov5资料
代码篇:全部代码均有解释: https://blog.youkuaiyun.com/qq_38253797/article/details/119043919代码注释版2: https://blog.youkuaiyun.com/Q1u1NG/article/details/108799609loss解释版:https://blog.youkuaiyun.com/Q1u1NG/article/details/108799609
2021-11-14 23:29:11
400
原创 leetcode-链表
讲解链接参考:https://www.bilibili.com/video/BV1GZ4y1A7Lv?from=search&seid=12788232747642445994例1.1: 反转链表例1.2 反转链表2例2: 求两个链表的交点例3: 链表求环例4: 分隔链表例5: 复制带随机指针的链表例6.1: 合并两个有序链表例6.2: 合并K个有序链表...
2021-08-10 23:32:43
112
原创 贪心算法题目整理
讲解参考链接:https://www.bilibili.com/video/BV1VE411f7Pc?from=search&seid=11752306466834271001例题1: 分发饼干例题2: 摇摆序列=踩工资例题3: 移掉k位数字例题4-1: 跳跃游戏例题4-2 跳跃游戏2 (难度接近hard)例5: 射击气球例6: 最优加油方法(poj题目)...
2021-07-31 18:25:55
183
原创 nn.AvgPool2d实现nn.AdaptiveAvgPool2d
import torch# 数据x = torch.randn([1,3,4,4])print(x.shape)# nn.AdaptiveAvgPool2d结果gap = nn.AdaptiveAvgPool2d(1)print(gap(x))# nn.AvgPool2d结果,参考resnest代码gap2 = nn.AvgPool2d(kernel_size=(x.size(2),x.size(3))) #ceil_mode=Fal
2021-07-08 15:50:22
677
原创 图片分割mask的onehote
1. pytorch参考:https://www.pythonf.cn/read/93750背景:将多分类分割转为二分类时,crossentropy内置有onehot编码,无需对mask进行onehot处理,但是转为二分类时,loss改为bce loss,需要手动对mask进行onehot编码后再加入loss# 第一种方法:已亲测有效def mask2onehot(mask, num_classes): """ Converts a segmentation mask (H,W) t
2021-03-05 11:32:46
1158
原创 [pillow]透明图片和不透明图片叠加合成--添加透明度
一开始尝试了网上各种方法,效果都不太好,边缘比较毛躁。目前试出来比较好的方法alpha_composite和paste无透明度#reference:https://blog.youkuaiyun.com/weixin_43624538/article/details/104768037import PIL.Image as Imagelayer1 = Image.open("image.jpg").convert('RGBA') # 底图背景layer2 = Image.open("mask.png")
2021-02-26 12:20:01
5350
原创 【论文】ResNeSt: Split-Attention Networks
目录作者试图解决什么问题研究方法的关键是什么哪些东西可以为你所用哪些参考文献可以跟进一. 作者试图解决什么问题二. 研究方法的关键是什么split-attention论文贡献点,提出split-attetTT...
2021-01-24 16:58:44
583
原创 【论文】SENet和SKNet
目录:SENetSKNet提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、SENet1.原理2.代码二、SKNet1.原理2.代码总结前言SENet和SKNet很像,均为attention相关网络结构一、SENetSENet: Squeeze-and-Excitation Network涉及领域:attention、resnet解决:通过学习不同通道的重要程度来提升有用的特征,抑制无用的特征。论文 官方代码 pytorch代码 讲解文章1.原理
2021-01-24 16:56:50
1158
1
原创 tricks:图像分类涨点
原文:https://mp.weixin.qq.com/s/mIBhQitG_BbPZlbByc-GqQ涉及比赛:Intel Image Classification:https://www.kaggle.com/puneet6060/intel-image-classificationRecursion Cellular Image Classification:https://www.kaggle.com/c/recursion-cellular-image-classification
2020-12-13 14:55:31
1150
原创 keras绘图loss和准确率等
H = model.fit_generator(xxx) # plot the training loss and accuracyplt.style.use("ggplot")plt.figure()N = EPOCHSplt.plot(np.arange(0, N), H.history["loss"], label="train_loss")plt.plot(np.arange(0, N), H.history["val_loss"], label="val_loss")plt.pl
2020-11-07 21:01:22
1611
原创 数据增强--opencv自定义编写
opencv自定义数据增强目录旋转模糊处理增加噪声光照调整使用方法opencv官方api1. 旋转def rotate(xb, yb, angle): # xb, yb为原图及label图片,angle为逆时针旋转角度 M_rotate = cv2.getRotationMatrix2D((img_w/2,img_h/2),angle,1) xb = cv2.warpAffine(xb, M_rotate, (img_w, img_h)) yb = cv2.warpAffine
2020-11-01 21:22:36
379
1
原创 CyclicLR pytorch实现
论文:https://arxiv.org/abs/1506.01186论文中给了keras版本1、如何寻找最大和最小学习率:参考https://github.com/davidtvs/pytorch-lr-finder安装:#python3.5以上pip install torch-lr-finder# for mixed precision trainingpip install torch-lr-finder -v --global-option='apex'# implementat
2020-09-20 21:45:41
1730
2
原创 Tenorflow -- estimator
目录:1、构建Estimator和model_fn2、使用 tf.estimator.TrainSpec 指定训练输入函数及相关参数3、使用 tf.estimator.EvalSpec 指定验证输入函数及相关参数4、使用 tf.estimator.train_and_evaluate 启动训练和验证过程5、使用estimator.export_savedmodel导出模型其中5可选tf.estimator是tensorflow的high level api1、构建Estimator(包含构
2020-08-09 22:20:26
540
原创 模型加速--IO加速,tfRecord和keras Sequence
每次在训练模型时,尤其是训练数据较大时,都会大部分时间都会花在数据IO读写上,而不是真正的GPU计算,这也就意味着,GPU实际上很多时候是空闲等待状态!在keras中可以通过sequence实现,在tensorflow中可以通过tfRecord实现。或者将图片以.npy的格式保存在本地,在训练的时候读取也会快很多。如果将大规模数据一次性读进内存会很耗内存,可以使用tensorflow的queue和keras的sequence来存储数据。1、keras的sequence2、tensorflow的tfR
2020-07-26 22:05:15
884
原创 tensorflow serving使用
1、添加源从官网下载,或者手动安装!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | tee /etc/apt/sources.list.d/tensorflow-serving.list && \curl https://storage.googleapis.com/tens
2020-07-19 15:40:41
540
空空如也
java如何添加用户登陆头像
2015-08-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人