joyce_peng-优快云博客

原创 pip install -r跳过失败的包

pip

2024-10-30 17:19:46 724

原创【分享笔记】符尧：预训练、指令微调、对齐、专业化——论大语言模型能力的来源

分享时间：2023.2。

2024-05-17 17:24:38 1193

原创 transformer文章翻译【Attention is all you need】

（现状）主流的序列转换模型都是基于复杂的循环神经网络或卷积神经网络，且都包含一个encoder和一个decoder。表现最好的模型还通过attention机制把encoder和decoder联接起来。（创新点）我们提出了一个新的、简单的网络架构，Transformer. 它只基于单独的attention机制，完全避免使用循环和卷积。（优势）在两个翻译任务上表明，我们的模型在质量上更好，同时具有更高的并行性，且训练所需要的时间更少。（具体效果）

2023-12-11 10:40:32 374

原创 classification_report加入topk计算

官方文档：https://github.com/scikit-learn/scikit-learn/blob/7f9bad99d6e0a3e8ddf92a7e5561245224dab102/sklearn/metrics/_classification.py#L1551。参考：https://blog.youkuaiyun.com/dipizhong7224/article/details/104579159。

2023-09-07 14:23:01 332

原创 huggingface 自定义模型finetune训练测试--bert多任务

需要将bert改为多任务，但是官方仅支持多分类、二分类，并不支持多任务。改为多任务时我们需要修改输出层、loss、评测等。如果需要在bert结尾添加fc等也可以参考该添加方式。

2023-09-07 14:20:30 1197

原创 [conda报错]simplejson.errors.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

发现并不需要删除或者修改.condarc文件。看起来这个问题是channels的索引json文件出错导致的，我用conda clean -i命令移除了index cache，然后正常了。答案来源：https://github.com/conda/conda/issues/9590。（这里如果还不正常，可以在clean一下看看是否真的成功移除index）当安装新环境和安装新包时，报错。

2023-08-18 16:00:01 2013 4

原创论文图表--pyecharts使用

pyecharts是echarts的python接口，echarts本身是基于javascript的，由于javascript搭建也比较麻烦，这里使用pyecharts来画图。echarts常用来ppt和论文画图。

2023-08-09 11:06:36 373

原创 slurm/sbatch/srun 多步骤串行运行多个依赖性任务

slurm/sbatch/srun 多步骤串行运行多个依赖性任务

2023-07-27 10:49:07 4028

原创 VQA评测evaluation代码：gqa / aokvqa / vqav2 / scienceQA

vqa评测

2023-07-13 15:03:32 2992

原创登录github.com报错

打开github报错

2023-01-19 20:28:51 130

原创 /home/mobaxterm/anaconda3/conda.exe: cannot execute binary file

conda安装报错

2022-12-28 14:47:27 1179

原创【论文精读】Is Synthetic data from generative models ready for image recognition? 生成数据对图像识别的影响

扩散模型生成的数据对图像识别的影响

2022-11-12 22:14:12 1025

原创【论文精读】The Missing Link: Finding label relations across datasets

探索不同数据集间标签关系，missing link

2022-08-15 18:56:19 955

原创【论文精读】Grounded Language-Image Pre-training（GLIP）

glip（Grounded Language-Image Pre-training），可以做visual grounding和目标检测任务

2022-07-24 00:45:43 8928 3

原创【gitlab项目迁移】

gitlab项目迁移

2022-06-27 14:37:33 5508 2

原创【多模态】UNIMO

unimo模型

2022-06-21 13:55:19 760

原创【论文摘要】标签合并Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy

Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy前言：论文链接：https://arxiv.org/pdf/2203.07845.pdfgithub链接：https://github.com/Davidzhangyuanhan/Bamboo商汤2022.3发表，主要内容为如何对开源数据集进行合并论文分为摘要、背景介绍、相关工作、标签系统、Bamboo数据集构建、数据集数据、验证集实验

2022-05-10 14:35:45 1080

原创【论文摘要】ImageNet：A Large-Scale Hierarchical Image Database

imagenet论文解读博客

2022-05-02 21:45:08 11707

原创【论文笔记】对比学习综述

对比学习综述；

2022-04-10 16:00:06 461

原创【论文笔记】Model soups模型汤google

论文地址：https://arxiv.org/pdf/2203.05482.pdf论文相关讲解：https://baijiahao.baidu.com/s?id=1727838067837303006&wfr=spider&for=pc论文贡献：在imagenet上通过该方法对于ViT-G模型，达到sota 90.94%的效果模型汤方法可以用在图像分类和NLP领域，提高下游的out-of-distribution和zero-shot效果Finally, we analytical

2022-03-27 21:33:09 3258

原创 brew报错: Git must be installed and in your PATH

Mac os的brew报错解决

2022-01-23 20:57:07 5339

原创【论文精度】MAE逐段精读

跟李沐学AI的b站视频视频—论文精读笔记第四期包含MAE论文精读第一遍和论文精读第二遍

2022-01-16 17:16:38 2209

原创【论文精读】AlexNet

跟李沐学AI的b站视频视频—论文精读笔记第三期包含alexnet论文精读第一遍和论文精读第二遍蓝色为第一遍，绿色为第二遍

2022-01-02 22:04:00 443

原创【论文精读】resnet精读

跟李沐学AI 论文精读部分笔记

2021-12-27 00:14:15 1768

原创【论文精读】如何读论文

跟着李沐学AI的b站视频—论文精读第一期笔记

2021-12-26 23:49:44 1431

原创 yolov5资料

代码篇：全部代码均有解释： https://blog.youkuaiyun.com/qq_38253797/article/details/119043919代码注释版2: https://blog.youkuaiyun.com/Q1u1NG/article/details/108799609loss解释版：https://blog.youkuaiyun.com/Q1u1NG/article/details/108799609

2021-11-14 23:29:11 434

原创 leetcode-链表

讲解链接参考：https://www.bilibili.com/video/BV1GZ4y1A7Lv?from=search&seid=12788232747642445994例1.1: 反转链表例1.2 反转链表2例2: 求两个链表的交点例3: 链表求环例4: 分隔链表例5: 复制带随机指针的链表例6.1: 合并两个有序链表例6.2: 合并K个有序链表...

2021-08-10 23:32:43 126

原创贪心算法题目整理

讲解参考链接：https://www.bilibili.com/video/BV1VE411f7Pc?from=search&seid=11752306466834271001例题1: 分发饼干例题2: 摇摆序列=踩工资例题3: 移掉k位数字例题4-1: 跳跃游戏例题4-2 跳跃游戏2 (难度接近hard)例5: 射击气球例6: 最优加油方法（poj题目）...

2021-07-31 18:25:55 207

原创 nn.AvgPool2d实现nn.AdaptiveAvgPool2d

import torch# 数据x = torch.randn([1,3,4,4])print(x.shape)# nn.AdaptiveAvgPool2d结果gap = nn.AdaptiveAvgPool2d(1)print(gap(x))# nn.AvgPool2d结果，参考resnest代码gap2 = nn.AvgPool2d(kernel_size=(x.size(2),x.size(3))) #ceil_mode=Fal

2021-07-08 15:50:22 733

原创图片分割mask的onehote

1. pytorch参考：https://www.pythonf.cn/read/93750背景：将多分类分割转为二分类时，crossentropy内置有onehot编码，无需对mask进行onehot处理，但是转为二分类时，loss改为bce loss，需要手动对mask进行onehot编码后再加入loss# 第一种方法：已亲测有效def mask2onehot(mask, num_classes): """ Converts a segmentation mask (H,W) t

2021-03-05 11:32:46 1234

原创 [pillow]透明图片和不透明图片叠加合成--添加透明度

一开始尝试了网上各种方法，效果都不太好，边缘比较毛躁。目前试出来比较好的方法alpha_composite和paste无透明度#reference：https://blog.youkuaiyun.com/weixin_43624538/article/details/104768037import PIL.Image as Imagelayer1 = Image.open("image.jpg").convert('RGBA') # 底图背景layer2 = Image.open("mask.png")

2021-02-26 12:20:01 5757

原创【论文】ResNeSt: Split-Attention Networks

目录作者试图解决什么问题研究方法的关键是什么哪些东西可以为你所用哪些参考文献可以跟进一. 作者试图解决什么问题二. 研究方法的关键是什么split-attention论文贡献点，提出split-attetTT...

2021-01-24 16:58:44 679

原创【论文】SENet和SKNet

目录：SENetSKNet提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、SENet1.原理2.代码二、SKNet1.原理2.代码总结前言SENet和SKNet很像，均为attention相关网络结构一、SENetSENet: Squeeze-and-Excitation Network涉及领域：attention、resnet解决：通过学习不同通道的重要程度来提升有用的特征，抑制无用的特征。论文官方代码 pytorch代码讲解文章1.原理

2021-01-24 16:56:50 1231 1

原创 tricks:图像分类涨点

原文：https://mp.weixin.qq.com/s/mIBhQitG_BbPZlbByc-GqQ涉及比赛：Intel Image Classification：https://www.kaggle.com/puneet6060/intel-image-classificationRecursion Cellular Image Classification：https://www.kaggle.com/c/recursion-cellular-image-classification

2020-12-13 14:55:31 1219

原创 keras绘图loss和准确率等

H = model.fit_generator(xxx) # plot the training loss and accuracyplt.style.use("ggplot")plt.figure()N = EPOCHSplt.plot(np.arange(0, N), H.history["loss"], label="train_loss")plt.plot(np.arange(0, N), H.history["val_loss"], label="val_loss")plt.pl

2020-11-07 21:01:22 1650

原创数据增强--opencv自定义编写

opencv自定义数据增强目录旋转模糊处理增加噪声光照调整使用方法opencv官方api1. 旋转def rotate(xb, yb, angle): # xb, yb为原图及label图片，angle为逆时针旋转角度 M_rotate = cv2.getRotationMatrix2D((img_w/2,img_h/2),angle,1) xb = cv2.warpAffine(xb, M_rotate, (img_w, img_h)) yb = cv2.warpAffine

2020-11-01 21:22:36 416 1

原创 CyclicLR pytorch实现

论文：https://arxiv.org/abs/1506.01186论文中给了keras版本1、如何寻找最大和最小学习率：参考https://github.com/davidtvs/pytorch-lr-finder安装：#python3.5以上pip install torch-lr-finder# for mixed precision trainingpip install torch-lr-finder -v --global-option='apex'# implementat

2020-09-20 21:45:41 1813 2

原创 Tenorflow -- estimator

目录：1、构建Estimator和model_fn2、使用 tf.estimator.TrainSpec 指定训练输入函数及相关参数3、使用 tf.estimator.EvalSpec 指定验证输入函数及相关参数4、使用 tf.estimator.train_and_evaluate 启动训练和验证过程5、使用estimator.export_savedmodel导出模型其中5可选tf.estimator是tensorflow的high level api1、构建Estimator（包含构

2020-08-09 22:20:26 602

原创模型加速--IO加速，tfRecord和keras Sequence

每次在训练模型时，尤其是训练数据较大时，都会大部分时间都会花在数据IO读写上，而不是真正的GPU计算，这也就意味着，GPU实际上很多时候是空闲等待状态！在keras中可以通过sequence实现，在tensorflow中可以通过tfRecord实现。或者将图片以.npy的格式保存在本地，在训练的时候读取也会快很多。如果将大规模数据一次性读进内存会很耗内存，可以使用tensorflow的queue和keras的sequence来存储数据。1、keras的sequence2、tensorflow的tfR

2020-07-26 22:05:15 924

原创 tensorflow serving使用

1、添加源从官网下载，或者手动安装!echo "deb http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | tee /etc/apt/sources.list.d/tensorflow-serving.list && \curl https://storage.googleapis.com/tens

2020-07-19 15:40:41 571

空空如也

java如何添加用户登陆头像