be_humble-优快云博客

原创 GPU机器-显卡占用

不论在读研、实习还是正式的算法同学，经常会想跑训练&推理任务找不到卡，即使有卡还需要重新装环境，比较麻烦，所以许多经常使用公司内部云平台GPU开发机时候，会在跑完任务时候，跑一些无用的任务占用GPU，防止机器被kill下面提供一个通用的gpus占用任务，方便大家占卡，但如果很久不用还是最好释放资源给别的同学实验哈。

2025-10-31 11:05:23 743

公司里面因为a100 等gpu往往为了资源灵活分配，使用数据挂载、docker镜像自动部署，模型训练所需命令执行。通常我们可以直接部署一个常用的docker 镜像环境，进行快速创建训练&推理机器，但随着我们使用框架不同，部分库更新版本问题灵活变动，经常需要手动调整，重新配置。因此这里编写shell命令，在数据挂载中，提前dump好比较大的pip和工具，如anaconda3、torch、cuda工具库等。

2025-10-30 16:56:13 276

原创排序-评价指标

整体来说，召回之后，我们得到若干个doc 内容（可能包括title，abs，前置label，pv,uv,时效性，权威性等特征），需要与query侧特征+用户侧特征进行交互，得到满足query+用户需求的多个doc的打分，进行排序展示给用户。最近要跳到排序的组，之前都是做QP相关的，基本就是query分类（行业、意图），NER实体抽取，query改写，纠错，连qd相关性的模型都很少做，感觉突然跨到搜索链路后端也有点慌。注意：视频本身时长分布极不均匀，必须分 bucket 看（0–30s，30–300s…

2025-10-30 15:02:05 562

原创我的来时路

感觉生活也是很舒适滴，但随着组织架构变动，每个月逐渐同事跳槽、离职，干的活因为上下游同事离职停滞，到老板离职，无人关心，到合并到别的组成为边缘透明人物，再到每天在公司坐在发呆，一个人吃饭、健身，熬到下班，不知道日子什么时候是个头。所以也没有很长远的职业规划，算法上也没有任何影响力，仅仅基础基本了解，使用尽量快速上手，架构逻辑代码尽量让GPT5帮我改改，模型训练也没有很好优化思路，可能各个公司互相参考框架模块之间的交互逻辑，互相模仿，持续迭代迭代数据，尽量让项目能LR。

2025-10-29 11:19:41 238

原创百度实习生内推

大模型，百度，内推

2024-11-04 11:21:52 981

原创 2025 百度提前批校招内推

百度，内推，提前批，2025

2024-07-08 13:18:39 1585 3

原创 symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not defined in file libcublasLt.so.11

cuda debug

2024-03-04 21:25:21 624 2

原创计算机是什么做的

硅半导体 cpu

2024-01-30 23:04:42 565

原创使用 Pegasus-t5 预训练模型遇到问题解决

中文摘要预训练模型

2024-01-29 15:10:38 1035

原创 ValueError Your setup doesn‘t support bf16gpu. You need torch=1.10, using Ampere GPU with cuda=11.0

debug 深度学习训练，bf16

2023-11-08 17:05:35 5178 3

原创 huggingface 的trainer训练框架优势

训练框架，trainer，huggingface , transformers

2023-11-07 17:19:50 1118

原创评估大型语言模型：综述

大模型评估，综述，论文笔记

2023-11-06 15:52:25 834

原创解决mac系统终端无法使用vpn

vpn mac终端

2023-10-11 11:17:18 9046

原创 FlashAttention

flashattention llm加速

2023-08-11 10:29:10 477

原创 TypeError Object of type int64 is not JSON serializable

debug python json numpy

2023-05-19 11:02:47 886

原创大模型Founation Model

大模型 LLM Foundation Model NLP

2023-05-16 11:38:21 861

原创教练，我想写论文

论文 NLP 人工智能如何写论文

2023-05-06 10:45:34 506

原创工业界NER

NER 搜索领域美团

2023-05-04 16:59:50 601

原创 LLM 大规模语言模型综述

LLM 大模型综述 survey

2023-04-18 18:12:12 2506

原创 T5模型及其后续优化

t5 transformer text-to-text 预训练模型

2023-04-11 15:04:33 2258

原创论文笔记 CoT：提示+推理+大模型=思维链提示

Google Brain CoT 思维链提示，为后面Instruction Finetune 打下基础的论文

2023-04-10 15:42:05 3206 1

原创 LLaMA Open and Efficient Foundation Language Models

LLaMA 大规模语言模型论文笔记

2023-04-10 12:17:31 471

原创解决libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit

解决安装pyroch1.13的报错

2023-02-15 10:32:46 8942 6

原创 Boundary Smoothing for NER

ACL2022 NER 实体抽取中文NER 置信度

2022-12-15 11:07:34 661

原创一种用于半监督文本分类的渐进类语义匹配方法

NAACL 2022 半监督文本分类，少样本

2022-11-04 11:36:28 526 1

原创 MGIMN：用于Few-shot文本分类的多粒度交互式匹配网络

NAACL 2022. Few-shot 文本分类少样本文本匹配阿里达摩院

2022-11-02 15:37:54 403

原创 EPiDA：用于高性能文本分类的简单插件数据增强框架

NAACL 2022 ,DA 数据增强,文本分类

2022-10-13 15:52:33 564 1

原创优化器 optimizer

优化器 optimizer 学习率 scheduler

2022-09-02 15:07:50 2059

原创 Pytorch-lightning

Pytorch-Lightning AI工具库

2022-09-01 10:32:21 1427 2

原创句向量 Sentence Embedding

句向量 Sentence embedding 对比学习 SimCSE SCD Bert-flow Bert-whitening

2022-07-11 12:48:17 2879 2

原创去相关与白化

去相关白化 PCA

2022-07-11 10:40:39 1412

原创 SCD Self-Contrastive Decorrelation for Sentence Embeddings

ACL2022 句向量句嵌入向量 sentence embedding 对比学习自监督 NLP

2022-07-11 00:10:58 443

原创 A Closer Look at How Fine-tuning Changes BERT

ACL 2022 bert的fine-tune机制对向量表示的影响分析

2022-07-05 17:38:58 707

原创 ParaBLEU:Generative Pretraining for Paraphrase Evaluation

ACL2022 生成任务评测 ParaBLEU

2022-05-29 11:56:41 188

原创 GLM General Language Model Pretraining with Autoregressive Blank Infilling

ACL2022 统一预训练模型

2022-05-29 11:52:49 2105 1

原创 ACL 2022 泛读文章（一）

ACL 2022 论文笔记论文泛读

2022-05-26 16:57:22 492

原创 CLIP的后续工作

CLIP的后续工作clip作为Open-AI给咱做的一个玩具，自从21年2月到22年5月看了一下差不多有一千篇有关的工作和论文，下面介绍一下一些比较有趣的工作，在github上star比较多的工作。StyleCLIP论文链接：https://arxiv.org/pdf/2103.17249.pdf项目链接：https://github.com/orpatashnik/StyleCLIP结合StyleGAN和CLIP的工作，提出了三种结合方法：以文本为指导的 latent 优化，其中

2022-05-18 16:29:06 2249 4

原创 GLIDE 学习笔记

GLIDE模型完成，文字条件生成图片，图片修复任务。

2022-05-17 15:42:35 6047

原创 SimCTG：缓解GPT2在生成任务上token的各向异性

2022 腾讯AI lab的文章，使用SimCTG对比损失loss和decode解码方式，来缓解生成模型的各向异性问题，解决重复生成问题，有代码示例。

2022-05-15 23:07:41 1263

空空如也

空空如也