自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 GPU机器-显卡占用

不论在读研、实习还是正式的算法同学,经常会想跑训练&推理任务找不到卡,即使有卡还需要重新装环境,比较麻烦,所以许多经常使用公司内部云平台GPU开发机时候,会在跑完任务时候,跑一些无用的任务占用GPU,防止机器被kill下面提供一个通用的gpus占用任务,方便大家占卡,但如果很久不用还是最好释放资源给别的同学实验哈。

2025-10-31 11:05:23 716

原创 conda 环境配置

公司里面因为a100 等gpu往往为了资源灵活分配,使用数据挂载、docker镜像自动部署,模型训练所需命令执行。通常我们可以直接部署一个常用的docker 镜像环境,进行快速创建训练&推理机器,但随着我们使用框架不同,部分库更新版本问题灵活变动,经常需要手动调整,重新配置。因此这里编写shell命令,在数据挂载中,提前dump好比较大的pip和工具,如anaconda3、torch、cuda工具库等。

2025-10-30 16:56:13 204

原创 排序-评价指标

整体来说,召回之后,我们得到若干个doc 内容(可能包括title,abs,前置label,pv,uv,时效性,权威性等特征),需要与query侧特征+用户侧特征进行交互,得到满足query+用户需求的 多个doc的打分,进行排序展示给用户。最近要跳到排序的组,之前都是做QP相关的,基本就是query分类(行业、意图),NER实体抽取,query改写,纠错,连qd相关性的模型都很少做,感觉突然跨到搜索链路后端也有点慌。注意:视频本身时长分布极不均匀,必须分 bucket 看(0–30s,30–300s…

2025-10-30 15:02:05 548

原创 我的来时路

感觉生活也是很舒适滴,但随着组织架构变动,每个月逐渐同事跳槽、离职,干的活因为上下游同事离职停滞,到老板离职,无人关心,到合并到别的组成为边缘透明人物,再到每天在公司坐在发呆,一个人吃饭、健身,熬到下班,不知道日子什么时候是个头。所以也没有很长远的职业规划,算法上也没有任何影响力,仅仅基础基本了解,使用尽量快速上手,架构逻辑代码尽量让GPT5帮我改改,模型训练也没有很好优化思路,可能各个公司互相参考框架模块之间的交互逻辑,互相模仿,持续迭代迭代数据,尽量让项目能LR。

2025-10-29 11:19:41 222

原创 百度实习生内推

大模型,百度,内推

2024-11-04 11:21:52 962

原创 2025 百度提前批校招内推

百度,内推,提前批 ,2025

2024-07-08 13:18:39 1560 3

原创 symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not defined in file libcublasLt.so.11

cuda debug

2024-03-04 21:25:21 608 2

原创 计算机是什么做的

硅 半导体 cpu

2024-01-30 23:04:42 554

原创 使用 Pegasus-t5 预训练模型遇到问题解决

中文摘要 预训练模型

2024-01-29 15:10:38 1012

原创 ValueError Your setup doesn‘t support bf16gpu. You need torch=1.10, using Ampere GPU with cuda=11.0

debug 深度学习训练,bf16

2023-11-08 17:05:35 4991 3

原创 huggingface 的trainer训练框架优势

训练框架,trainer,huggingface , transformers

2023-11-07 17:19:50 1084

原创 评估大型语言模型:综述

大模型评估,综述,论文笔记

2023-11-06 15:52:25 820

原创 解决mac系统终端无法使用vpn

vpn mac终端

2023-10-11 11:17:18 8794

原创 FlashAttention

flashattention llm加速

2023-08-11 10:29:10 474

原创 TypeError Object of type int64 is not JSON serializable

debug python json numpy

2023-05-19 11:02:47 876

原创 大模型Founation Model

大模型 LLM Foundation Model NLP

2023-05-16 11:38:21 845

原创 教练,我想写论文

论文 NLP 人工智能 如何写论文

2023-05-06 10:45:34 498

原创 工业界NER

NER 搜索领域 美团

2023-05-04 16:59:50 593

原创 LLM 大规模语言模型综述

LLM 大模型 综述 survey

2023-04-18 18:12:12 2472

原创 T5模型及其后续优化

t5 transformer text-to-text 预训练模型

2023-04-11 15:04:33 2217

原创 论文笔记 CoT:提示+推理+大模型=思维链提示

Google Brain CoT 思维链提示,为后面Instruction Finetune 打下基础的论文

2023-04-10 15:42:05 3155 1

原创 LLaMA Open and Efficient Foundation Language Models

LLaMA 大规模语言模型 论文笔记

2023-04-10 12:17:31 461

原创 解决libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit

解决安装pyroch1.13的报错

2023-02-15 10:32:46 8891 6

原创 Boundary Smoothing for NER

ACL2022 NER 实体抽取 中文NER 置信度

2022-12-15 11:07:34 654

原创 一种用于半监督文本分类的渐进类语义匹配方法

NAACL 2022 半监督文本分类,少样本

2022-11-04 11:36:28 508 1

原创 MGIMN:用于Few-shot文本分类的多粒度交互式匹配网络

NAACL 2022. Few-shot 文本分类 少样本 文本匹配 阿里达摩院

2022-11-02 15:37:54 391

原创 EPiDA:用于高性能文本分类的简单插件数据增强框架

NAACL 2022 ,DA 数据增强,文本分类

2022-10-13 15:52:33 550 1

原创 优化器 optimizer

优化器 optimizer 学习率 scheduler

2022-09-02 15:07:50 2053

原创 Pytorch-lightning

Pytorch-Lightning AI工具库

2022-09-01 10:32:21 1402 2

原创 句向量 Sentence Embedding

句向量 Sentence embedding 对比学习 SimCSE SCD Bert-flow Bert-whitening

2022-07-11 12:48:17 2852 2

原创 去相关与白化

去相关 白化 PCA

2022-07-11 10:40:39 1389

原创 SCD Self-Contrastive Decorrelation for Sentence Embeddings

ACL2022 句向量 句嵌入向量 sentence embedding 对比学习 自监督 NLP

2022-07-11 00:10:58 435

原创 A Closer Look at How Fine-tuning Changes BERT

ACL 2022 bert的fine-tune机制对向量表示的影响分析

2022-07-05 17:38:58 693

原创 ParaBLEU:Generative Pretraining for Paraphrase Evaluation

ACL2022 生成任务评测 ParaBLEU

2022-05-29 11:56:41 182

原创 GLM General Language Model Pretraining with Autoregressive Blank Infilling

ACL2022 统一预训练模型

2022-05-29 11:52:49 2087 1

原创 ACL 2022 泛读文章 (一)

ACL 2022 论文笔记 论文泛读

2022-05-26 16:57:22 480

原创 CLIP的后续工作

CLIP的后续工作clip作为Open-AI给咱做的一个玩具,自从21年2月到22年5月看了一下差不多有一千篇有关的工作和论文,下面介绍一下一些比较有趣的工作,在github上star比较多的工作。StyleCLIP论文链接:https://arxiv.org/pdf/2103.17249.pdf项目链接:https://github.com/orpatashnik/StyleCLIP结合StyleGAN和CLIP的工作,提出了三种结合方法:以文本为指导的 latent 优化,其中

2022-05-18 16:29:06 2218 4

原创 GLIDE 学习笔记

GLIDE模型完成,文字条件生成图片,图片修复任务。

2022-05-17 15:42:35 6019

原创 SimCTG:缓解GPT2在生成任务上token的各向异性

2022 腾讯AI lab的文章,使用SimCTG对比损失loss和decode解码方式,来缓解生成模型的各向异性问题,解决重复生成问题,有代码示例。

2022-05-15 23:07:41 1256

原创 CLIP学习笔记

CLIP 学习笔记论文:Learning Transferable Visual Models From Natural Language SupervisionopenAI在2021年2月发表对NLP和CV圈都很重要的一篇工作主要是通过4亿个文本图片对,进行对比学习预训练,得到词和图片的embedding转换器,在图片分类zero-shot上达到很好效果,后续也可以接很多工作。clip的github地址 openai/CLIP: Contrastive Language-Image Pretrai

2022-05-13 15:38:45 2229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除