使用bert-as-server获取句子embedding

本文介绍了如何利用bert-as-service快速部署BERT模型,仅作为获取句子embedding的微服务。在NLP任务中,通过该服务可以得到句子的向量表示,适用于分类任务和NER任务。文中详细阐述了安装、启动服务、客户端调用以及docker部署(包括GPU和CPU版)的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求场景

由于最近一直在处理nlp任务,为了提高模型的泛化性,经常使用bert预训练模型在下游任务微调,但是在实际测试中发现,由于训练数据量不大,bert层参数的固定与否对最终结果的精度影响并不大.
为了方便,想着将bert只用作固定的embedding,后续的所有Nlp任务都可基于embedding建模,后面可接全连接接层,cnn,blstm,crf等.
最方便的方法就是将Bert作为一个微服务部署在服务器,该服务返回句子embedding后的结果,具体可以为bert最后一层向量,包括cls、及每个字符对应的embedding向量。分类任务就可以使用cls向量或者每个字符向量的平均/加和作为句向量,后面接个softmax层。ner的话就取每个字符向量后面可接crf或者blstm+crf。
本来的想法是使用tf servering部署,后来调研了一下,发现有现成做好的bert-as-service(膜拜大佬),git链接,就偷懒直接拿来用了。
具体怎么部署git上写的都十分详细。

bert-as-service使用简介

安装
pip install bert-serving-server  # server
pip install bert-serving-client  # client, independent of `bert-serving-server`
启动服务

启动之前你得先下个bert预训练模型,中文的bert预训练可以在这边下载,中文bert预训练模型

bert-serving-start -model_dir {bert_model_path} -num_worke
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值