引言
笔者最近接到一个任务——使用Bert模型提取句子的特征,得到其输出的特征向量。Bert模型在网上已有许多解读,本文聚焦于如何将Bert模型作为一个工具对句子的特征进行提取。
查阅多方资料后,笔者发现谷歌公司已经将Bert模型开源,并且在官网提供了部分已经完成预训练的模型。但是笔者遇到的问题是,Bert官网提供的代码在笔者本地环境中无法正常运行,多次调试环境仍无果。因此,笔者尝试使用Bert-as-server调用预训练的Bert模型进行特征提取。
完成本次任务参考了优快云上许多大佬的文章,这部分文章会在文末给出链接,感谢前辈的无私分享。笔者这篇文章只是想记录一下初学者是怎样使用Bert-as-server,并将自己踩过的坑记录下来。
详细步骤
1、Anaconda创建虚拟环境(Python3.6)
Anaconda创建虚拟环境有多种途径,笔者习惯在Anaconda Navigator,这个图形界面窗口中创建虚拟环境。
如上图所示,弹出窗口后,虚拟环境命名为 tf1_11, Python版本选择3.6, 点击Create即可创建虚拟环境(答主的按键是灰色是因为已经创建对应的虚拟环境)。
注意:如果此时出现报错,或者出现长时间无法创建虚拟环境的情况,那么大概率是网络问题——创建虚拟环境或下载某些python的包都可能出现这个问题,因为此时需要连接国外的服务器。出现这种情况,要么多试几次,要么连接学术机构或高校的公用网络再试,要么尝试使用镜像。
2、安装TensorFlow(版本为1.11.0)
(1)打开命令提示符(cmd),使用以下命令查看自己本地的环境。
conda info