问题
有时候项目需要在内网部署,这样 sentence_transformers 就不能自己去下载对应名称的模型了
思路
模型提前下载好放在本地,加载模型的时候直接指定本地模型缓存路径
解决办法
- 比如我需要加载 allenai-specter 模型,那么我就在有外网的地方执行一遍此代码,sentence_transformers 会自动下载 allenai-specter 模型到指定的缓存目录【D:\hugface-model\allenai-specter】
from sentence_transformers import SentenceTransformer
# 加载模型
model = SentenceTransformer(
'all-mpnet-base-v2', # 要使用的预训练模型
cache_folder=r"D:\hugface-model\allenai-specter" # 指定该模型在本地的缓存路径
)
# 编码
corpus_embeddings = model.encode("爱你孤身走暗巷,爱你不贵的模样,爱你...", convert_to_tensor=True)
print(corpus_embeddings) # tensor([-7.2519e-01, 6.5501e-01, -4.8153e-02, 5.7884e-01, 4.9799e-01 .....
- 然后到上面的缓存目录【D:\hugface-model\allenai-specter】

将模型复制一份放到线上内网环境上,比如放到了线上的 /model/allenai-specter 目录下,那么线上加载模型的方法就改成这样即可
model = SentenceTransformer(
'allenai-specter',
cache_folder=r"/model/allenai-specter"
)
本文档介绍了如何在内网环境中使用Sentence Transformers。为了解决无法在线下载模型的问题,建议预先在外网下载所需模型如allenai-specter,并指定本地缓存路径。通过示例代码展示加载和编码过程,最后将模型复制到内网环境以实现离线使用。这种方法确保了在无互联网连接的情况下仍能正常运行模型。
939





