使用OpenVINO优化和部署AI推理

最新推荐文章于 2025-06-18 17:36:41 发布

eahba

最新推荐文章于 2025-06-18 17:36:41 发布

阅读量187

点赞数 3

CC 4.0 BY-SA版权

文章标签：人工智能 openvino python

本文链接：https://blog.youkuaiyun.com/eahba/article/details/146450359

OpenVINO™是一款开源工具包，旨在优化和部署AI推理。它支持多种硬件设备，包括x86和ARM CPU，以及Intel GPU。OpenVINO可以显著提高计算机视觉、自动语音识别、自然语言处理等常见任务的深度学习性能。在这篇文章中，我们将通过实际代码示例来展示如何使用OpenVINO Embeddings类支持Hugging Face嵌入模型，并介绍如何在Intel GPU上进行推理。

核心原理解析

OpenVINO的核心原理在于其高效的模型优化和硬件加速能力，它能够将深度学习模型转换为更适合目标硬件执行的格式，从而提升推理速度。通过OpenVINO Embeddings类，我们可以将Hugging Face的嵌入模型直接部署到支持的设备上，如Intel GPU。

代码实现演示

下面我们将展示如何使用OpenVINO来嵌入文本数据，并加速推理过程。

# 安装必要的库
%pip install --upgrade-strategy eager "optimum[openvino,nncf]" --quiet

from langchain_community.embeddings import OpenVINOEmbeddings

# 模型配置
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "CPU"}  # 指定使用CPU
encode_kwargs = {"mean_pooling": True, "normalize_embeddings": True}

# 创建OpenVINO Embeddings实例
ov_embeddings = OpenVINOEmbeddings(
    model_name_or_path=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)

# 嵌入查询文本
text = "This is a test document."
query_result = ov_embeddings.embed_query(text)
print(query_result[:3])  # 输出前3个嵌入特征

# 嵌入文档
doc_result = ov_embeddings.embed_documents([text])

导出IR模型

我们可以使用OVModelForFeatureExtraction将嵌入模型导出为OpenVINO IR格式，并从本地文件夹加载模型。

from pathlib import Path

# 指定模型目录
ov_model_dir = "all-mpnet-base-v2-ov"

# 保存模型到指定目录
if not Path(ov_model_dir).exists():
    ov_embeddings.save_model(ov_model_dir)

# 从本地加载模型
ov_embeddings = OpenVINOEmbeddings(
    model_name_or_path=ov_model_dir,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)