OpenVINO™ 2025.2新版本:英特尔® XMX 图形处理器优化提升GPU性能,KV缓存压缩节省CPU使用

Hi all,

我们的记录显示,您之前从英特尔下载了 OpenVINO™ AI 推理软件。我们很高兴的分享给您,OpenVINO™工具套件的新版本现已可用,您可以进行升级。

在此版本中,您将看到通过 OpenVINOLLM 持续提升 LLM 的性能,以支持生成式 AI 负载。

主要亮点

更多生成式人工智能(Gen AI)的支持和框架集成,最大程度地减少代码更改

  • 在 CPU 及 GPU 上支持的新模型:Phi-4, Mistral-7B-Instruct-v0.3, SD-XL Inpainting
    0.1, Stable Diffusion 3.5 Large Turbo, Phi-4-reasoning, Qwen3 and Qwen2.5-VL-3B-Instruct。 Mistral 7B Instruct v0.3 在 NPU 上也已支持。

    预览支持:OpenVINO™ GenAI 新增对 SpeechT5 文本转语音(TTS)模型的推理支持,同时推出全新的 RAG
    后端,为开发者提供简化的 API,显著降低内存占用并提升性能。

    预览支持: OpenVINO™ GenAI 提供了 GGUF 模型读取器,可无缝集成基于 llama.cpp
    的大语言模型(LLM)。支持使用 Python 和 C++ 构建推理流程,加载 GGUF 模型、构建 OpenVINO™ 计算图,并在
    GPU
    上实现即时推理。目前已完成对主流模型的验证,包括:DeepSeek-R1-Distill-Qwen(1.5B、7B)、Qwen2.5
    Instruct(1.5B、3B、7B)以及 llama-3.2 Instruct(1B、3B、8B)。

更广泛的 LLM 模型支持和更多的模型压缩技术

  • OpenVINO™ GenAI 的 LoRA
    适配器的进一步优化在集成显卡上带来改进的大语言模型、视觉语言模型以及文生图模型性能。开发者可以使用 LoRA
    适配器可快速定制模型以应对特定任务。

    对于 INT8 精度,CPU 的 KV 缓存压缩已默认启用,提供更低的内存占用,同时在精度上保持与 FP16 相当的水平。除此之外,相比于
    INT8,它在支持 INT4 的大语言模型中可显著节省内存。

    使用英特尔 ® XMX 脉动式平台优化英特尔 ® 酷睿™ Ultra 2 系列处理器集成显卡以及英特尔 ® Arc™ B
    系列显卡的视觉语言模型以及混合量化图片生成模型性能,同时通过动态量化降低大语言模型首 token 延迟。

在云、边缘和本地设备上运行 AI 时,具有更强的可移植性和性能

  • 增强的 Linux* 支持,配合最新 GPU 驱动,适用于英特尔 ® 酷睿™ Ultra 2 系列处理器内置 GPU(之前代号 Arrow
    Lake H)的 Linux * 支持。

    OpenVINO™ 模型服务器现已推出适用于 Windows 的精简版 C++
    版本,通过前缀缓存机制提升长上下文模型的性能,并提供更小巧的安装包,无需依赖 Python。同时,现已支持 Hugging Face
    模型。

    在神经网络压缩框架(NNCF)中实现了对 ONNX 模型的 INT4 无数据权重量化压缩支持

    通过对称量化和通道级量化,OpenVINO™ 现已支持在 Intel® Core™ 200V 系列处理器的 NPU 上运行采用
    FP16-NF4 精度的模型(参数规模最高可达 80 亿),在保持高性能的同时提升了推理精度。

Important links:

Release Notes​
Jupyter Notebooks​
System Requirements​
Documentation

<think>我们正在讨论Trae(一个类VS Code的编辑器)中Java配置的settings.json文件。用户要求详细解释各配置项的功能与作用。 根据之前的对话,我们已经给出了一些配置示例,现在需要详细说明每个配置项的含义。 注意:用户提供的引用[1][2][3]并不直接相关,但我们可以参考之前回答中的配置项。 以下是我们之前提到的settings.json配置示例中的各项: 1. "java.home": 指定JDK的安装路径。 2. "java.jdt.ls.vmargs": 为Java语言服务器指定JVM参数。 3. "java.compile.nullAnalysis.mode": 控制空分析的模式。 4. "java.configuration.updateBuildConfiguration": 控制如何更新构建配置。 5. "java.errors.incompleteClasspath.severity": 设置不完整类路径的错误级别。 6. "java.compiler.annotationProcessor.enabled": 启用或禁用注解处理器。 7. "maven.terminal.useJavaHome": 指定Maven终端是否使用java.home设置。 8. "java.project.importOnFirstTimeStartup": 控制首次启动时如何导入项目。 此外,用户还提供了引用[2]中的launch.json配置,但这不是settings.json的内容,而是调试配置。不过,我们也可以简要提及,因为用户可能混淆了。 我们需要详细解释这些配置项。同时,由于Trae是基于VS Code的,因此这些配置项与VS Code中的Java扩展配置相同。 下面是对每个配置项的详细说明:</think>### Trae中`settings.json`的Java配置项功能详解 以下是Trae(类VS Code编辑器)中Java开发的核心配置项及其作用,配置位置为`.vscode/settings.json`: --- #### 一、基础环境配置项 | **配置项** | **功能说明** | **示例值** | **必要性** | |------------|--------------|------------|------------| | `java.home` | JDK安装路径 | `"/usr/lib/jvm/jdk-17"` | **必需**<br>需与系统环境变量一致 | | `java.jdt.ls.vmargs` | Java语言服务器JVM参数 | `"-Xmx4G -XX:+UseG1GC"` | 推荐<br>提升性能与稳定性[^1] | | `java.project.referencedLibraries` | 添加外部JAR依赖 | `["lib/*.jar"]` | 项目级必需<br>非Maven/Gradle项目使用 | --- #### 二、编译与构建配置 | **配置项** | **功能说明** | **典型值** | **关联机制** | |------------|--------------|------------|--------------| | `java.compile.nullAnalysis.mode` | 空指针静态检查 | `"automatic"` | 编译时预警`NullPointerException` | | `java.configuration.updateBuildConfiguration` | 构建配置更新策略 | `"automatic"` | 修改`pom.xml`后自动更新依赖 | | `java.compiler.annotationProcessor.enabled` | 启用注解处理器 | `true` | 支持Lombok/MapStruct等[^3] | | `java.errors.incompleteClasspath.severity` | 类路径缺失处理 | `"warning"` | 控制缺失依赖的提示级别 | --- #### 三、项目与调试集成 | **配置项** | **功能说明** | **示例** | **关联文件** | |------------|--------------|----------|--------------| | `java.project.importOnFirstTimeStartup` | 首次加载项目策略 | `"automatic"` | 自动识别`pom.xml`或`build.gradle` | | `maven.terminal.useJavaHome` | Maven使用指定JDK | `true` | 确保Maven与Trae JDK版本一致 | | `java.debug.settings.console` | 调试控制台类型 | `"integratedTerminal"` | 替代默认Java Debug Console | --- #### 四、完整配置示例 ```json { "java.home": "/opt/jdk-17.0.10", // 必须配置 "java.jdt.ls.vmargs": "-Xmx4096m", // 防止语言服务器OOM "java.compile.nullAnalysis.mode": "automatic", "java.configuration.updateBuildConfiguration": "interactive", "java.compiler.annotationProcessor.enabled": true, // Lombok必需 "java.errors.incompleteClasspath.severity": "ignore", // 临时忽略缺失依赖 "maven.terminal.useJavaHome": true, "java.project.importOnFirstTimeStartup": "automatic", "java.debug.settings.console": "integratedTerminal" // 调试输出优化 } ``` --- #### 五、配置验证技巧 1. **路径检查**: 终端执行 `echo $JAVA_HOME` (Linux/Mac) 或 `echo %JAVA_HOME%` (Windows),需与`java.home`一致 2. **语言服务器状态**: Trae底部状态栏查看`Java Language Server`状态(正常应为火焰图标🔥) 3. **强制重载**: 修改配置后执行命令 `Java: Clean Java Language Server Workspace` > **注意**:配置生效需重启Trae。若遇Lombok失效,检查是否安装扩展`Lombok Annotations Support`[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值