详细安装和配置指南：llama.vscode 扩展

最新推荐文章于 2025-04-04 09:15:18 发布

韩烨琰

最新推荐文章于 2025-04-04 09:15:18 发布

阅读量1k

点赞数 29

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00567/article/details/146993760

详细安装和配置指南：llama.vscode 扩展

llama.vscode VS Code extension for local LLM-assisted code/text completion 项目地址: https://gitcode.com/gh_mirrors/ll/llama.vscode

1. 项目基础介绍

llama.vscode 是一个为 Visual Studio Code 编辑器设计的本地语言模型（LLM）辅助文本完成扩展。它能够提供自动建议功能，帮助开发者提高编码效率。该扩展适用于各种编程语言，并且可以在低性能硬件上支持大文本上下文。主要编程语言为 TypeScript 和 JavaScript。

2. 关键技术和框架

此项目使用以下关键技术和框架：

LLM (Language Model): 利用预训练的语言模型来辅助代码或文本的自动完成。
VS Code Extension API: 用于开发 Visual Studio Code 扩展的官方 API。
llama.cpp: 一个 C++ 编写的服务端程序，用于本地提供语言模型的接口。
FIM (Flexible Intermediate Representation): 一种中间表示形式，允许不同模型之间的互操作性。

3. 安装和配置准备工作

在开始安装之前，请确保您的系统中已安装以下环境和工具：

Visual Studio Code: 最新版本的 Visual Studio Code。
Git: 用于克隆和更新项目的版本控制系统。
C++ 编译环境: 如果需要从源代码编译 llama.cpp。
Python (可选): 如果需要运行某些脚本或工具。

安装步骤

安装 Visual Studio Code

如果您的系统中尚未安装 Visual Studio Code，请访问其官方网站下载并安装适合您操作系统的版本。
安装 llama.vscode 扩展

打开 Visual Studio Code，进入扩展市场搜索 llama-vscode 并安装。
安装 llama.cpp 服务端

根据您的操作系统，使用以下命令安装 llama.cpp 服务端：
- Mac OS:
```
brew install llama.cpp
```
- 其他操作系统: 您可以选择下载预编译的二进制文件或者从源代码编译。具体步骤请参考项目的 Wiki 页面。
配置 llama.cpp

根据您的显卡 VRAM 大小，选择合适的配置启动 llama.cpp 服务端。以下是几个推荐配置：
- 超过 16GB VRAM:
```
llama-server --fim-qwen-7b-default
```
- 小于 16GB VRAM:
```
llama-server --fim-qwen-3b-default
```
- 小于 8GB VRAM:
```
llama-server --fim-qwen-1.5b-default
```
如果是 CPU-only 硬件，请使用相应的 CPU-only 配置。
配置 VS Code

在 Visual Studio Code 中，您可能需要配置一些设置以启用扩展功能，例如自动完成建议的触发方式等。具体配置请参考扩展的文档。