30 分钟上手：用 Java 快速搭建你的第一个向量数据库

原创于 2025-12-07 19:24:36 发布 · 633 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#java #数据库 #开发语言

数据库同时被 2 个专栏收录

85 篇文章

订阅专栏

Java 进阶

35 篇文章

订阅专栏

在 AI 大爆发的时代，向量数据库成为连接原始数据与大模型的核心枢纽——它能高效存储、检索“向量化”的文本、图片等数据，为语义搜索、智能推荐等场景提供底层支撑。如果你是 Java 开发者，想快速搭上向量数据库的快车，这篇实操指南就是为你准备的。全程无需复杂环境配置，30 分钟内带你从 0 到 1 搭建可运行的向量数据库应用。

一、先搞懂核心问题：什么是向量数据库？

在动手前，我们先花 2 分钟理清核心概念，避免“知其然不知其所以然”。

传统数据库（如 MySQL）靠“精确匹配”查询数据（比如搜索“苹果手机”就只能找到含这五个字的结果），而向量数据库存储的是“向量”——一种将非结构化数据（文本、图片等）通过模型转化成的多维数值数组。比如“猫喜欢吃鱼”和“猫咪爱吃小鱼干”，转化后的向量会非常接近。

向量数据库的核心能力是“近似最近邻搜索（ANN）”，能快速找到与目标向量最相似的数据，这正是 AI 场景需要的“语义理解”能力。

本次实操我们选用 Milvus Lite（Milvus 向量数据库的轻量版），它无需部署独立服务，直接嵌入 Java 应用，对新手极度友好；配合 Java SDK 就能快速开发，完美契合“快速上手”的需求。

二、环境准备：3 分钟搞定依赖与配置

工欲善其事，必先利其器。确保你的环境满足基础要求，然后快速完成配置。

1. 基础环境要求

JDK 8 及以上（推荐 JDK 11，兼容性更好）
Maven 3.6+（用于依赖管理，也可用 Gradle）
开发工具：IDEA 或 Eclipse（本次以 IDEA 为例）

2. 新建 Maven 项目并添加依赖

打开 IDEA，新建一个普通 Maven 项目（GroupId、ArtifactId 自定义即可），然后在 pom.xml 中添加以下依赖：


<dependencies>
    
    <dependency>
        <groupId>io.milvus</groupId>
        <artifactId>milvus-sdk-java</artifactId>
        <version>2.4.3</version>
    </dependency>
    
    
    <dependency>
        <groupId>org.apache.commons</groupId>
        <artifactId>commons-lang3</artifactId>
        <version>3.14.0</version>
    </dependency>
    
    
    <dependency>
        <groupId>org.slf4j</groupId>
        <artifactId>slf4j-simple</artifactId>
        <version>2.0.9</version>
    </dependency>
</dependencies>

点击 Maven 刷新按钮，等待依赖下载完成。Milvus Lite 会随 SDK 自动引入，无需额外安装服务，这也是我们选它的核心原因。

三、核心步骤：20 分钟完成“建库-插数-查询”全流程

向量数据库的核心操作流程是“连接数据库 → 创建集合（类似传统数据库的表） → 插入向量数据 → 执行相似度查询”。我们一步步拆解实现。

1. 第一步：连接 Milvus Lite 数据库

新建一个 VectorDbDemo.java 类，首先实现数据库连接。Milvus Lite 以本地文件形式存储数据，连接时只需指定数据存储路径即可。


import io.milvus.client.MilvusClient;
import io.milvus.param.ConnectParam;
import io.milvus.param.MilvusClientParam;
import io.milvus.param.R;
import io.milvus.param.collection.CreateCollectionParam;
import io.milvus.param.collection.FieldType;
import io.milvus.param.dml.InsertParam;
import io.milvus.param.dml.SearchParam;
import io.milvus.response.InsertResponse;
import io.milvus.response.SearchResponse;
import org.apache.commons.lang3.RandomUtils;

import java.util.ArrayList;
import java.util.List;

public class VectorDbDemo {
    // Milvus Lite 数据库连接地址（本地文件路径，自定义）
    private static final String MILVUS_URL = "localhost:19530";
    // 集合名称（类似表名，自定义）
    private static final String COLLECTION_NAME = "java_vector_demo";
    // 向量维度（需与生成的向量维度一致，这里选128维）
    private static final int VECTOR_DIM = 128;

    public static void main(String[] args) {
        // 1. 构建连接参数
        ConnectParam connectParam = ConnectParam.newBuilder()
                .withHost("localhost")
                .withPort(19530)
                .build();

        // 2. 创建 Milvus 客户端
        MilvusClient client = new MilvusClient(connectParam);

        // 测试连接是否成功
        R<Boolean> healthCheck = client.checkHealth();
        if (healthCheck.getData()) {
            System.out.println("✅ 数据库连接成功！");
        } else {
            System.out.println("❌ 数据库连接失败：" + healthCheck.getMessage());
            return;
        }

        // 后续操作（创建集合、插数、查询）将在这里补充
    }
}

运行 main 方法，如果控制台输出“✅ 数据库连接成功！”，说明基础连接已打通。Milvus Lite 会自动在本地启动临时服务，退出程序后服务停止，数据会保存在默认路径。

2. 第二步：创建集合（定义数据结构）

集合是向量数据库存储数据的基本单元，类似 MySQL 的表。我们需要定义集合的字段，核心包含“主键字段”和“向量字段”，还可以添加“普通属性字段”（如文本原文）。

在连接成功后，添加创建集合的代码：


// 3. 创建集合（先判断是否存在，存在则删除）
if (client.hasCollection(COLLECTION_NAME).getData()) {
    client.dropCollection(COLLECTION_NAME);
    System.out.println("⚠️  集合已存在，已删除");
}

// 定义字段：主键字段（自增ID）
FieldType idField = FieldType.newBuilder()
        .withName("id")
        .withDataType(FieldType.DataType.Int64)
        .withPrimaryKey(true)
        .withAutoID(true) // 自增
        .build();

// 定义字段：向量字段（核心）
FieldType vectorField = FieldType.newBuilder()
        .withName("content_vector")
        .withDataType(FieldType.DataType.FloatVector)
        .withDimension(VECTOR_DIM) // 向量维度与生成的一致
        .build();

// 定义字段：普通属性字段（存储文本原文，方便查询后展示）
FieldType textField = FieldType.newBuilder()
        .withName("text_content")
        .withDataType(FieldType.DataType.VarChar)
        .withMaxLength(512) // 文本最大长度
        .build();

// 构建创建集合的参数
CreateCollectionParam createParam = CreateCollectionParam.newBuilder()
        .withCollectionName(COLLECTION_NAME)
        .addFieldType(idField)
        .addFieldType(vectorField)
        .addFieldType(textField)
        .withConsistencyLevel(CreateCollectionParam.ConsistencyLevelEnum.STRONG) // 一致性级别
        .build();

// 执行创建集合
R<Boolean> createResult = client.createCollection(createParam);
if (createResult.getData()) {
    System.out.println("✅ 集合创建成功！");
} else {
    System.out.println("❌ 集合创建失败：" + createResult.getMessage());
    client.close();
    return;
}

这里我们定义了三个字段：id（自增主键）、content_vector（128维向量字段，核心）、text_content（存储原始文本，方便结果展示）。执行后控制台会输出“✅ 集合创建成功！”。

3. 第三步：生成向量并插入数据

向量数据库存储的是向量，所以我们需要先将原始文本转化为向量。实际开发中会用专业模型（如 BERT、Sentence-BERT）生成向量，为了简化演示，这里用随机数模拟向量（后续会说明如何替换为真实模型）。

在集合创建成功后，添加“生成向量+插入数据”的代码：


// 4. 生成测试数据（5条文本，模拟用户问答场景）
List<String> textList = new ArrayList<>();
textList.add("Java 中如何创建线程？有几种方式？");
textList.add("Java 线程的生命周期包括哪些状态？");
textList.add("Spring Boot 如何配置数据库连接池？");
textList.add("Spring Cloud 与 Spring Boot 的区别是什么？");
textList.add("Java 8 的 Lambda 表达式有什么用法？");

// 生成向量：将每条文本转化为128维向量（模拟，实际用模型生成）
List<List<Float>> vectorList = new ArrayList<>();
for (int i = 0; i < textList.size(); i++) {
    List<Float> vector = new ArrayList<>();
    for (int j = 0; j < VECTOR_DIM; j++) {
        // 用随机数模拟向量（真实场景替换为模型输出）
        vector.add(RandomUtils.nextFloat(0.0f, 1.0f));
    }
    vectorList.add(vector);
}

// 构建插入参数
InsertParam insertParam = InsertParam.newBuilder()
        .withCollectionName(COLLECTION_NAME)
        .addField("text_content", textList) // 插入文本字段
        .addField("content_vector", vectorList) // 插入向量字段
        .build();

// 执行插入
R<InsertResponse> insertResult = client.insert(insertParam);
if (insertResult.getData() != null) {
    System.out.println("✅ 数据插入成功！插入条数：" + textList.size());
    System.out.println("插入数据ID：" + insertResult.getData().getInsertIds());
} else {
    System.out.println("❌ 数据插入失败：" + insertResult.getMessage());
    client.close();
    return;
}

这里我们模拟了 5 条 Java 开发相关的文本数据，并用随机数生成对应向量。执行后控制台会输出插入成功的提示和数据 ID，说明数据已存入向量数据库。

真实场景向量生成：如果需要生成有语义意义的向量，可引入 sentence-transformers 等模型（Java 可通过 JNA 调用或使用国内开源模型如 ERNIE），核心是将文本转化为固定维度的浮点数数组，维度需与集合定义的 VECTOR_DIM 一致。

4. 第四步：创建索引并执行相似度查询

向量数据库的查询依赖“索引”来提升效率，没有索引时会执行全量扫描，速度较慢。我们先创建向量索引，再执行相似度查询。

在数据插入成功后，添加以下代码：


// 5. 创建向量索引（提升查询效率）
// 索引参数（IVF_FLAT 是基础索引类型，适合小数据量）
String indexParam = String.format("{\"index_type\": \"IVF_FLAT\", \"params\": {\"nlist\": 1024}, \"metric_type\": \"L2\"}");
R<Boolean> createIndexResult = client.createIndex(
        COLLECTION_NAME,
        "content_vector", // 向量字段名
        indexParam
);
if (createIndexResult.getData()) {
    System.out.println("✅ 向量索引创建成功！");
} else {
    System.out.println("❌ 索引创建失败：" + createIndexResult.getMessage());
    client.close();
    return;
}

// 6. 加载集合到内存（查询前必须执行）
R<Boolean> loadResult = client.loadCollection(COLLECTION_NAME);
if (loadResult.getData()) {
    System.out.println("✅ 集合加载到内存成功！");
} else {
    System.out.println("❌ 集合加载失败：" + loadResult.getMessage());
    client.close();
    return;
}

// 7. 执行相似度查询（模拟用户查询："Java 线程相关问题"）
String queryText = "Java 线程相关问题";
// 生成查询向量（同样用随机数模拟，真实场景与数据向量用同一模型生成）
List<Float> queryVector = new ArrayList<>();
for (int j = 0; j < VECTOR_DIM; j++) {
    queryVector.add(RandomUtils.nextFloat(0.0f, 1.0f));
}

// 构建查询参数
SearchParam searchParam = SearchParam.newBuilder()
        .withCollectionName(COLLECTION_NAME)
        .withMetricType(SearchParam.MetricType.L2) // 距离计算方式（L2为欧氏距离）
        .withTopK(2) // 返回最相似的2条数据
        .withVectorFieldName("content_vector")
        .addVector(queryVector)
        .withParams("{\"nprobe\": 10}") // 索引查询参数
        .addOutputField("text_content") // 要返回的字段
        .build();

// 执行查询
R<SearchResponse> searchResult = client.search(searchParam);
if (searchResult.getData() != null) {
    System.out.println("\n🔍 查询结果（与\"" + queryText + "\"最相似的2条数据）：");
    // 解析查询结果
    SearchResponse.Data data = searchResult.getData().get(0);
    for (int i = 0; i < data.getScoreCount(); i++) {
        float score = data.getScores().get(i); // 相似度分数（L2距离越小越相似）
        String text = data.getFields().get("text_content").get(i).toString(); // 文本内容
        System.out.println((i+1) + ". 相似度：" + String.format("%.4f", score) + "，内容：" + text);
    }
} else {
    System.out.println("❌ 查询失败：" + searchResult.getMessage());
}

// 关闭客户端
client.close();

这里有两个关键知识点：

索引类型：IVF_FLAT 是 Milvus 最基础的索引，适合小数据量（万级以内），优点是查询准确、配置简单；大数据量可选用 HNSW 等索引。
相似度分数：我们用 L2 欧氏距离计算，分数越小说明两条数据的向量越接近，语义越相似。

四、运行验证：5 分钟看结果

点击 IDEA 的运行按钮，等待程序执行完成，控制台会输出完整的流程日志，最终会展示与“Java 线程相关问题”最相似的两条数据。

由于我们用随机数模拟向量，每次运行的相似度分数可能不同，但核心流程是通的。如果替换为真实的模型生成向量，就能得到符合语义的查询结果。

五、进阶方向：从“能用”到“好用”

本次演示是最基础的入门案例，实际开发中还需要关注这些点：

真实向量生成：引入 Sentence-BERT、ERNIE 等模型，Java 可使用 sentence-transformers 的 Java 封装版，或通过 HTTP 调用模型服务（如 FastAPI 封装的模型）。
索引优化：根据数据量选择合适的索引（如百万级数据用 HNSW），调整索引参数（如 nlist、nprobe）平衡查询速度和准确率。
数据管理：添加数据删除、更新、批量插入等操作，结合业务场景设计合理的集合结构。
分布式部署：生产环境用 Milvus 分布式版，而非 Lite 版，确保高可用和高并发。