Cypher 中的 COMPOSITE 索引(Composite Index)详解
一、什么是 COMPOSITE 索引?
COMPOSITE 索引(复合索引) 是 Neo4j 4.x 及以上版本提供的一种索引类型,可以将多个属性组合在一起进行索引,从而提高组合属性的查询性能。
- COMPOSITE 索引可以对两个或多个属性进行联合索引,从而加速对这些属性组合的查询操作。
- COMPOSITE 索引主要用于:
- 组合查询: 查询多个属性的组合匹配。
- 部分匹配: 匹配复合索引的前缀属性。
- 排序和过滤: 结合
WHERE
和ORDER BY
进行优化。
二、COMPOSITE 索引的特点
2.1 支持的数据类型
- 复合索引可以组合以下数据类型:
String
Integer
Float
Boolean
Date
、LocalDateTime
等日期类型
2.2 支持的查询操作
- 组合匹配:
=
- 部分匹配: 仅匹配复合索引的前缀部分
- 范围匹配:
>
、<
、>=
、<=
(仅针对数值或日期属性) - 排序:
ORDER BY
2.3 适用场景
- 查询组合属性时,例如
firstName
和lastName
的组合查询。 - 需要对多个属性进行联合匹配或联合排序的场景。
- 适用于需要提升多属性联合查询效率的场景。
三、创建 COMPOSITE 索引
3.1 基本语法
CREATE INDEX FOR (n:Label) ON (n.property1, n.property2, ...)
n:Label
:指定标签Label
的节点。n.property1, n.property2
:指定需要创建 COMPOSITE 索引的多个属性。
3.2 为多个属性创建 COMPOSITE 索引
CREATE INDEX FOR (n:Person) ON (n.firstName, n.lastName)
- 创建
Person
节点的firstName
和lastName
属性上的 COMPOSITE 索引。 - 此索引将加速
firstName
和lastName
组合匹配的查询。
3.3 为日期和数值属性创建 COMPOSITE 索引
CREATE INDEX FOR (n:Order) ON (n.orderDate, n.totalAmount)
- 创建
Order
节点orderDate
和totalAmount
属性的 COMPOSITE 索引。
3.4 创建多属性组合索引
CREATE INDEX FOR (n:Employee) ON (n.department, n.role, n.salary)
- 创建
Employee
节点department
、role
和salary
的组合索引。
3.5 为关系属性创建 COMPOSITE 索引
CREATE INDEX FOR ()-[r:RATED]-() ON (r.rating, r.timestamp)
- 创建
RATED
关系的rating
和timestamp
属性上的 COMPOSITE 索引。
四、查看和管理 COMPOSITE 索引
4.1 查看当前数据库中的所有索引
SHOW INDEXES
- 显示数据库中的所有索引,包括 BTREE、TEXT、POINT、RANGE 和 COMPOSITE 索引。
4.2 查看特定 COMPOSITE 索引的信息
SHOW INDEXES YIELD name, type, labelsOrTypes, properties
YIELD
关键字筛选返回指定索引的详细信息。- COMPOSITE 索引的
type
字段会显示BTREE
,但properties
字段会显示多个属性。
4.3 删除 COMPOSITE 索引
DROP INDEX myCompositeIndex
- 删除名为
myCompositeIndex
的索引。
DROP INDEX FOR (n:Person) ON (n.firstName, n.lastName)
- 删除
Person
节点firstName
和lastName
属性上的 COMPOSITE 索引。
五、使用 COMPOSITE 索引进行查询
5.1 组合属性的精确匹配
MATCH (n:Person)
WHERE n.firstName = 'Alice' AND n.lastName = 'Smith'
RETURN n
- 使用 COMPOSITE 索引进行组合匹配,提高查询速度。
5.2 部分匹配复合索引
MATCH (n:Person)
WHERE n.firstName = 'Alice'
RETURN n
- 只匹配
firstName
,仍然可以部分使用 COMPOSITE 索引(前缀匹配)。
5.3 使用 WHERE
进行范围匹配
MATCH (n:Order)
WHERE n.orderDate >= date('2023-01-01') AND n.totalAmount < 1000
RETURN n
- 通过 COMPOSITE 索引对
orderDate
和totalAmount
进行范围匹配。
5.4 使用 ORDER BY
进行排序
MATCH (n:Employee)
WHERE n.department = 'Sales'
RETURN n
ORDER BY n.role ASC, n.salary DESC
- 使用 COMPOSITE 索引进行多属性排序,提高查询效率。
5.5 分页查询
MATCH (n:Product)
WHERE n.category = 'Electronics'
RETURN n
ORDER BY n.price DESC
SKIP 10 LIMIT 5
- 使用 COMPOSITE 索引进行分页查询,提高数据检索速度。
六、COMPOSITE 索引的优化建议
6.1 为经常组合查询的属性创建 COMPOSITE 索引
- 如果多个属性经常在
MATCH
或WHERE
子句中同时使用,应创建 COMPOSITE 索引提高查询性能。
6.2 使用 EXPLAIN
和 PROFILE
查看查询计划
EXPLAIN MATCH (n:Person) WHERE n.firstName = 'Alice' AND n.lastName = 'Smith' RETURN n
EXPLAIN
显示查询计划,确认是否使用了 COMPOSITE 索引。
PROFILE MATCH (n:Person) WHERE n.firstName = 'Alice' AND n.lastName = 'Smith' RETURN n
PROFILE
执行查询并返回详细信息,包括查询过程中使用的索引。
6.3 确保组合属性顺序与查询顺序一致
- COMPOSITE 索引是顺序敏感的,查询时必须按照创建索引时的属性顺序进行匹配。
MATCH (n:Person)
WHERE n.lastName = 'Smith' AND n.firstName = 'Alice' -- 错误顺序
RETURN n
- 错误:顺序不匹配,无法使用 COMPOSITE 索引。
MATCH (n:Person)
WHERE n.firstName = 'Alice' AND n.lastName = 'Smith' -- 正确顺序
RETURN n
- 正确:与索引属性顺序匹配,使用 COMPOSITE 索引。
6.4 避免 OR
查询导致索引失效
MATCH (n:Person)
WHERE n.firstName = 'Alice' OR n.lastName = 'Smith'
RETURN n
OR
查询无法触发 COMPOSITE 索引,应拆分查询或使用UNION
。
6.5 在 ORDER BY
中使用 COMPOSITE 索引属性
MATCH (n:Product)
WHERE n.category = 'Electronics'
RETURN n
ORDER BY n.brand, n.price
- 使用 COMPOSITE 索引时,应确保
ORDER BY
使用索引属性,以提高排序性能。
七、COMPOSITE 索引的使用案例
7.1 组合属性匹配查询
MATCH (n:Person)
WHERE n.firstName = 'Alice' AND n.lastName = 'Smith'
RETURN n
- 使用
firstName
和lastName
进行组合匹配,提高查询速度。
7.2 前缀匹配部分复合索引
MATCH (n:Person)
WHERE n.firstName = 'Alice'
RETURN n
- 仅匹配
firstName
时,仍可部分使用 COMPOSITE 索引进行查询。
7.3 组合属性进行范围匹配
MATCH (n:Order)
WHERE n.orderDate >= date('2023-01-01') AND n.totalAmount < 500
RETURN n
- 使用
orderDate
和totalAmount
的组合索引进行范围匹配。
7.4 使用 ORDER BY
进行多属性排序
MATCH (n:Employee)
WHERE n.department = 'HR'
RETURN n
ORDER BY n.role, n.salary DESC
- 使用 COMPOSITE 索引优化多属性排序。
7.5 分页查询
MATCH (n:Product)
WHERE n.category = 'Electronics'
RETURN n
ORDER BY n.brand, n.price DESC
SKIP 10 LIMIT 5
- 使用 COMPOSITE 索引进行分页查询,提高数据检索速度。
八、删除 COMPOSITE 索引
8.1 删除特定 COMPOSITE 索引
DROP INDEX FOR (n:Person) ON (n.firstName, n.lastName)
- 删除
Person
节点firstName
和lastName
属性上的 COMPOSITE 索引。
8.2 删除所有 COMPOSITE 索引
SHOW INDEXES YIELD name
CALL {
WITH name
DROP INDEX name
}
- 删除数据库中所有 COMPOSITE 索引。
九、常见错误及注意事项
9.1 索引未生效
MATCH (n:Person)
WHERE n.firstName = 'Alice' AND n.lastName = 'Smith'
RETURN n
- 问题:查询未使用索引。
- 解决:使用
EXPLAIN
或PROFILE
查看查询计划,确认是否使用了 COMPOSITE 索引。
9.2 索引顺序不匹配
MATCH (n:Person)
WHERE n.lastName = 'Smith' AND n.firstName = 'Alice'
RETURN n
- 错误:顺序不匹配,无法触发 COMPOSITE 索引。
- 解决:调整
WHERE
子句中的属性顺序,使其与创建索引时的顺序一致。
9
.3 删除不存在的索引
DROP INDEX FOR (n:Person) ON (n.firstName, n.lastName)
- 错误:索引不存在时删除会报错,应先使用
SHOW INDEXES
查看索引状态。
十、总结
- COMPOSITE 索引 主要用于组合多个属性进行匹配、排序和范围查询,能够大幅提高多属性联合查询的性能。
- 通过
CREATE INDEX
创建 COMPOSITE 索引时,应确保属性的顺序与查询中的匹配顺序一致。 EXPLAIN
和PROFILE
可用于验证 COMPOSITE 索引是否生效,并进行性能优化。- COMPOSITE 索引适用于查询组合属性的场景,但需要注意顺序敏感性和
OR
查询限制。
掌握 COMPOSITE 索引的使用方法,可以帮助你优化 Neo4j 中多属性查询的性能,提高数据库的整体运行效率。