架构之高性能搜索

原创于 2025-12-17 15:11:15 发布 · 831 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#架构 #高性能搜索

Architect 专栏收录该内容

26 篇文章

订阅专栏

架构之高性能搜索

引言

在海量数据时代，全文搜索已成为现代应用的核心功能。无论是电商平台的商品搜索、社交媒体的内容检索，还是企业级的日志分析，都需要在海量数据中快速定位目标信息。当数据量达到TB甚至PB级别时，传统的数据库查询方式已无法满足性能要求，必须借助专门的搜索索引技术。

高性能搜索法则强调：海量数据的全文搜索必须使用搜索索引技术，如ElasticSearch，同时必须考虑全量数据与搜索索引之间的数据一致性问题。这一法则不仅关乎搜索性能，更直接影响用户体验和业务价值。

高性能搜索架构的核心理念

为什么需要搜索索引？

搜索索引能够解决上述挑战：

查询性能提升：通过倒排索引实现毫秒级响应
全文检索能力：支持分词、模糊匹配、相关性排序
水平扩展性：支持分布式部署，线性扩展
丰富查询语法：支持复杂查询、聚合分析
高可用性：支持集群部署，自动故障转移

搜索索引vs传统数据库

特性对比	传统数据库	搜索索引	适用场景
索引结构	B+Tree	倒排索引	精确查询vs全文检索
查询类型	精确匹配、范围查询	分词搜索、模糊匹配	结构化数据vs非结构化文本
响应时间	100-1000ms	1-100ms	实时性要求
数据一致性	强一致性	最终一致性	业务一致性要求
扩展性	垂直扩展为主	水平扩展	数据规模

ElasticSearch架构深度解析

ElasticSearch核心架构

倒排索引实现原理

// 倒排索引核心实现
@Component
public class InvertedIndexEngine {
    private static final Logger log = LoggerFactory.getLogger(InvertedIndexEngine.class);
    
    // 倒排索引结构：词项 -> 文档列表
    private final Map<String, PostingList> invertedIndex;
    
    // 文档存储：文档ID -> 文档内容
    private final Map<String, Document> documentStore;
    
    // 词项统计：词项 -> 文档频率
    private final Map<String, Integer> termStatistics;
    
    // 分词器
    private final Analyzer analyzer;
    
    public InvertedIndexEngine(Analyzer analyzer) {
        this.invertedIndex = new ConcurrentHashMap<>();
        this.documentStore = new ConcurrentHashMap<>();
        this.termStatistics = new ConcurrentHashMap<>();
        this.analyzer = analyzer;
    }
    
    /**
     * 文档索引构建
     */
    public IndexResult indexDocument(String docId, String content, Map<String, Object> metadata) {
        try {
            // 1. 文档预处理
            Document doc = preprocessDocument(docId, content, metadata);
            
            // 2. 分词处理
            List<String> terms = analyzer.analyze(content);
            
            // 3. 构建倒排索引
            for (String term : terms) {
                updateInvertedIndex(term, docId);
            }
            
            // 4. 存储文档
            documentStore.put(docId, doc);
            
            // 5. 更新统计信息
            updateTermStatistics(terms);
            
            log.info("文档索引成功: docId={}, terms={}", docId, terms.size());
            return IndexResult.success(docId, terms.size());
            
        } catch (Exception e) {
            log.error("文档索引失败: docId={}", docId, e);
            return IndexResult.failure(docId, e.getMessage());
        }
    }
    
    /**
     * 倒排索引更新
     */
    private void updateInvertedIndex(String term, String docId) {
        invertedIndex.compute(term, (k, postingList) -> {
            if (postingList == null) {
                postingList = new PostingList();
            }
            postingList.addDocument(docId);
            return postingList;
        });
    }
    
    /**
     * 搜索查询处理
     */
    public SearchResult search(String query, SearchOptions options) {
        try {
            // 1. 查询预处理
            String processedQuery = preprocessQuery(query);
            
            // 2. 查询分词
            List<String> queryTerms = analyzer.analyze(processedQuery);
            
            // 3. 执行搜索
            Set<String> candidateDocs = executeSearch(queryTerms, options);
            
            // 4. 相关性排序
            List<SearchHit> rankedResults = rankResults(candidateDocs, queryTerms, options);
            
            // 5. 结果封装
            return SearchResult.success(rankedResults, queryTerms);
            
        } catch (Exception e) {
            log.error("搜索查询失败: query={}", query, e);
            return SearchResult.failure(query, e.getMessage());
        }
    }
    
    /**
     * 搜索执行核心逻辑
     */
    private Set<String> executeSearch(List<String> queryTerms, SearchOptions options) {
        Set<String> resultDocs = new HashSet<>();
        
        if (queryTerms.isEmpty()) {
            return resultDocs;
        }
        
        // 获取第一个词项的文档列表作为基础
        String firstTerm = queryTerms.get(0);
        PostingList firstPosting = invertedIndex.get(firstTerm);
        
        if (firstPosting == null) {
            return resultDocs;
        }
        
        Set<String> baseDocs = new HashSet<>(firstPosting.getDocuments());
        
        // 根据搜索类型处理其他词项
        switch (options.getSearchType()) {
            case AND:
                // 交集操作
                for (int i = 1; i < queryTerms.size(); i++) {
                    String term = queryTerms.get(i);
                    PostingList posting = invertedIndex.get(term);
                    if (posting != null) {
                        baseDocs.retainAll(posting.getDocuments());
                    } else {
                        baseDocs.clear();
                        break;
                    }
                }
                break;
                
            case OR:
                // 并集操作
                for (int i = 1; i < queryTerms.size(); i++) {
                    String term = queryTerms.get(i);
                    PostingList posting = invertedIndex.get(term);
                    if (posting != null) {
                        baseDocs.addAll(posting.getDocuments());
                    }
                }
                break;
                
            case PHRASE:
                // 短语搜索
                baseDocs = executePhraseSearch(queryTerms, baseDocs);
                break;
        }
        
        return baseDocs;
    }
    
    /**
     * 短语搜索实现
     */
    private Set<String> executePhraseSearch(List<String> queryTerms, Set<String> candidateDocs) {
        Set<String> resultDocs = new HashSet<>();
        
        for (String docId : candidateDocs) {
            Document doc = documentStore.get(docId);
            if (doc != null && containsPhrase(doc.getContent(), queryTerms)) {
                resultDocs.add(docId);
            }
        }
        
        return resultDocs;
    }
    
    /**
     * 相关性排序算法
     */
    private List<SearchHit> rankResults(Set<String> candidateDocs, List<String> queryTerms, SearchOptions options) {
        List<SearchHit> rankedResults = new ArrayList<>();
        
        for (String docId : candidateDocs) {
            Document doc = documentStore.get(docId);
            if (doc != null) {
                // 计算相关性得分
                double score = calculateRelevanceScore(doc, queryTerms);
                
                SearchHit hit = SearchHit.builder()
                    .docId(docId)
                    .score(score)
                    .content(doc.getContent())
                    .metadata(doc.getMetadata())
                    .build();
                
                rankedResults.add(hit);
            }
        }
        
        // 按相关性得分排序
        rankedResults.sort((a, b) -> Double.compare(b.getScore(), a.getScore()));
        
        // 应用分页
        return applyPagination(rankedResults, options.getOffset(), options.getLimit());
    }
    
    /**
     * 相关性得分计算（TF-IDF）
     */
    private double calculateRelevanceScore(Document doc, List<String> queryTerms) {
        double score = 0.0;
        int totalDocs = documentStore.size();
        
        for (String term : queryTerms) {
            // 词频 (TF)
            double tf = calculateTermFrequency(doc.getContent(), term);
            
            // 逆文档频率 (IDF)
            double idf = calculateInverseDocumentFrequency(term, totalDocs);
            
            // TF-IDF得分
            score += tf * idf;
        }
        
        return score;
    }
    
    /**
     * 性能测试
     */
    public void performanceTest() {
        log.info("=== 倒排索引性能测试 ===");
        
        // 测试不同规模的数据集
        int[] dataSizes = {1000, 10000, 100000};
        
        for (int size : dataSizes) {
            // 构建测试数据
            List<TestDocument> testDocs = generateTestDocuments(size);
            
            // 索引性能测试
            long startTime = System.currentTimeMillis();
            for (TestDocument doc : testDocs) {
                indexDocument(doc.getId(), doc.getContent(), doc.getMetadata());
            }
            long indexTime = System.currentTimeMillis() - startTime;
            
            // 搜索性能测试
            String[] testQueries = {"技术", "架构", "高性能", "分布式系统"};
            
            long searchTotalTime = 0;
            int searchCount = 1000;
            
            for (int i = 0; i < searchCount; i++) {
                String query = testQueries[i % testQueries.length];
                startTime = System.currentTimeMillis();
                SearchResult result = search(query, SearchOptions.builder()
                    .searchType(SearchType.AND)
                    .limit(10)
                    .build());
                searchTotalTime += System.currentTimeMillis() - startTime;
            }
            
            log.info("数据量: {}, 索引时间: {}ms, 平均索引: {}μs, 平均搜索: {}ms", 
                size, indexTime, (indexTime * 1000) / size, (double) searchTotalTime / searchCount);
        }
    }
}

ElasticSearch集群架构设计

// ElasticSearch集群管理器
@Component
public class ElasticSearchClusterManager {
    private static final Logger log = LoggerFactory.getLogger(ElasticSearchClusterManager.class);
    
    // 集群配置
    private final ClusterConfiguration config;
    
    // 节点管理
    private final Map<String, ESNode> clusterNodes;
    
    // 分片分配器
    private final ShardAllocator shardAllocator;
    
    // 集群状态管理
    private final ClusterStateManager stateManager;
    
    public ElasticSearchClusterManager(ClusterConfiguration config) {
        this.config = config;
        this.clusterNodes = new ConcurrentHashMap<>();
        this.shardAllocator = new ShardAllocator(config);
        this.stateManager = new ClusterStateManager();
    }
    
    /**
     * 集群节点管理
     */
    public void addNode(String nodeId, String nodeAddress, NodeRole role) {
        ESNode node = ESNode.builder()
            .nodeId(nodeId)
            .address(nodeAddress)
            .role(role)
            .status(NodeStatus.HEALTHY)
            .build();
        
        clusterNodes.put(nodeId, node);
        
        // 触发分片重新分配
        if (role == NodeRole.DATA) {
            rebalanceShards();
        }
        
        log.info("集群节点添加成功: nodeId={}, role={}", nodeId, role);
    }
    
    /**
     * 索引创建与分片分配
     */
    public IndexCreationResult createIndex(String indexName, IndexConfiguration indexConfig) {
        try {
            // 1. 验证索引配置
            validateIndexConfiguration(indexConfig);
            
            // 2. 计算分片分配
            ShardAllocationPlan allocationPlan = shardAllocator.calculateAllocation(
                indexName, 
                indexConfig.getShardCount(),
                indexConfig.getReplicaCount()
            );
            
            // 3. 创建主分片
            List<Shard> primaryShards = createPrimaryShards(indexName, allocationPlan);
            
            // 4. 创建副本分片
            List<Shard> replicaShards = createReplicaShards(primaryShards, allocationPlan);
            
            // 5. 更新集群状态
            ClusterState newState = stateManager.updateIndexState(indexName, 
                IndexState.builder()
                    .indexName(indexName)
                    .status(IndexStatus.CREATED)
                    .primaryShards(primaryShards)
                    .replicaShards(replicaShards)
                    .build()
            );
            
            // 6. 同步集群状态
            broadcastClusterState(newState);
            
            log.info("索引创建成功: indexName={}, shards={}, replicas={}", 
                indexName, primaryShards.size(), replicaShards.size());
            
            return IndexCreationResult.success(indexName, primaryShards.size(), replicaShards.size());
            
        } catch (Exception e) {
            log.error("索引创建失败: indexName={}", indexName, e);
            return IndexCreationResult.failure(indexName, e.getMessage());
        }
    }
    
    /**
     * 分片重新平衡
     */
    public void rebalanceShards() {
        try {
            // 1. 获取当前集群状态
            ClusterState currentState = stateManager.getCurrentState();
            
            // 2. 分析分片分布
            ShardDistributionAnalysis analysis = analyzeShardDistribution(currentState);
            
            // 3. 生成分片迁移计划
            List<ShardMigration> migrationPlan = generateMigrationPlan(analysis);
            
            // 4. 执行分片迁移
            for (ShardMigration migration : migrationPlan) {
                executeShardMigration(migration);
            }
            
            log.info("分片重新平衡完成，迁移分片数: {}", migrationPlan.size());
            
        } catch (Exception e) {
            log.error("分片重新平衡失败", e);
        }
    }
    
    /**
     * 集群健康检查
     */
    public ClusterHealth checkClusterHealth() {
        ClusterHealth.Builder healthBuilder = ClusterHealth.builder();
        
        // 1. 检查节点状态
        int healthyNodes = 0;
        int unhealthyNodes = 0;
        
        for (ESNode node : clusterNodes.values()) {
            if (node.getStatus() == NodeStatus.HEALTHY) {
                healthyNodes++;
            } else {
                unhealthyNodes++;
            }
        }
        
        // 2. 检查分片状态
        ClusterState currentState = stateManager.getCurrentState();
        int activeShards = 0;
        int unassignedShards = 0;
        int relocatingShards = 0;
        
        for (IndexState indexState : currentState.getIndexStates().values()) {
            for (Shard shard : indexState.getAllShards()) {
                switch (shard.getStatus()) {
                    case ACTIVE:
                        activeShards++;
                        break;
                    case UNASSIGNED:
                        unassignedShards++;
                        break;
                    case RELOCATING:
                        relocatingShards++;
                        break;
                }
            }
        }
        
        // 3. 计算集群状态
        ClusterStatus overallStatus = calculateOverallStatus(healthyNodes, unhealthyNodes, 
                                                           activeShards, unassignedShards);
        
        return healthBuilder
            .status(overallStatus)
            .totalNodes(clusterNodes.size())
            .healthyNodes(healthyNodes)
            .unhealthyNodes(unhealthyNodes)
            .activeShards(activeShards)
            .unassignedShards(unassignedShards)
            .relocatingShards(relocatingShards)
            .build();
    }
    
    /**
     * 故障转移处理
     */
    public void handleNodeFailure(String failedNodeId) {
        log.warn("处理节点故障: nodeId={}", failedNodeId);
        
        try {
            // 1. 标记节点状态
            ESNode failedNode = clusterNodes.get(failedNodeId);
            if (failedNode != null) {
                failedNode.setStatus(NodeStatus.FAILED);
            }
            
            // 2. 获取故障节点上的分片
            ClusterState currentState = stateManager.getCurrentState();
            List<Shard> failedShards = getShardsOnNode(currentState, failedNodeId);
            
            // 3. 重新分配主分片
            for (Shard shard : failedShards) {
                if (shard.getType() == ShardType.PRIMARY) {
                    promoteReplicaToPrimary(shard);
                }
            }
            
            // 4. 重新分配副本分片
            for (Shard shard : failedShards) {
                if (shard.getType() == ShardType.REPLICA) {
                    recreateReplicaShard(shard);
                }
            }
            
            // 5. 触发重新平衡
            rebalanceShards();
            
            log.info("节点故障处理完成: nodeId={}", failedNodeId);
            
        } catch (Exception e) {
            log.error("节点故障处理失败: nodeId={}", failedNodeId, e);
        }
    }
}

数据一致性保障机制

数据同步架构设计

实时数据同步实现

// 数据同步管理器
@Component
public class DataSynchronizationManager {
    private static final Logger log = LoggerFactory.getLogger(DataSynchronizationManager.class);
    
    // 数据源配置
    private final DataSource dataSource;
    
    // ElasticSearch客户端
    private final ElasticSearchClient esClient;
    
    // 消息队列消费者
    private final MessageQueueConsumer mqConsumer;
    
    // 同步状态管理
    private final SyncStateManager syncStateManager;
    
    public DataSynchronizationManager(DataSource dataSource, 
                                    ElasticSearchClient esClient,
                                    MessageQueueConsumer mqConsumer) {
        this.dataSource = dataSource;
        this.esClient = esClient;
        this.mqConsumer = mqConsumer;
        this.syncStateManager = new SyncStateManager();
    }
    
    /**
     * 基于Binlog的实时同步
     */
    public void startBinlogBasedSync(String database, String table, String indexName) {
        try {
            // 1. 创建Binlog监听器
            BinlogListener binlogListener = new BinlogListener(database, table, 
                new BinlogEventHandler() {
                    @Override
                    public void onInsert(BinlogEvent event) {
                        handleInsertEvent(event, indexName);
                    }
                    
                    @Override
                    public void onUpdate(BinlogEvent event) {
                        handleUpdateEvent(event, indexName);
                    }
                    
                    @Override
                    public void onDelete(BinlogEvent event) {
                        handleDeleteEvent(event, indexName);
                    }
                });
            
            // 2. 启动监听器
            binlogListener.start();
            
            log.info("Binlog同步启动成功: database={}, table={}, index={}", 
                database, table, indexName);
            
        } catch (Exception e) {
            log.error("Binlog同步启动失败", e);
            throw new SyncException("Failed to start binlog sync", e);
        }
    }
    
    /**
     * 处理插入事件
     */
    private void handleInsertEvent(BinlogEvent event, String indexName) {
        try {
            // 1. 数据转换
            Map<String, Object> docData = convertToDocument(event.getData());
            
            // 2. 构建索引请求
            IndexRequest request = IndexRequest.builder()
                .index(indexName)
                .id(event.getPrimaryKey())
                .document(docData)
                .build();
            
            // 3. 发送到ElasticSearch
            IndexResponse response = esClient.index(request);
            
            // 4. 记录同步状态
            syncStateManager.recordSuccess(event.getEventId(), indexName, 
                SyncOperation.INSERT);
            
            log.debug("插入同步成功: index={}, id={}", indexName, event.getPrimaryKey());
            
        } catch (Exception e) {
            log.error("插入同步失败: index={}, id={}", indexName, event.getPrimaryKey(), e);
            syncStateManager.recordFailure(event.getEventId(), indexName, 
                SyncOperation.INSERT, e.getMessage());
        }
    }
    
    /**
     * 处理更新事件
     */
    private void handleUpdateEvent(BinlogEvent event, String indexName) {
        try {
            // 1. 获取更新后的数据
            Map<String, Object> updatedData = event.getData();
            
            // 2. 构建更新请求
            UpdateRequest request = UpdateRequest.builder()
                .index(indexName)
                .id(event.getPrimaryKey())
                .doc(updatedData)
                .build();
            
            // 3. 发送到ElasticSearch
            UpdateResponse response = esClient.update(request);
            
            // 4. 记录同步状态
            syncStateManager.recordSuccess(event.getEventId(), indexName, 
                SyncOperation.UPDATE);
            
            log.debug("更新同步成功: index={}, id={}", indexName, event.getPrimaryKey());
            
        } catch (Exception e) {
            log.error("更新同步失败: index={}, id={}", indexName, event.getPrimaryKey(), e);
            syncStateManager.recordFailure(event.getEventId(), indexName, 
                SyncOperation.UPDATE, e.getMessage());
        }
    }
    
    /**
     * 处理删除事件
     */
    private void handleDeleteEvent(BinlogEvent event, String indexName) {
        try {
            // 1. 构建删除请求
            DeleteRequest request = DeleteRequest.builder()
                .index(indexName)
                .id(event.getPrimaryKey())
                .build();
            
            // 2. 发送到ElasticSearch
            DeleteResponse response = esClient.delete(request);
            
            // 3. 记录同步状态
            syncStateManager.recordSuccess(event.getEventId(), indexName, 
                SyncOperation.DELETE);
            
            log.debug("删除同步成功: index={}, id={}", indexName, event.getPrimaryKey());
            
        } catch (Exception e) {
            log.error("删除同步失败: index={}, id={}", indexName, event.getPrimaryKey(), e);
            syncStateManager.recordFailure(event.getEventId(), indexName, 
                SyncOperation.DELETE, e.getMessage());
        }
    }
    
    /**
     * 基于消息队列的异步同步
     */
    public void startMessageQueueBasedSync(String topic, String indexName) {
        try {
            // 1. 创建消息消费者
            mqConsumer.subscribe(topic, new MessageHandler() {
                @Override
                public void onMessage(Message message) {
                    try {
                        // 2. 解析消息
                        DataChangeEvent event = parseMessage(message);
                        
                        // 3. 处理数据变更
                        processDataChangeEvent(event, indexName);
                        
                        // 4. 确认消息
                        message.ack();
                        
                    } catch (Exception e) {
                        log.error("消息处理失败", e);
                        message.nack(); // 重新投递
                    }
                }
            });
            
            log.info("消息队列同步启动成功: topic={}, index={}", topic, indexName);
            
        } catch (Exception e) {
            log.error("消息队列同步启动失败", e);
            throw new SyncException("Failed to start MQ sync", e);
        }
    }
    
    /**
     * 定时全量同步
     */
    @Scheduled(cron = "0 0 2 * * ?") // 每天凌晨2点执行
    public void performFullSync() {
        log.info("开始执行全量数据同步");
        
        try {
            // 1. 获取需要同步的索引列表
            List<SyncConfig> syncConfigs = getSyncConfigurations();
            
            for (SyncConfig config : syncConfigs) {
                try {
                    // 2. 创建新索引
                    String newIndexName = config.getIndexName() + "_" + System.currentTimeMillis();
                    createNewIndex(newIndexName, config);
                    
                    // 3. 全量数据导入
                    importAllData(config, newIndexName);
                    
                    // 4. 索引别名切换
                    switchAlias(config.getIndexName(), newIndexName);
                    
                    // 5. 删除旧索引
                    deleteOldIndices(config.getIndexName());
                    
                    log.info("全量同步完成: index={}", config.getIndexName());
                    
                } catch (Exception e) {
                    log.error("全量同步失败: index={}", config.getIndexName(), e);
                }
            }
            
        } catch (Exception e) {
            log.error("全量同步任务执行失败", e);
        }
    }
    
    /**
     * 数据一致性校验
     */
    @Scheduled(cron = "0 0 4 * * ?") // 每天凌晨4点执行
    public void performConsistencyCheck() {
        log.info("开始执行数据一致性校验");
        
        try {
            // 1. 获取同步配置
            List<SyncConfig> syncConfigs = getSyncConfigurations();
            
            for (SyncConfig config : syncConfigs) {
                try {
                    // 2. 统计数据库记录数
                    long dbCount = countDatabaseRecords(config);
                    
                    // 3. 统计ElasticSearch文档数
                    long esCount = countElasticSearchDocuments(config.getIndexName());
                    
                    // 4. 比较差异
                    if (dbCount != esCount) {
                        log.warn("数据不一致: index={}, dbCount={}, esCount={}, diff={}", 
                            config.getIndexName(), dbCount, esCount, Math.abs(dbCount - esCount));
                        
                        // 5. 触发差异修复
                        if (Math.abs(dbCount - esCount) > config.getMaxAllowedDiff()) {
                            triggerDiffRepair(config, dbCount, esCount);
                        }
                    } else {
                        log.info("数据一致性校验通过: index={}, count={}", config.getIndexName(), dbCount);
                    }
                    
                } catch (Exception e) {
                    log.error("一致性校验失败: index={}", config.getIndexName(), e);
                }
            }
            
        } catch (Exception e) {
            log.error("一致性校验任务执行失败", e);
        }
    }
    
    /**
     * 差异修复处理
     */
    private void triggerDiffRepair(SyncConfig config, long dbCount, long esCount) {
        try {
            if (dbCount > esCount) {
                // 数据库数据多于ES，需要补充同步
                log.info("触发增量同步修复: index={}, missing={}", 
                    config.getIndexName(), dbCount - esCount);
                performIncrementalSync(config);
                
            } else {
                // ES数据多于数据库，需要清理
                log.info("触发数据清理修复: index={}, extra={}", 
                    config.getIndexName(), esCount - dbCount);
                cleanupExtraDocuments(config);
            }
        } catch (Exception e) {
            log.error("差异修复失败: index={}", config.getIndexName(), e);
        }
    }
}

一致性监控与告警

// 一致性监控服务
@Component
public class ConsistencyMonitorService {
    private static final Logger log = LoggerFactory.getLogger(ConsistencyMonitorService.class);
    
    // 监控指标收集
    private final MetricsCollector metricsCollector;
    
    // 告警服务
    private final AlertService alertService;
    
    // 监控配置
    private final MonitorConfiguration config;
    
    public ConsistencyMonitorService(MetricsCollector metricsCollector, 
                                   AlertService alertService,
                                   MonitorConfiguration config) {
        this.metricsCollector = metricsCollector;
        this.alertService = alertService;
        this.config = config;
    }
    
    /**
     * 实时监控数据同步延迟
     */
    @Scheduled(fixedRate = 60000) // 每分钟检查一次
    public void monitorSyncLatency() {
        try {
            // 1. 获取所有同步任务
            List<SyncTask> syncTasks = getActiveSyncTasks();
            
            for (SyncTask task : syncTasks) {
                // 2. 计算同步延迟
                long syncDelay = calculateSyncDelay(task);
                
                // 3. 记录监控指标
                metricsCollector.recordSyncLatency(task.getIndexName(), syncDelay);
                
                // 4. 检查是否超过阈值
                if (syncDelay > config.getMaxAllowedDelay()) {
                    String alertMessage = String.format(
                        "同步延迟过高: index=%s, delay=%d秒, threshold=%d秒",
                        task.getIndexName(), syncDelay, config.getMaxAllowedDelay()
                    );
                    
                    log.warn(alertMessage);
                    
                    // 5. 发送告警
                    alertService.sendAlert(AlertLevel.WARNING, "SYNC_DELAY_HIGH", alertMessage);
                }
            }
            
        } catch (Exception e) {
            log.error("同步延迟监控失败", e);
        }
    }
    
    /**
     * 监控数据一致性指标
     */
    @Scheduled(fixedRate = 300000) // 每5分钟检查一次
    public void monitorConsistencyMetrics() {
        try {
            // 1. 获取一致性指标
            ConsistencyMetrics metrics = calculateConsistencyMetrics();
            
            // 2. 记录指标
            metricsCollector.recordConsistencyMetrics(metrics);
            
            // 3. 检查异常指标
            checkAbnormalMetrics(metrics);
            
        } catch (Exception e) {
            log.error("一致性指标监控失败", e);
        }
    }
    
    /**
     * 异常指标检查
     */
    private void checkAbnormalMetrics(ConsistencyMetrics metrics) {
        // 1. 检查同步失败率
        if (metrics.getSyncFailureRate() > config.getMaxFailureRate()) {
            String alertMessage = String.format(
                "同步失败率过高: failureRate=%.2f%%, threshold=%.2f%%",
                metrics.getSyncFailureRate() * 100, config.getMaxFailureRate() * 100
            );
            
            log.error(alertMessage);
            alertService.sendAlert(AlertLevel.CRITICAL, "SYNC_FAILURE_HIGH", alertMessage);
        }
        
        // 2. 检查数据差异率
        if (metrics.getDataDifferenceRate() > config.getMaxDifferenceRate()) {
            String alertMessage = String.format(
                "数据差异率过高: differenceRate=%.2f%%, threshold=%.2f%%",
                metrics.getDataDifferenceRate() * 100, config.getMaxDifferenceRate() * 100
            );
            
            log.error(alertMessage);
            alertService.sendAlert(AlertLevel.CRITICAL, "DATA_DIFFERENCE_HIGH", alertMessage);
        }
        
        // 3. 检查索引健康状态
        for (IndexHealth health : metrics.getIndexHealthList()) {
            if (health.getStatus() == IndexHealthStatus.RED) {
                String alertMessage = String.format(
                    "索引状态异常: index=%s, status=%s",
                    health.getIndexName(), health.getStatus()
                );
                
                log.error(alertMessage);
                alertService.sendAlert(AlertLevel.CRITICAL, "INDEX_STATUS_ABNORMAL", alertMessage);
            }
        }
    }
}

性能优化与最佳实践

搜索性能优化策略

// 搜索性能优化器
@Component
public class SearchPerformanceOptimizer {
    private static final Logger log = LoggerFactory.getLogger(SearchPerformanceOptimizer.class);
    
    // 缓存管理器
    private final CacheManager cacheManager;
    
    // 查询优化器
    private final QueryOptimizer queryOptimizer;
    
    // 索引优化器
    private final IndexOptimizer indexOptimizer;
    
    public SearchPerformanceOptimizer(CacheManager cacheManager,
                                    QueryOptimizer queryOptimizer,
                                    IndexOptimizer indexOptimizer) {
        this.cacheManager = cacheManager;
        this.queryOptimizer = queryOptimizer;
        this.indexOptimizer = indexOptimizer;
    }
    
    /**
     * 查询缓存优化
     */
    public SearchResult searchWithCache(String query, SearchOptions options) {
        // 1. 生成缓存键
        String cacheKey = generateCacheKey(query, options);
        
        // 2. 尝试从缓存获取
        SearchResult cachedResult = cacheManager.getSearchResult(cacheKey);
        if (cachedResult != null) {
            log.debug("查询缓存命中: query={}", query);
            return cachedResult;
        }
        
        // 3. 执行实际搜索
        SearchResult result = performSearch(query, options);
        
        // 4. 缓存结果
        if (result.isSuccess() && shouldCacheResult(result)) {
            cacheManager.putSearchResult(cacheKey, result, calculateCacheTTL(result));
        }
        
        return result;
    }
    
    /**
     * 查询优化执行
     */
    private SearchResult performSearch(String query, SearchOptions options) {
        try {
            // 1. 查询预处理优化
            String optimizedQuery = queryOptimizer.optimizeQuery(query);
            
            // 2. 搜索类型选择
            SearchStrategy strategy = selectSearchStrategy(optimizedQuery, options);
            
            // 3. 执行优化搜索
            SearchResult result = strategy.search(optimizedQuery, options);
            
            // 4. 结果后处理
            return postProcessResults(result, options);
            
        } catch (Exception e) {
            log.error("搜索执行失败: query={}", query, e);
            return SearchResult.failure(query, e.getMessage());
        }
    }
    
    /**
     * 搜索策略选择
     */
    private SearchStrategy selectSearchStrategy(String query, SearchOptions options) {
        // 1. 分析查询特征
        QueryCharacteristics characteristics = analyzeQuery(query);
        
        // 2. 根据特征选择策略
        if (characteristics.isExactMatchQuery()) {
            return new ExactMatchStrategy();
        } else if (characteristics.isFuzzyQuery()) {
            return new FuzzySearchStrategy();
        } else if (characteristics.isRangeQuery()) {
            return new RangeSearchStrategy();
        } else if (characteristics.isAggregationQuery()) {
            return new AggregationStrategy();
        } else {
            return new DefaultSearchStrategy();
        }
    }
    
    /**
     * 索引性能优化
     */
    public void optimizeIndex(String indexName) {
        try {
            log.info("开始索引优化: index={}", indexName);
            
            // 1. 分析索引状态
            IndexAnalysisResult analysis = indexOptimizer.analyzeIndex(indexName);
            
            // 2. 段合并优化
            if (analysis.needsSegmentMerge()) {
                optimizeSegments(indexName);
            }
            
            // 3. 分片重新平衡
            if (analysis.needsRebalancing()) {
                rebalanceShards(indexName);
            }
            
            // 4. 缓存优化
            if (analysis.needsCacheOptimization()) {
                optimizeCache(indexName);
            }
            
            // 5. 查询缓存预热
            warmUpQueryCache(indexName);
            
            log.info("索引优化完成: index={}", indexName);
            
        } catch (Exception e) {
            log.error("索引优化失败: index={}", indexName, e);
        }
    }
    
    /**
     * 性能基准测试
     */
    public void performanceBenchmark() {
        log.info("=== 搜索性能基准测试 ===");
        
        // 测试不同场景的性能表现
        SearchScenario[] scenarios = {
            new SearchScenario("简单关键词搜索", "技术", 1000),
            new SearchScenario("多关键词组合搜索", "高性能 架构 设计", 1000),
            new SearchScenario("模糊搜索", "技*", 1000),
            new SearchScenario("范围搜索", "createTime:[2024-01-01 TO 2024-12-31]", 1000),
            new SearchScenario("聚合搜索", "category:技术 AND avg(rating:>4)", 1000)
        };
        
        for (SearchScenario scenario : scenarios) {
            try {
                // 预热
                for (int i = 0; i < 100; i++) {
                    performSearch(scenario.getQuery(), SearchOptions.builder().limit(10).build());
                }
                
                // 正式测试
                long totalTime = 0;
                int successCount = 0;
                
                for (int i = 0; i < scenario.getIterations(); i++) {
                    long startTime = System.nanoTime();
                    SearchResult result = performSearch(scenario.getQuery(), 
                        SearchOptions.builder().limit(10).build());
                    long duration = System.nanoTime() - startTime;
                    
                    if (result.isSuccess()) {
                        totalTime += duration;
                        successCount++;
                    }
                }
                
                double avgLatency = successCount > 0 ? (double) totalTime / successCount / 1_000_000 : 0;
                double qps = successCount > 0 ? 1000.0 / (avgLatency / 1000.0) : 0;
                
                log.info("场景: {}, 平均延迟: {:.2f}ms, QPS: {:.2f}, 成功率: {:.2f}%", 
                    scenario.getName(), avgLatency, qps, 
                    (double) successCount / scenario.getIterations() * 100);
                
            } catch (Exception e) {
                log.error("性能测试失败: scenario={}", scenario.getName(), e);
            }
        }
    }
}

容量规划与扩展策略

// 容量规划服务
@Service
public class CapacityPlanningService {
    private static final Logger log = LoggerFactory.getLogger(CapacityPlanningService.class);
    
    // 容量计算器
    private final CapacityCalculator capacityCalculator;
    
    // 性能预测器
    private final PerformancePredictor performancePredictor;
    
    // 资源监控器
    private final ResourceMonitor resourceMonitor;
    
    public CapacityPlanningService(CapacityCalculator capacityCalculator,
                                 PerformancePredictor performancePredictor,
                                 ResourceMonitor resourceMonitor) {
        this.capacityCalculator = capacityCalculator;
        this.performancePredictor = performancePredictor;
        this.resourceMonitor = resourceMonitor;
    }
    
    /**
     * 容量规划分析
     */
    public CapacityPlan analyzeCapacityRequirements(CapacityRequirements requirements) {
        try {
            log.info("开始容量规划分析: requirements={}", requirements);
            
            // 1. 当前容量评估
            CurrentCapacity currentCapacity = assessCurrentCapacity();
            
            // 2. 未来需求预测
            FutureDemand predictedDemand = predictFutureDemand(requirements);
            
            // 3. 容量缺口分析
            CapacityGap capacityGap = analyzeCapacityGap(currentCapacity, predictedDemand);
            
            // 4. 扩展方案设计
            List<ScalingPlan> scalingPlans = designScalingPlans(capacityGap);
            
            // 5. 成本效益分析
            CostBenefitAnalysis costAnalysis = analyzeCostBenefit(scalingPlans);
            
            // 6. 生成容量规划报告
            CapacityPlan plan = CapacityPlan.builder()
                .currentCapacity(currentCapacity)
                .predictedDemand(predictedDemand)
                .capacityGap(capacityGap)
                .recommendedScalingPlans(scalingPlans)
                .costBenefitAnalysis(costAnalysis)
                .implementationTimeline(generateImplementationTimeline(scalingPlans))
                .build();
            
            log.info("容量规划分析完成: plan={}", plan);
            return plan;
            
        } catch (Exception e) {
            log.error("容量规划分析失败", e);
            throw new CapacityPlanningException("Failed to analyze capacity requirements", e);
        }
    }
    
    /**
     * 自动扩展决策
     */
    public ScalingDecision makeAutoScalingDecision() {
        try {
            // 1. 获取当前资源使用情况
            ResourceUsage currentUsage = resourceMonitor.getCurrentResourceUsage();
            
            // 2. 获取性能指标
            PerformanceMetrics performanceMetrics = resourceMonitor.getPerformanceMetrics();
            
            // 3. 评估扩展需求
            ScalingTrigger trigger = evaluateScalingNeed(currentUsage, performanceMetrics);
            
            if (trigger.isScalingNeeded()) {
                // 4. 确定扩展类型
                ScalingType scalingType = determineScalingType(trigger);
                
                // 5. 计算扩展规模
                ScalingMagnitude magnitude = calculateScalingMagnitude(trigger);
                
                // 6. 生成扩展决策
                ScalingDecision decision = ScalingDecision.builder()
                    .needed(true)
                    .scalingType(scalingType)
                    .magnitude(magnitude)
                    .priority(trigger.getPriority())
                    .estimatedImpact(estimateScalingImpact(scalingType, magnitude))
                    .build();
                
                log.info("自动扩展决策: decision={}", decision);
                return decision;
            }
            
            return ScalingDecision.noScalingNeeded();
            
        } catch (Exception e) {
            log.error("自动扩展决策失败", e);
            return ScalingDecision.noScalingNeeded();
        }
    }
    
    /**
     * 容量预警监控
     */
    @Scheduled(fixedRate = 300000) // 每5分钟检查一次
    public void capacityAlertMonitoring() {
        try {
            // 1. 获取当前容量使用情况
            CurrentCapacity currentCapacity = assessCurrentCapacity();
            
            // 2. 检查容量阈值
            List<CapacityAlert> alerts = checkCapacityThresholds(currentCapacity);
            
            // 3. 发送预警
            for (CapacityAlert alert : alerts) {
                sendCapacityAlert(alert);
            }
            
        } catch (Exception e) {
            log.error("容量预警监控失败", e);
        }
    }
}

最佳实践与案例分析

电商搜索系统案例

// 电商搜索系统实现
@RestController
@RequestMapping("/api/search")
public class EcommerceSearchController {
    private static final Logger log = LoggerFactory.getLogger(EcommerceSearchController.class);
    
    // 搜索服务
    private final ProductSearchService searchService;
    
    // 推荐服务
    private final RecommendationService recommendationService;
    
    // 缓存服务
    private final SearchCacheService cacheService;
    
    @Autowired
    public EcommerceSearchController(ProductSearchService searchService,
                                   RecommendationService recommendationService,
                                   SearchCacheService cacheService) {
        this.searchService = searchService;
        this.recommendationService = recommendationService;
        this.cacheService = cacheService;
    }
    
    /**
     * 商品搜索接口
     */
    @GetMapping("/products")
    public ApiResponse<ProductSearchResult> searchProducts(
            @RequestParam String keyword,
            @RequestParam(required = false) String category,
            @RequestParam(required = false) Double minPrice,
            @RequestParam(required = false) Double maxPrice,
            @RequestParam(required = false) String brand,
            @RequestParam(required = false) String sort,
            @RequestParam(defaultValue = "1") int page,
            @RequestParam(defaultValue = "20") int size) {
        
        try {
            log.info("商品搜索请求: keyword={}, category={}, page={}", keyword, category, page);
            
            // 1. 构建搜索请求
            ProductSearchRequest request = ProductSearchRequest.builder()
                .keyword(keyword)
                .category(category)
                .priceRange(PriceRange.of(minPrice, maxPrice))
                .brand(brand)
                .sortField(parseSortField(sort))
                .sortOrder(parseSortOrder(sort))
                .page(page)
                .size(size)
                .build();
            
            // 2. 检查缓存
            String cacheKey = generateCacheKey(request);
            ProductSearchResult cachedResult = cacheService.get(cacheKey);
            if (cachedResult != null) {
                log.debug("搜索缓存命中: key={}", cacheKey);
                return ApiResponse.success(cachedResult);
            }
            
            // 3. 执行搜索
            ProductSearchResult result = searchService.searchProducts(request);
            
            // 4. 获取推荐数据
            if (result.getProducts().isEmpty()) {
                List<Product> recommendations = recommendationService.getRecommendations(keyword);
                result.setRecommendations(recommendations);
            }
            
            // 5. 缓存结果
            cacheService.put(cacheKey, result, calculateCacheTTL(request));
            
            // 6. 记录搜索日志
            recordSearchLog(request, result);
            
            return ApiResponse.success(result);
            
        } catch (Exception e) {
            log.error("商品搜索失败: keyword={}", keyword, e);
            return ApiResponse.error("搜索失败，请稍后重试");
        }
    }
    
    /**
     * 自动补全接口
     */
    @GetMapping("/suggestions")
    public ApiResponse<List<String>> getSuggestions(@RequestParam String keyword) {
        try {
            // 1. 获取搜索建议
            List<String> suggestions = searchService.getSearchSuggestions(keyword);
            
            // 2. 记录建议日志
            recordSuggestionLog(keyword, suggestions);
            
            return ApiResponse.success(suggestions);
            
        } catch (Exception e) {
            log.error("获取搜索建议失败: keyword={}", keyword, e);
            return ApiResponse.success(Collections.emptyList());
        }
    }
    
    /**
     * 热门搜索接口
     */
    @GetMapping("/hot-keywords")
    public ApiResponse<List<HotKeyword>> getHotKeywords() {
        try {
            List<HotKeyword> hotKeywords = searchService.getHotKeywords(10);
            return ApiResponse.success(hotKeywords);
        } catch (Exception e) {
            log.error("获取热门搜索失败", e);
            return ApiResponse.error("获取失败");
        }
    }
}

日志分析系统案例

// 日志搜索分析系统
@Service
public class LogAnalysisService {
    private static final Logger log = LoggerFactory.getLogger(LogAnalysisService.class);
    
    // ElasticSearch客户端
    private final ElasticSearchClient esClient;
    
    // 日志解析器
    private final LogParser logParser;
    
    // 聚合分析器
    private final AggregationAnalyzer aggregationAnalyzer;
    
    public LogAnalysisService(ElasticSearchClient esClient,
                            LogParser logParser,
                            AggregationAnalyzer aggregationAnalyzer) {
        this.esClient = esClient;
        this.logParser = logParser;
        this.aggregationAnalyzer = aggregationAnalyzer;
    }
    
    /**
     * 日志搜索分析
     */
    public LogSearchResult searchLogs(LogSearchRequest request) {
        try {
            // 1. 构建搜索查询
            SearchSourceBuilder searchSource = buildLogSearchQuery(request);
            
            // 2. 添加聚合分析
            addLogAggregations(searchSource, request);
            
            // 3. 执行搜索
            SearchResponse response = esClient.search(
                SearchRequest.of(s -> s
                    .index("logs-*")
                    .source(searchSource)
                    .size(request.getSize())
                    .from(request.getFrom())
                )
            );
            
            // 4. 解析搜索结果
            LogSearchResult result = parseLogSearchResponse(response);
            
            // 5. 生成分析报告
            LogAnalysisReport report = generateAnalysisReport(result);
            result.setAnalysisReport(report);
            
            return result;
            
        } catch (Exception e) {
            log.error("日志搜索分析失败", e);
            throw new LogAnalysisException("Failed to search logs", e);
        }
    }
    
    /**
     * 实时日志监控
     */
    public void startRealTimeLogMonitoring(String application, LogMonitorCallback callback) {
        try {
            // 1. 创建持续查询
            String query = String.format("application:%s AND timestamp:>now-5m", application);
            
            // 2. 设置监控参数
            MonitorParams params = MonitorParams.builder()
                .query(query)
                .interval(Duration.ofSeconds(30))
                .callback(callback)
                .build();
            
            // 3. 启动监控
            startContinuousMonitoring(params);
            
            log.info("实时日志监控启动: application={}", application);
            
        } catch (Exception e) {
            log.error("实时日志监控启动失败: application={}", application, e);
            throw new LogMonitoringException("Failed to start log monitoring", e);
        }
    }
    
    /**
     * 异常日志分析
     */
    public ExceptionAnalysisResult analyzeExceptions(String timeRange, String application) {
        try {
            // 1. 构建异常查询
            SearchSourceBuilder searchSource = SearchSourceBuilder.of(s -> s
                .query(q -> q
                    .bool(b -> b
                        .must(m -> m.match(t -> t.field("level").query("ERROR")))
                        .must(m -> m.range(r -> r
                            .field("@timestamp")
                            .gte(timeRange)
                        ))
                        .must(m -> m.match(t -> t.field("application").query(application)))
                    )
                )
                .aggregation("exception_types", a -> a
                    .terms(t -> t
                        .field("exception.type.keyword")
                        .size(20)
                    )
                )
                .aggregation("exception_trend", a -> a
                    .dateHistogram(d -> d
                        .field("@timestamp")
                        .calendarInterval(CalendarInterval.HOUR)
                    )
                )
                .size(0)
            );
            
            // 2. 执行搜索
            SearchResponse response = esClient.search(
                SearchRequest.of(s -> s
                    .index("logs-*")
                    .source(searchSource)
                )
            );
            
            // 3. 分析异常模式
            ExceptionAnalysisResult result = analyzeExceptionPatterns(response);
            
            // 4. 生成异常报告
            ExceptionReport report = generateExceptionReport(result);
            result.setReport(report);
            
            return result;
            
        } catch (Exception e) {
            log.error("异常日志分析失败", e);
            throw new LogAnalysisException("Failed to analyze exceptions", e);
        }
    }
}