大数据与AI实验室-优快云博客

原创【Elasticsearch】索引状态管理（ISM）实战（万字长文）

本文详细介绍了 OpenDistro 的 ISM（Index State Management）功能，并与 Elasticsearch 的 ILM 进行了对比。ISM 是 AWS OpenDistro 开源方案，采用 Apache 2.0 许可证，而 ILM 是 Elastic 官方商业功能。ISM 为开源用户提供了完善的索引生命周期管理方案，适合需要免费自动化索引管理的场景。

2025-11-30 20:47:43 1621

原创【Elasticsearch】索引别名 aliases

本文探讨了 Elasticsearch 索引别名与写入索引的关系。主要内容包括：（1）错误演示：当多个索引同时设置为同一别名的写入索引时会报错；（2）三种解决方案：先移除旧索引写入权限再设置新索引、使用原子操作一次性切换、创建时不设置写入索引后续再切换；（3）验证方法：查看别名指向的索引和当前写入索引；（4）实际应用场景：基于时间的索引滚动和索引重建。文章强调一个别名可指向多个索引，但只能有一个写入索引，这种机制是实现索引滚动等高级功能的基础。

2025-11-30 11:47:49 1171

原创【Elasticsearch】索引字段设置 “index”: false 的作用

本文解释了 Elasticsearch 中 "index": false 的作用，澄清了该设置仅禁止字段被搜索和聚合，但仍允许在结果中返回。通过图书馆的比喻，说明不可搜索字段如同没有索引卡片的书籍，虽无法通过关键词查找，但可直接获取。文章演示了如何通过 _source 控制字段返回，并列举了密码字段、原始请求数据等典型应用场景。最后对比了不同操作对 index 和 _source 的依赖关系，帮助用户正确理解和使用这一配置。

2025-11-29 23:46:34 736 1

原创【Elasticsearch】动手创建一个索引

本文介绍了 Elasticsearch 索引创建与配置的完整流程。主要内容包括：1）创建名为 test-index 的索引，配置3个主分片和1个副本，设置15秒刷新频率，并定义 log-index 别名作为写入索引；2）索引包含多种字段类型（日期、关键词、文本、数值、布尔值等），特别针对中文文本配置了IK分词器；3）详细说明了默认摄入管道的功能，它可以在数据索引前进行预处理和转换；4）解释了字段数据统计机制（fielddata 和 doc_values）的作用，使文本字段支持排序和聚合操作。

2025-11-28 22:38:51 1064

原创【云计算】云平台上的权限管理（二）：VDC 与企业项目

VDC（虚拟数据中心）与企业项目在云平台权限管理中协同作用，而非相互替代。企业项目作为资源分组和财务核算单位，关注“谁花钱”和项目归属；VDC 则提供底层技术隔离，定义资源分配、网络架构等基础规则。关键区别在于：企业项目是逻辑分组，依赖标签系统；VDC 实现强隔离，构建独立资源池。

2025-11-25 23:33:03 770

原创【云计算】云平台上的权限管理（一）：虚拟数据中心 VDC

总而言之，VDC 不仅仅是一个资源集合的概念，更是一个强大的组织和治理工具。它通过将混合云复杂的物理和逻辑资源，封装成符合企业业务逻辑的、自包含的单元，从而使得大规模云环境的权限管理、资源治理和运维自动化变得可行、高效和安全。它是企业实现 “云治理” 而非 “云混乱” 的基石。

2025-11-22 13:08:02 700

原创【Java】Java 运行时数据区域（二）：案例讲解

本文通过一个Java代码示例详细讲解了运行时数据区域的协同工作过程。程序启动时，方法区存储类结构、静态变量和方法字节码；执行new操作时在堆中创建对象实例；虚拟机栈存储方法调用的栈帧和局部变量；程序计数器记录指令地址。重点演示了递归调用导致栈溢出的场景，并说明了直接内存和本地方法栈的作用。最后通过表格总结了各代码部分对应的数据区域，清晰展示了栈存引用、堆存对象、方法区存类蓝图的协作机制。

2025-11-21 23:58:53 855

原创【Java】Java 运行时数据区域（一）：名词概念

Java 运行时数据区域分为线程私有和共享区域。线程私有区域包括程序计数器（记录字节码指令地址）、虚拟机栈（存储方法栈帧）和本地方法栈（服务于 Native 方法）。共享区域包括 Java 堆（存放对象实例，GC 主战场）和方法区（存储类信息、常量等）。此外，直接内存（NIO 使用的堆外内存）虽不属于运行时数据区，但也会影响内存分配。各区域可能抛出 StackOverflowError 或 OutOfMemoryError 异常。JDK8 后方法区由永久代改为元空间实现。

2025-11-21 23:58:06 846

原创【人工智能】OpenAI 重磅推出 Sora2

OpenAI 推出新一代视频生成模型 Sora2，在视频质量、音画同步、可控性等方面显著提升，新增个性化 Cameo 功能及社交平台 Sora App。Sora2 标志着AI视频从"可用"到"好用"的跨越，同时完善了安全审核、肖像保护等内容治理机制。

2025-10-08 23:42:20 1210

原创【Linux】MobaXterm 工具介绍

MobaXterm 的核心价值在于：集成与便携。它通过一个统一的平台，集成了多种分散的工具，极大地提升了工作效率，特别适合需要频繁与远程系统（尤其是 Linux / Unix）打交道的用户。无论是开发者、IT 支持还是科研人员，它都能成为你手中那把得心应手的“瑞士军刀”。

2025-10-06 23:02:37 1887 1

原创【软件测试】Fortify 代码安全扫描

Fortify 是一套由 Micro Focus（现属 OpenText）公司开发的、业界领先的静态应用程序安全测试工具集。它的核心任务是帮助开发者在软件开发生命周期的早期发现、分析和修复源代码中的安全漏洞和质量缺陷。您可以把它想象成一个功能极其强大的 “代码安全扫描仪” 或 “安全专家助手”。

2025-09-27 14:21:06 1119

原创【网络】测试 IP 端口连通性方法总结

ping 命令本身使用的是 ICMP 协议，它只能测试到 IP 地址的连通性，无法检测特定端口的状态。要检查 IP 地址的特定端口是否开放，需要使用其他工具。最常用和简单的方法是使用 telnet 命令，或者在 Windows 上使用更现代的 Test-NetConnection PowerShell 命令。

2025-09-27 12:09:40 2778

原创【安全】TLS 协议介绍

TLS（传输层安全协议，Transport Layer Security）是一种加密协议，旨在为计算机网络通信提供安全和数据完整性保障。你几乎每天都在使用它，当你在浏览器中看到地址栏有一个小锁图标时，就表示你正在使用 TLS。它的前身是更广为人知的 SSL（安全套接字层），因此人们也常称之为 SSL/TLS。

2025-09-26 22:55:51 1835

原创【云计算】存（云主机）算（云硬盘）分离

公有云的 “存算分离” 架构通过将计算与存储在物理、网络和管理层面彻底解耦，利用高速网络连接和强大的分布式存储系统，实现了高可用、弹性伸缩、成本优化、灵活数据管理等核心优势。它解决了传统紧耦合架构中计算节点故障导致数据不可用、资源扩展不灵活、存储利用率低等问题，是现代云原生应用和有状态服务在云上运行的基石架构。虽然存在网络延迟、缓存一致性等挑战，但云厂商持续的网络优化和分布式存储技术的进步，使得存算分离的性能和可靠性已能满足绝大多数企业级应用的需求。

2025-08-04 14:00:00 1182

原创【云计算】对象存储（以图书馆找书为案例说明）

用一句话概括对象存储：它像一个拥有无限空间的智能仓库，你给每件物品（数据）贴上一个唯一且复杂的条形码（ID）和一个超大信息标签（元数据），然后仓库系统会自动把它扔到某个位置（分布式存储），并且偷偷复制几份藏到别处（冗余）。你需要时，只要报出条形码，系统就能瞬间从茫茫货海中把它找出来给你。

2025-08-04 10:00:00 1116

原创【云计算】云主机的亲和性策略（四）：云主机组

本文详细探讨了云主机组在实现亲和性与反亲和性策略中的应用。云主机组作为策略载体，通过显式声明组策略类型来约束虚拟机调度。文章分析了调度器的工作流程，包括策略存储、宿主机筛选和最优选择等关键步骤，并比较了 AWS、Azure 等主流云平台的实现差异。此外，还介绍了标签选择器等其他实现方法，特别是 Kubernetes 中的节点亲和性和 Pod反亲和性配置。这些技术可确保关键业务分散部署，避免单点故障，提升系统可用性。

2025-08-02 10:54:18 1440

原创【云计算】云主机的亲和性策略（三）：云主机 & 宿主机

本文阐述了云主机与宿主机的核心关系及技术原理。云主机通过虚拟化技术在宿主机上创建，共享底层硬件资源但相互隔离，类似公寓与大楼的关系。关键点包括：虚拟化层实现资源隔离与调度；资源超卖、快速弹性和故障隔离是主要优势；但存在“吵闹邻居”、性能损耗等风险。公有云中用户无需感知宿主机，由云平台统一调度。文章还对比了容器与裸金属服务器的差异，强调理解这一关系对云架构设计的重要性。

2025-08-02 09:38:38 1378

原创【云计算】云主机的亲和性策略（二）：集群节点组

本文通过云计算场景中的集群节点组（Master/Core/Task）和宿主机调度，解释了反亲和性策略的实现过程。通过创建不同严格程度的反亲和性组，确保关键节点（Master/Core）分散部署以提升高可用性，同时允许弹性计算节点（Task）适度集中以优化资源利用率。文章还模拟了宿主机故障场景，验证了分层反亲和策略的有效性，并分析了不同节点组采用差异化策略的设计考量。

2025-08-01 10:15:00 1376

原创【云计算】云主机的亲和性策略（一）：快乐旅行团

本文通过旅行团分车的生动比喻，解释了云主机组的反亲和性策略原理。文章将 30 名员工类比为 30 台云主机，大巴车对应宿主机，安全分散组对应反亲和性云主机组。调度员（云平台调度器）根据 "同一部门员工必须分散在不同车辆" 的规则进行分配，确保单点故障时影响最小化。相比自由选座、标签分组或指定车队等方法，云主机组策略具有用户省心、调度高效和故障隔离三大优势。文章还补充了 "车辆不足" 等现实场景的技术对应，最终强调这种智能分散策略能有效保障业务连续性。

2025-08-01 10:00:00 2286

原创【ELasticsearch】集群故障模拟方案（二）：磁盘空间满、重选主节点

本文介绍了 Elasticsearch 集群故障模拟的两种场景：磁盘空间满和主节点选举问题。针对磁盘空间满模拟，详细说明了通过 dd 和 fallocate 命令快速填充磁盘的方法，对比了两种命令的差异及适用场景，同时提供了集群状态监控和清理方案。对于主节点选举问题，给出了识别主节点、停止主节点服务并观察选举过程的步骤。最后强调了安全注意事项和关键监控指标，为测试集群容错能力提供指导。全文包含具体命令示例和参数说明，适合运维人员参考实施。

2025-07-31 10:15:00 1439

原创【ELasticsearch】集群故障模拟方案（一）：节点宕机、节点离线

本文介绍了两种 Elasticsearch 集群故障模拟方案。节点宕机模拟：通过 kill 进程或停止服务强制终止节点，观察集群响应和恢复情况；节点网络隔离模拟：使用 iptables 阻断节点间的 9300 端口通信，测试集群容错机制。两种方案均包含详细的操作步骤、命令解释和恢复方法，特别说明了 iptables 规则的作用原理及注意事项。该方案可用于验证 Elasticsearch 集群的容错能力和故障恢复机制。

2025-07-31 10:00:00 1976

原创【ELasticsearch】案例：AWS 上 Elasticsearch 对接 NLB / ALB

本文详细介绍了在 AWS 上通过 NLB/ALB 对接 Elasticsearch 集群的方案。重点说明如何配置专用协调节点作为请求入口，并创建 NLB 或 ALB 进行负载均衡。关键配置包括节点角色设置、安全组规则、健康检查策略，以及客户端访问方式。架构实现了流量入口与数据处理的分离，协调节点处理请求聚合，数据节点专注分片操作，主节点负责集群管理。对比显示 NLB 更适合 ES场景，因其高性能、低延迟和源 IP 保留特性。该方案显著提升了 Elasticsearch 在云环境下的可用性和扩展性。

2025-07-28 15:00:00 1480

原创【ELasticsearch】搭建有负载均衡 ELB 的 ES 集群

本文探讨了在公有云上为 Elasticsearch 集群封装 ELB 负载均衡器的设计优势。ELB 提供单一入口点，简化客户端配置，实现高可用性、负载均衡和集群可扩展性，同时增强安全性。相比直接连接 ES 节点，ELB 方案降低了客户端复杂度，避免了单点故障风险，并优化了流量分发。文中指出，ELB 应仅对接专用协调节点而非所有节点，以提升性能并确保集群稳定性。这是生产环境中 ES 集群部署的最佳实践，特别适用于中大规模集群场景。

2025-07-28 14:00:00 807

原创【ELasticsearch】温、冷数据节点能是同一个节点吗

在 Elasticsearch 中，虽然技术上可以让一个节点同时承担“温”和“冷”数据层的角色，但这通常不是最佳实践。温层节点需要较好的 CPU、内存和高速磁盘以支持查询，而冷层节点侧重低成本、高密度存储。混合部署会导致硬件需求冲突、资源干扰风险，增加管理复杂度，并削弱分层存储的优化效果。建议在生产环境中使用独立的物理节点分别作为温节点和冷节点，以实现性能隔离和成本效益。仅在小规模测试或开发环境中可考虑临时混合配置。

2025-07-27 13:48:31 1595

原创【ELasticsearch】节点角色分离最佳实践

本文介绍了一个分层 Elasticsearch 生产集群设计方案，包含热、温、冷、冷冻四层存储架构。热层采用高性能 NVMe SSD 处理实时写入和高频查询；温层使用 SAS SSD 存储近期访问数据；冷层配置大容量 HDD 存储历史数据；冷冻层则结合对象存储实现长期归档。文章详细说明了各层的硬件配置、节点角色设置和分片策略，并提供了数据流动逻辑示意图和 ILM 策略示例。该架构通过严格分层实现了性能隔离和成本优化，SSD 使用量减少 70% 以上，存储成本可降低 5 倍，同时保持灵活的扩展性和合规性。

2025-07-27 11:18:02 1299

原创【ELasticsearch】节点角色分类与作用解析

ELasticsearch 集群通过角色隔离实现性能与稳定性的平衡 —— 热层追求速度，协调层消化流量，主节点专注决策，温冷层优化成本。各角色各司其职，构建高可用分布式系统。

2025-07-26 18:40:16 1907 1

原创【Elasticsearch】跨集群检索（Cross-Cluster Search）

跨集群检索（CCS）是 Elasticsearch 应对分布式数据挑战的利器，完美实现了 “数据物理分散，逻辑集中查询”。它解决了数据驻留、扩展性、简化应用访问等核心问题。然而，其性能高度依赖网络，且在生产中需谨慎处理版本兼容性、安全配置、网络优化、监控运维以及理解其功能限制（如不支持事务）。合理规划和配置 CCS，能极大地提升大规模、分布式 Elasticsearch 部署的灵活性和价值。

2025-07-23 22:38:56 1135 1

原创【Elasticsearch】快照生命周期管理 SLM（实战篇）

本文详细介绍了 Elasticsearch 快照生命周期管理 SLM 的实战应用，以电商平台日志集群为例，展示如何实现自动化备份与保留策略。

2025-07-23 10:15:00 1719

原创【Elasticsearch】快照生命周期管理 SLM（理论篇）

Elasticsearch 的快照生命周期管理（SLM）和索引生命周期管理（ILM）是两大核心数据治理工具。SLM 专注于自动化备份与恢复，通过定时创建/删除快照（如每日备份至 S3）确保灾备能力；ILM 则优化在线数据存储，将索引按热、温、冷阶段分层迁移，最终自动删除过期数据。两者核心区别在于：SLM 操作快照副本（外部仓库），由时间触发；ILM 管理原始索引（集群内部），基于年龄/大小等条件。典型协作场景中，ILM 处理数据的"生老病死"，SLM 负责"拍遗照"留存，共同实现存储成本优化与数据可恢复性。

2025-07-22 10:30:00 1180

原创【Elasticsearch】安全地删除快照仓库、快照

本文详细解析了 Elasticsearch 中删除快照仓库和快照的安全机制。删除仓库操作仅移除集群内的注册信息，不会删除底层存储中的实际快照数据。要彻底清理物理数据，需在删除仓库前通过 API 删除快照，或直接操作存储系统。删除单个快照时，系统会智能清理仅被该快照引用的段文件，保留被其他快照共享的数据。这种基于引用计数的增量快照机制确保了删除操作的安全性，不会影响其他快照的完整性。文章通过乐高积木的比喻形象说明了快照间的数据共享关系。

2025-07-22 10:15:00 1022

原创【Elasticsearch】快照与恢复功能详解

Elasticsearch 的快照与恢复是一个强大、灵活且高效的机制，是任何严肃的生产部署不可或缺的一部分。通过理解其增量备份原理、仓库管理、SLM 自动化以及细致的恢复策略（特别是 include_global_state 的处理），Elasticsearch 工程师能够构建可靠的数据保护、迁移和灾难恢复方案。切记：备份的价值只有在成功恢复时才能体现，因此定期的恢复演练至关重要。

2025-07-21 10:30:00 1008

原创【Elasticsearch】Elasticsearch 跨机房部署

Elasticsearch 跨机房部署需综合考虑网络延迟、带宽和稳定性，通过分片分配感知、副本策略和主节点分布确保高可用。配置应包含机架/机房标记、GC 调优和跨机房专线，并实施快照策略和故障转移测试。某跨境电商案例采用三地部署，通过 CCR 实现数据同步，故障时 28 秒内完成切换，支持日均 5 亿次搜索，延迟控制在 150ms 内，达到 99.99% 可用性。关键经验包括奇数主节点分布、动态副本调整和实时监控网络指标与分片状态。

2025-07-21 10:15:00 684

原创【Elasticsearch】合适的锅炒合适的菜：性能与成本平衡原理公式解析

让最新鲜的食材用最快的灶台，老火靓汤用柴慢慢煨，既保住招牌菜口碑，又省下真金白银。

2025-07-20 09:47:39 1449

原创【Elasticsearch】冷热集群架构

冷热集群架构（Hot-Warm Architecture）是一种将 Elasticsearch 集群节点按数据访问频率划分为热、温、冷三层的部署模式。热层处理最新写入数据，温层存储常查询数据，冷层归档极少访问数据。该架构具有显著的成本效益、性能优化和自动化数据生命周期管理等优势。典型应用场景包括电商订单系统和物联网监控系统。搭建时需合理规划硬件配置，通过节点角色标记和 ILM 策略实现数据自动迁移，并监控数据分布情况。

2025-07-20 09:45:48 1619

原创【人工智能】AI Agent 实战：使用 Dify 搭建个人在线旅游助手

本文介绍了使用 Dify 平台搭建个人在线旅游助手 AI Agent 的实战教程。文章分为准备工具、构建 Agent 和优化输入三个部分：首先需要配置 Google 搜索、webscraper 爬虫和 Wikipedia 工具；然后通过创建空白 Agent 应用并添加这些工具；最后通过设置变量（目的地、旅行天数、预算）来规范化用户输入。教程包含详细操作步骤和示例输出，展示了如何打造一个能提供酒店推荐、行程规划等服务的 AI 旅游助手，帮助用户掌握 Agent 构建、提示词撰写和变量使用等核心技能。

2025-07-19 09:54:11 1800

空空如也

空空如也