大数据与AI实验室-优快云博客

原创【2025年度总结】“被动输入” 到 “主动输出”：一场认知的生死突围

本文探讨了从被动学习到主动输出的认知转变。作者通过亲身经历指出，被动输入容易造成“学会的幻觉”，而主动输出才能带来真正的知识内化。文章分析了主动输出的三大价值：暴露认知盲点、加深记忆刻痕、提升技术判断力，并揭示了大多数人停留在被动学习的心理舒适区原因。作者分享了自己从“输出恐惧”到“输出上瘾”的转变过程，提出“先定输出目标再学习”的逆向思维模式，强调在信息爆炸时代，主动输出是构建个人认知体系的生存策略。最后给出具体建议：从小切口深挖开始，接受不完美发布，建立输出倒逼输入的良性循环。

2026-01-03 17:03:15 935

原创【Elasticsearch】查询性能调优（七）：为什么计数对性能影响如此之大？

计数操作在分布式系统（如 Elasticsearch）中性能开销远高于理论上的 O(N) 复杂度，主要原因包括：（1）存储层级开销：需扫描多个 Lucene 段文件，涉及磁盘 I/O 和内存访问；（2）分布式协调成本：需合并多个分片结果，网络通信和内存合并可能触发断路器；（3）查询复杂度：涉及评分计算、聚合等额外处理。建议非必要场景禁用精确计数（track_total_hits=false），或限制计数范围。

2025-12-31 23:07:53 1173

原创【Elasticsearch】查询性能调优（六）：track_total_hits 影响返回结果的相关性排序吗

track_total_hits 参数仅影响 Elasticsearch 查询结果的总数统计精度，完全不影响文档的相关性排序。查询过程分为两个独立阶段：文档收集与排序（由 sort 和 query 参数控制）和总数统计（由 track_total_hits 控制）。实验证明，即使调整 track_total_hits 的值，返回的文档顺序始终一致。真正影响排序的因素包括：排序字段定义、查询类型、评分函数及搜索类型。在业务场景中，应明确区分计数参数与相关性参数，避免混淆。

2025-12-30 23:13:59 1351

原创【Elasticsearch】查询性能调优（五）：如何确保 “最相关” 的结果

Elasticsearch 默认能保证单次查询返回的前 N 条结果是最相关的，但需满足特定条件。关键影响因素包括排序方式（默认按 _score 降序）和分片机制（各分片先返回本地 Top N 再合并）。破坏相关性的常见场景包括：使用 terminate_after 提前终止查询、多字段排序导致权重失衡，以及分片间数据分布不均。解决方案包括：1）使用 dfs_query_then_fetch 模式获取全局统计信息；2）优化分片策略（如单分片）；3）通过 function_score 自定义评分脚本。

2025-12-28 21:17:48 1163

原创【Elasticsearch】查询性能调优（四）：计数的精确性探讨

本文探讨了计数在用户体验、业务决策和查询优化中的重要性，同时分析了精确计数的高昂代价。文章指出，Elasticsearch 采用"足够好"的工程理念，通过提供不同精度的计数选项（近似计数、上限精确计数和完全精确计数）来平衡性能与准确性。这种分层设计允许用户根据具体场景选择适合的精度级别，既满足了基本需求又避免了不必要的性能损耗。

2025-12-28 11:31:31 975

原创【Elasticsearch】查询性能调优（三）：track_total_hits 和 terminate_after 可能的冲突

track_total_hits 和 terminate_after 在 Elasticsearch 中结合使用时可能产生冲突。terminate_after 会优先触发，在达到指定匹配数后立即终止查询，导致 track_total_hits 无法完成精确计数。

2025-12-28 09:27:13 803

原创【Elasticsearch】查询性能调优（二）：SQL LIMIT 和 terminate_after 对比

本文详细分析了 Elasticsearch 中三种关键查询参数的区别与联系。terminate_after：真正的 LIMIT 机制，达到指定数量立即停止扫描，显著提升查询速度但可能返回不足量结果。track_total_hits：仅限制精确计数值，不影响结果返回，适合大数据集近似统计。size：传统分页参数，需要完整扫描和排序，内存消耗大。通过工作流程代码示例、实际行为对比和 SQL 类比，文章揭示了各参数的本质差异，并提供了场景测试数据和应用建议。

2025-12-27 20:51:16 1085

原创【Elasticsearch】查询性能调优（一）：性能保护参数详解

本文介绍了 Elasticsearch 查询性能调优的关键参数和方法。主要包括三个核心保护参数：timeout 设置查询超时时间，terminate_after 限制最大返回文档数，track_total_hits 控制命中数计算。同时分析了 composite 聚合的分页机制及其内存优势。通过流程图展示了完整查询流程，并比较了有无保护参数的实际执行差异。最后提出了分层查询策略等优化建议，帮助开发者平衡查询深度与系统负载。这些措施能有效防止复杂查询耗尽资源，保障集群稳定性。

2025-12-27 16:33:38 1136

原创【Elasticsearch】大慢查询隔离（二）：选择插件

本文分类介绍了 Elasticsearch 中用于查询隔离、限流和保护的主要插件。首先介绍了官方和主流插件如 Search Guard 和 ReadonlyREST，它们提供基于角色的查询限制、速率控制等功能。其次介绍了专用查询管理插件 Query Guard 和 Search Profiler，专注于查询保护和诊断。文章还展示了自定义开发插件的示例代码，以及监控告警插件如 HQ 和 Prometheus 的配置方法。这些插件共同构成了 Elasticsearch 查询隔离和保护的技术方案。

2025-12-13 22:48:41 983

原创【Elasticsearch】大慢查询隔离（一）：最佳实践

Elasticsearch 的大慢查询隔离机制通过资源限制和队列隔离防止耗时查询影响集群性能。核心配置包括线程池隔离、查询级限制（如超时设置、文档数限制）和索引级参数控制。最佳实践建议采用分层架构、读写分离和冷热数据分离策略，同时结合慢查询日志监控和用户权限控制。该机制需在性能保护与业务需求间取得平衡，通过动态调整和查询优化保障集群稳定性，避免单个慢查询导致系统雪崩。

2025-12-13 17:10:57 519

原创【云计算】云平台权限治理（六）：企业项目的管理结构

VDC 是“资源容器和管理边界”，它天生就是深层的树形结构，用于构建治理体系。企业项目是“逻辑分组和成本中心”，它通常是扁平或浅层树形，用于构建财务和项目管理体系。它们的最佳实践是协同工作，而不是相互替代。使用 VDC 的树形结构来构建你云上资源的 “行政管理骨架”，实现隔离、安全和权限下放。使用企业项目在这个骨架上，按照业务项目、成本中心等进行“横向切分”，实现精准的成本核算和项目管理。

2025-12-07 20:28:38 998

原创【云计算】云平台权限治理（五）：VDC 的树形管理结构

VDC 的树形管理结构是将企业复杂的行政管理和资源分配逻辑，直接翻译成云平台操作语言的一种强大范式。它不仅是技术上的资源划分，更是一套完整的、反映企业运营方式的治理模型。

2025-12-07 16:44:02 1277 1

原创【云计算】云平台权限治理（四）：VDC、企业项目、用户组

公有云通过 “账户（天然 VDC）+ 企业项目 + IAM 用户组” 这三驾马车，实现了混合云中通过 “VDC + 企业项目 + 用户组” 所要达成的同等甚至更精细的治理目标。这就是为什么会在混合云平台上更清晰地看到 VDC 这个概念，因为它需要被作为一个显性的、可交付的产品功能来设计和售卖。

2025-12-06 22:03:34 1255

原创【云计算】云平台权限治理（三）：为什么公有云没有 VDC ？

公有云通常没有明确的 VDC 概念，而混合云/私有云则广泛采用 VDC，这源于两者不同的目标客户和交付模式。公有云面向单个企业内的团队或开发者，其账户本身已提供强隔离，通过多账户体系和企业项目实现类似 VDC 的功能。而混合云/私有云服务于单一大型组织，需要在同一租户内为多个部门创建隔离的"子租户"，VDC 作为标准化的IT服务交付单元，封装了底层异构资源的复杂性。

2025-12-06 19:57:41 636

原创【Elasticsearch】索引状态管理（ISM）实战（万字长文）

本文详细介绍了 OpenDistro 的 ISM（Index State Management）功能，并与 Elasticsearch 的 ILM 进行了对比。ISM 是 AWS OpenDistro 开源方案，采用 Apache 2.0 许可证，而 ILM 是 Elastic 官方商业功能。ISM 为开源用户提供了完善的索引生命周期管理方案，适合需要免费自动化索引管理的场景。

2025-11-30 20:47:43 1792

原创【Elasticsearch】索引别名 aliases

本文探讨了 Elasticsearch 索引别名与写入索引的关系。主要内容包括：（1）错误演示：当多个索引同时设置为同一别名的写入索引时会报错；（2）三种解决方案：先移除旧索引写入权限再设置新索引、使用原子操作一次性切换、创建时不设置写入索引后续再切换；（3）验证方法：查看别名指向的索引和当前写入索引；（4）实际应用场景：基于时间的索引滚动和索引重建。文章强调一个别名可指向多个索引，但只能有一个写入索引，这种机制是实现索引滚动等高级功能的基础。

2025-11-30 11:47:49 1499

原创【Elasticsearch】索引字段设置 “index”: false 的作用

本文解释了 Elasticsearch 中 "index": false 的作用，澄清了该设置仅禁止字段被搜索和聚合，但仍允许在结果中返回。通过图书馆的比喻，说明不可搜索字段如同没有索引卡片的书籍，虽无法通过关键词查找，但可直接获取。文章演示了如何通过 _source 控制字段返回，并列举了密码字段、原始请求数据等典型应用场景。最后对比了不同操作对 index 和 _source 的依赖关系，帮助用户正确理解和使用这一配置。

2025-11-29 23:46:34 839 1

原创【Elasticsearch】动手创建一个索引

本文介绍了 Elasticsearch 索引创建与配置的完整流程。主要内容包括：1）创建名为 test-index 的索引，配置3个主分片和1个副本，设置15秒刷新频率，并定义 log-index 别名作为写入索引；2）索引包含多种字段类型（日期、关键词、文本、数值、布尔值等），特别针对中文文本配置了IK分词器；3）详细说明了默认摄入管道的功能，它可以在数据索引前进行预处理和转换；4）解释了字段数据统计机制（fielddata 和 doc_values）的作用，使文本字段支持排序和聚合操作。

2025-11-28 22:38:51 1251

原创【云计算】云平台权限治理（二）：VDC 与企业项目

VDC（虚拟数据中心）与企业项目在云平台权限管理中协同作用，而非相互替代。企业项目作为资源分组和财务核算单位，关注“谁花钱”和项目归属；VDC 则提供底层技术隔离，定义资源分配、网络架构等基础规则。关键区别在于：企业项目是逻辑分组，依赖标签系统；VDC 实现强隔离，构建独立资源池。

2025-11-25 23:33:03 1113

原创【云计算】云平台权限治理（一）：虚拟数据中心 VDC

总而言之，VDC 不仅仅是一个资源集合的概念，更是一个强大的组织和治理工具。它通过将混合云复杂的物理和逻辑资源，封装成符合企业业务逻辑的、自包含的单元，从而使得大规模云环境的权限管理、资源治理和运维自动化变得可行、高效和安全。它是企业实现 “云治理” 而非 “云混乱” 的基石。

2025-11-22 13:08:02 830

原创【Java】Java 运行时数据区域（二）：案例讲解

本文通过一个Java代码示例详细讲解了运行时数据区域的协同工作过程。程序启动时，方法区存储类结构、静态变量和方法字节码；执行new操作时在堆中创建对象实例；虚拟机栈存储方法调用的栈帧和局部变量；程序计数器记录指令地址。重点演示了递归调用导致栈溢出的场景，并说明了直接内存和本地方法栈的作用。最后通过表格总结了各代码部分对应的数据区域，清晰展示了栈存引用、堆存对象、方法区存类蓝图的协作机制。

2025-11-21 23:58:53 900

原创【Java】Java 运行时数据区域（一）：名词概念

Java 运行时数据区域分为线程私有和共享区域。线程私有区域包括程序计数器（记录字节码指令地址）、虚拟机栈（存储方法栈帧）和本地方法栈（服务于 Native 方法）。共享区域包括 Java 堆（存放对象实例，GC 主战场）和方法区（存储类信息、常量等）。此外，直接内存（NIO 使用的堆外内存）虽不属于运行时数据区，但也会影响内存分配。各区域可能抛出 StackOverflowError 或 OutOfMemoryError 异常。JDK8 后方法区由永久代改为元空间实现。

2025-11-21 23:58:06 887

原创【人工智能】OpenAI 重磅推出 Sora2

OpenAI 推出新一代视频生成模型 Sora2，在视频质量、音画同步、可控性等方面显著提升，新增个性化 Cameo 功能及社交平台 Sora App。Sora2 标志着AI视频从"可用"到"好用"的跨越，同时完善了安全审核、肖像保护等内容治理机制。

2025-10-08 23:42:20 1276

原创【Linux】MobaXterm 工具介绍

MobaXterm 的核心价值在于：集成与便携。它通过一个统一的平台，集成了多种分散的工具，极大地提升了工作效率，特别适合需要频繁与远程系统（尤其是 Linux / Unix）打交道的用户。无论是开发者、IT 支持还是科研人员，它都能成为你手中那把得心应手的“瑞士军刀”。

2025-10-06 23:02:37 2265 1

原创【软件测试】Fortify 代码安全扫描

Fortify 是一套由 Micro Focus（现属 OpenText）公司开发的、业界领先的静态应用程序安全测试工具集。它的核心任务是帮助开发者在软件开发生命周期的早期发现、分析和修复源代码中的安全漏洞和质量缺陷。您可以把它想象成一个功能极其强大的 “代码安全扫描仪” 或 “安全专家助手”。

2025-09-27 14:21:06 1231

原创【网络】测试 IP 端口连通性方法总结

ping 命令本身使用的是 ICMP 协议，它只能测试到 IP 地址的连通性，无法检测特定端口的状态。要检查 IP 地址的特定端口是否开放，需要使用其他工具。最常用和简单的方法是使用 telnet 命令，或者在 Windows 上使用更现代的 Test-NetConnection PowerShell 命令。

2025-09-27 12:09:40 3141

原创【安全】TLS 协议介绍

TLS（传输层安全协议，Transport Layer Security）是一种加密协议，旨在为计算机网络通信提供安全和数据完整性保障。你几乎每天都在使用它，当你在浏览器中看到地址栏有一个小锁图标时，就表示你正在使用 TLS。它的前身是更广为人知的 SSL（安全套接字层），因此人们也常称之为 SSL/TLS。

2025-09-26 22:55:51 1924

原创【云计算】存（云主机）算（云硬盘）分离

公有云的 “存算分离” 架构通过将计算与存储在物理、网络和管理层面彻底解耦，利用高速网络连接和强大的分布式存储系统，实现了高可用、弹性伸缩、成本优化、灵活数据管理等核心优势。它解决了传统紧耦合架构中计算节点故障导致数据不可用、资源扩展不灵活、存储利用率低等问题，是现代云原生应用和有状态服务在云上运行的基石架构。虽然存在网络延迟、缓存一致性等挑战，但云厂商持续的网络优化和分布式存储技术的进步，使得存算分离的性能和可靠性已能满足绝大多数企业级应用的需求。

2025-08-04 14:00:00 1254

原创【云计算】对象存储（以图书馆找书为案例说明）

用一句话概括对象存储：它像一个拥有无限空间的智能仓库，你给每件物品（数据）贴上一个唯一且复杂的条形码（ID）和一个超大信息标签（元数据），然后仓库系统会自动把它扔到某个位置（分布式存储），并且偷偷复制几份藏到别处（冗余）。你需要时，只要报出条形码，系统就能瞬间从茫茫货海中把它找出来给你。

2025-08-04 10:00:00 1159

原创【云计算】云主机的亲和性策略（四）：云主机组

本文详细探讨了云主机组在实现亲和性与反亲和性策略中的应用。云主机组作为策略载体，通过显式声明组策略类型来约束虚拟机调度。文章分析了调度器的工作流程，包括策略存储、宿主机筛选和最优选择等关键步骤，并比较了 AWS、Azure 等主流云平台的实现差异。此外，还介绍了标签选择器等其他实现方法，特别是 Kubernetes 中的节点亲和性和 Pod反亲和性配置。这些技术可确保关键业务分散部署，避免单点故障，提升系统可用性。

2025-08-02 10:54:18 1488

原创【云计算】云主机的亲和性策略（三）：云主机 & 宿主机

本文阐述了云主机与宿主机的核心关系及技术原理。云主机通过虚拟化技术在宿主机上创建，共享底层硬件资源但相互隔离，类似公寓与大楼的关系。关键点包括：虚拟化层实现资源隔离与调度；资源超卖、快速弹性和故障隔离是主要优势；但存在“吵闹邻居”、性能损耗等风险。公有云中用户无需感知宿主机，由云平台统一调度。文章还对比了容器与裸金属服务器的差异，强调理解这一关系对云架构设计的重要性。

2025-08-02 09:38:38 1402

原创【云计算】云主机的亲和性策略（二）：集群节点组

本文通过云计算场景中的集群节点组（Master/Core/Task）和宿主机调度，解释了反亲和性策略的实现过程。通过创建不同严格程度的反亲和性组，确保关键节点（Master/Core）分散部署以提升高可用性，同时允许弹性计算节点（Task）适度集中以优化资源利用率。文章还模拟了宿主机故障场景，验证了分层反亲和策略的有效性，并分析了不同节点组采用差异化策略的设计考量。

2025-08-01 10:15:00 1407

原创【云计算】云主机的亲和性策略（一）：快乐旅行团

本文通过旅行团分车的生动比喻，解释了云主机组的反亲和性策略原理。文章将 30 名员工类比为 30 台云主机，大巴车对应宿主机，安全分散组对应反亲和性云主机组。调度员（云平台调度器）根据 "同一部门员工必须分散在不同车辆" 的规则进行分配，确保单点故障时影响最小化。相比自由选座、标签分组或指定车队等方法，云主机组策略具有用户省心、调度高效和故障隔离三大优势。文章还补充了 "车辆不足" 等现实场景的技术对应，最终强调这种智能分散策略能有效保障业务连续性。

2025-08-01 10:00:00 2299

原创【ELasticsearch】集群故障模拟方案（二）：磁盘空间满、重选主节点

本文介绍了 Elasticsearch 集群故障模拟的两种场景：磁盘空间满和主节点选举问题。针对磁盘空间满模拟，详细说明了通过 dd 和 fallocate 命令快速填充磁盘的方法，对比了两种命令的差异及适用场景，同时提供了集群状态监控和清理方案。对于主节点选举问题，给出了识别主节点、停止主节点服务并观察选举过程的步骤。最后强调了安全注意事项和关键监控指标，为测试集群容错能力提供指导。全文包含具体命令示例和参数说明，适合运维人员参考实施。

2025-07-31 10:15:00 1465

原创【ELasticsearch】集群故障模拟方案（一）：节点宕机、节点离线

本文介绍了两种 Elasticsearch 集群故障模拟方案。节点宕机模拟：通过 kill 进程或停止服务强制终止节点，观察集群响应和恢复情况；节点网络隔离模拟：使用 iptables 阻断节点间的 9300 端口通信，测试集群容错机制。两种方案均包含详细的操作步骤、命令解释和恢复方法，特别说明了 iptables 规则的作用原理及注意事项。该方案可用于验证 Elasticsearch 集群的容错能力和故障恢复机制。

2025-07-31 10:00:00 2003

原创【ELasticsearch】案例：AWS 上 Elasticsearch 对接 NLB / ALB

本文详细介绍了在 AWS 上通过 NLB/ALB 对接 Elasticsearch 集群的方案。重点说明如何配置专用协调节点作为请求入口，并创建 NLB 或 ALB 进行负载均衡。关键配置包括节点角色设置、安全组规则、健康检查策略，以及客户端访问方式。架构实现了流量入口与数据处理的分离，协调节点处理请求聚合，数据节点专注分片操作，主节点负责集群管理。对比显示 NLB 更适合 ES场景，因其高性能、低延迟和源 IP 保留特性。该方案显著提升了 Elasticsearch 在云环境下的可用性和扩展性。

2025-07-28 15:00:00 1544

原创【ELasticsearch】搭建有负载均衡 ELB 的 ES 集群

本文探讨了在公有云上为 Elasticsearch 集群封装 ELB 负载均衡器的设计优势。ELB 提供单一入口点，简化客户端配置，实现高可用性、负载均衡和集群可扩展性，同时增强安全性。相比直接连接 ES 节点，ELB 方案降低了客户端复杂度，避免了单点故障风险，并优化了流量分发。文中指出，ELB 应仅对接专用协调节点而非所有节点，以提升性能并确保集群稳定性。这是生产环境中 ES 集群部署的最佳实践，特别适用于中大规模集群场景。

2025-07-28 14:00:00 846

原创【ELasticsearch】温、冷数据节点能是同一个节点吗

在 Elasticsearch 中，虽然技术上可以让一个节点同时承担“温”和“冷”数据层的角色，但这通常不是最佳实践。温层节点需要较好的 CPU、内存和高速磁盘以支持查询，而冷层节点侧重低成本、高密度存储。混合部署会导致硬件需求冲突、资源干扰风险，增加管理复杂度，并削弱分层存储的优化效果。建议在生产环境中使用独立的物理节点分别作为温节点和冷节点，以实现性能隔离和成本效益。仅在小规模测试或开发环境中可考虑临时混合配置。

2025-07-27 13:48:31 1609

原创【ELasticsearch】节点角色分离最佳实践

本文介绍了一个分层 Elasticsearch 生产集群设计方案，包含热、温、冷、冷冻四层存储架构。热层采用高性能 NVMe SSD 处理实时写入和高频查询；温层使用 SAS SSD 存储近期访问数据；冷层配置大容量 HDD 存储历史数据；冷冻层则结合对象存储实现长期归档。文章详细说明了各层的硬件配置、节点角色设置和分片策略，并提供了数据流动逻辑示意图和 ILM 策略示例。该架构通过严格分层实现了性能隔离和成本优化，SSD 使用量减少 70% 以上，存储成本可降低 5 倍，同时保持灵活的扩展性和合规性。

2025-07-27 11:18:02 1330

原创【ELasticsearch】节点角色分类与作用解析

ELasticsearch 集群通过角色隔离实现性能与稳定性的平衡 —— 热层追求速度，协调层消化流量，主节点专注决策，温冷层优化成本。各角色各司其职，构建高可用分布式系统。

2025-07-26 18:40:16 1950 1

空空如也

空空如也