Elasticsearch在生产环境中, 需要做一系列的优化, 以达到最佳的性能。虽然网上有些优化的建议和经验, 但却不一定有效,下面就结合官网上的介绍和网上的一些指导加上自己在使用过程中的实际处理, 给出更加有说服力的一些意见和建议。
官网的关于生产环境的部署的建议,https://www.elastic.co/guide/en/elasticsearch/guide/current/deploy.html
1. 硬件:https://www.elastic.co/guide/en/elasticsearch/guide/current/hardware.html
内存:设置ES_HEAP_SIZE 为机器内存的1/2, 但不要超过32G.
CPU:官网的意见是, 2~8核足够了, 从我的经验看, 一般是要超过2核的。我的机器用的是32核, top看的话, 也就用了2核多。当然核数多点也无妨的。
磁盘:首选是SSD + RAID0
网络:1 GbE, 10 GbE, 最好不要跨机房,容易造成网络延迟。
2. JVM:https://www.elastic.co/guide/en/elasticsearch/guide/current/_java_virtual_machine.html
除了ES_HEAP_SIZE, 不要擅自改变JVM 的参数, 只要使用ES本身的设置就好了。
3. 重要的配置:https://www.elastic.co/guide/en/elasticsearch/guide/current/important-configuration-changes.html
ES通常是不需要调优处理的, 如果遇到性能问题, 最好的方法是安排更好的数据布局和增加节点数目。
1)discovery.zen.minimum_master_nodes:(number of master-eligible nodes / 2) + 1
防止一个集群里, 出现多个master,造成数据混乱。
discovery.zen.minimum_master_nodes的数量应该是有资格成为master的node数量的1/2 + 1.
而且随着集群node数量的变化(主要是master-eligible node数量的变化), 需要动态的修改这个参数。可以使用如下的API动态修改。
PUT /_cluster/settings