当前位置: 首页 > news >正文

3.9 Elasticsearch-跨集群搜索(CCS)与跨集群复制(CCR)

3.9 Elasticsearch-跨集群搜索(CCS)与跨集群复制(CCR)

1. 功能定位
  • CCS(Cross-Cluster Search):把查询请求同时发往本地与远程集群,结果聚合后统一返回,解决“数据分散、查询入口要统一”的问题。
  • CCR(Cross-Cluster Replication):把 Leader 集群的索引近实时地拖回到 Follower 集群本地,解决“数据单点、灾备/就近读”的问题。
    二者常被组合成“写集中、读分散”的多活架构:CCR 负责把数据推送到边缘,CCS 负责在边缘就能一次性查到全局数据。
2. CCS 原理解剖
  1. 协调节点收到用户请求后,解析出cluster:index列表。
  2. 如果ccs_minimize_roundtrips=true,先向各远程集群发送can-match探针,只把真正可能命中的分片加入二次请求,减少跨机房 RTT。
  3. 各集群本地执行后,将TopN 的 docID 与排序值返回协调节点;协调节点做全局归并,再拉取原始_source(只在必要时第三次往返)。
  4. 聚合、高亮、Suggest 等操作在协调节点内存中完成,最终一次性返回客户端。

版本限制:本地集群版本必须 ≥ 远程集群,且功能集需完全交集,否则行为未定义。

3. CCR 原理解剖
  • 角色:Leader Index(写入口) ↔ Follower Index(只读副本,可手动提升为 Leader)。
  • 同步粒度:以translog的 sequence number 为基准,Follower 集群周期性拉取增量操作并重放。
  • 一致性模型:最终一致,延迟通常秒级;支持断点续传,网络闪断不丢位点。
  • 前置条件
    – Leader 索引需index.soft_deletes.enabled=true(8.x 默认开启)。
    – 两集群 transport 层互通(9300 端口),并通过cluster.remote.{name}.proxy_address注册。
4. 快速配置示例

以下示例基于 8.x 单节点 Docker 环境,安全功能已关闭。

4.1 拉起两套集群
leader/docker-compose.yml

services:es-leader:image:docker.elastic.co/elasticsearch/elasticsearch:8.12.0environment:-cluster.name=leader-cluster-discovery.type=single-node-xpack.security.enabled=falseports:["9200:9200"]

follower/docker-compose.yml 把cluster.name改成follower-clusterports: ["9201:9200"]

4.2 在 Follower 侧注册远程集群

curl-XPUT http://localhost:9201/_cluster/settings -H'Content-Type: application/json'-d' { "persistent": { "cluster.remote.leader-cluster": { "mode": "sniff", "seeds": ["es-leader:9300"] } } }'

4.3 启动 CCR

# 先确保 Leader 索引已开启 soft_deletescurl-XPUT http://localhost:9200/orders# 再在 Follower 侧创建 Follower 索引curl-XPUT http://localhost:9201/orders_follower/_ccr/follow?pretty -H'Content-Type: application/json'-d' { "remote_cluster": "leader-cluster", "leader_index": "orders" }'

返回"follow_index_created": true表示同步已生效;继续往 Leader 写数据,可在 Follower 实时查到。

4.4 执行 CCS

curl-XGET http://localhost:9201/leader-cluster:orders,orders_follower/_search?pretty -H'Content-Type: application/json'-d' { "query": { "match_all": {} }, "sort": [{ "timestamp": { "order": "desc" } }] }'

一次请求即可拿到两个集群的最新订单。

5. 生产级要点
维度CCS 建议CCR 建议
网络专线 / PrivateLink,开启 TLS 并做双向认证;ping.intervalconnect.timeout根据 RTT 调优。同上,传输层复用 9300,确保带宽 ≥ 峰值索引速率 × 2。
安全Remote Cluster 使用API KeyPKI认证;搜索侧通过DLS/FLS限制字段级权限。Follower 集群对 Leader 只授予monitorread_ccr权限,最小化暴露面。
性能对滚动日志场景,把ccs_minimize_roundtrips设为true可节省 30–50% 跨机房 RT;对聚合量大场景可关闭,避免二次往返拉取_sourceFollower 拉取线程数max_outstanding_read_requests默认 12,可随网络延迟线性上调;写-heavy 场景建议单独冷/热分层,Leader 热层 SSD,Follower 冷层 HDD + ILM。
监控协调节点ccs_total_roundtripsccs_remote_failures;搜索延迟突增时优先检查跨域 DNS 与 MTU。使用GET _ccr/stats观察leader_global_checkpointfollower_global_checkpoint差值;差值持续 >5 min 需排查带宽或 GC。
灾备演练——定期做提升演练POST orders_follower/_ccr/pause_followPOST orders_follower/_ccr/unfollowPOST orders_follower/_settingsindex.blocks.write=false,确认业务侧写入口可秒级切换。
6. 常见坑位速查
  • 模板不一致:CCR 不会同步索引模板与 Ingest Pipeline,需提前在 Follower 侧建好,否则字段类型差异导致写入拒绝。
  • 同义词文件缺失:Leader 使用了自定义同义词,Follower 侧若缺少同名文件,搜索侧分词结果将不一致。
  • 滚动升级顺序:先升级 Follower,再升级 Leader;反之会造成版本不兼容,CCR 任务自动暂停。
  • 大索引初始快照超时:首次全量阶段可在 Leader 侧调大indices.snapshot.max_concurrent_operations,或先用手动 snapshot 导入基线,再启用 CCR 追增量。
7. 一句话总结

CCS 让你“像查一个集群一样查所有集群”,CCR 让你“把一个集群的数据安全快速地搬到另一个集群”;两者配合,Elasticsearch 才真正具备了跨地域、多活、读写分离的企业级能力。
更多技术文章见公众号: 大城市小农民

http://www.cnnetsun.cn/news/112782.html

相关文章:

  • 用NATS+AI快速构建物联网数据采集原型
  • Excel格式转换异常?新手必看的5分钟解决指南
  • 【智能聊天助手部署教程 (基于 Streamlit + Ollama)】
  • 好写作AI第二大脑:当研究灵感不再碎片化,你的“学术外脑”已上线
  • 好写作AI第二大脑:当研究灵感不再碎片化,你的“学术外挂”已上线
  • 守护代码世界的守门人——软件测试团队心理健康白皮书
  • PinWin窗口置顶工具:提升Windows多任务效率的终极指南
  • Sheet-to-Doc:用Excel数据和Word模板自动生成文档
  • 27岁,转行网络安全,是这辈子最成功的一件事......_27岁开始搞网安好吗
  • 基于 OpenCV C# 的直线卡尺工具源码分享
  • FunASR多说话人识别终极指南:从实战到深度解析
  • SpringAI基于pgvector存储向量
  • 15天零基础打造Android视频录制终极方案:基于FFmpeg的微信级体验完整实现
  • 终极指南:macOS iSCSI启动器完整配置与使用详解
  • 【计算机毕业设计案例】基于SpringBoot+微信小程序的智能在线预约挂号系统基于springboot+微信小程序的智能医疗管理系统设计与实现(程序+文档+讲解+定制)
  • 【计算机毕业设计案例】基于springboot+微信小程序的校园活动管理系统设计与实现在线活动发布、报名管理与学生互动平台(程序+文档+讲解+定制)
  • HMC218BMS8GETR,3.5-8 GHz GaAs MMIC双平衡混频器, 现货库存
  • 直流电机控制仿真:Matlab/Simulink 实现
  • 如何用Charticulator轻松制作专业图表
  • 俄罗斯服务器常见故障汇总及排查方法
  • Seed-VR2:突破性AI视频增强技术,6GB显存实现专业级画质处理
  • 3分钟让你的Qt应用颜值翻倍:10款专业QSS模板免费使用指南
  • AI视频生成新纪元:5步掌握Wan2.2模型实战技巧
  • Stable Diffusion WebUI Forge技术架构深度解析:PyTorch如何驱动AI绘画革命
  • 合规即代码的延伸:国产 DevOps 平台如何利用平台扩展能力,自动验证信创基础设施的配置合规性
  • 基于MATLAB的Kmeans自动寻找最佳聚类中心App——简单操作实现手肘法与聚类分析
  • 2026年学大模型,别乱读书!这13本“硬核书单”就是你的高效知识地图,啃完体系自成
  • Wan2.1 GP视频生成:新手快速上手AI视频制作指南
  • 【Go 语言】核心特性、基础语法及面试题
  • 能控制计算机桌面的多模态AI agent框架