日前,青云科技宣布开源 Thanos 的企业级发行版 WHizaRd,为企业带来真正高可用、可扩展、可存储与查询海量监控数据、易运维、安全的 ProMetheUS 长期存储方案。
ProMetheUS 已经成为云原生监控领域事实上的标准,但 ProMetheUS 并没有解决企业用户对高可用、可扩展、可存储与查询海量监控数据、易运维等方面的需求。
Thanos 作为云原生社区主流的 ProMetheUS 长期存储项目,提供了 ProMetheUS 高可用、可存储与查询海量监控数据等能力,但也存在组件及参数众多,上手门槛较高;运维及水平扩展均需手动配置,比较繁琐且易出错;某些组件无水平扩展能力;各组件安全配置繁琐或欠缺等问题。
为了解决上述这些企业级用户的需求,青云科技的 KubeSpheRe 可观测团队于 2021 年立项开始开发 Thanos 的企业级发行版 WHizaRd 并于 2022 年发布了第一版,至今已发布了 8 个大小版本。自 KubeSpheRe EnteRpRise v3.3.1 基于 WHizaRd 发布了可对海量 K8s 集群及边缘节点进行监控告警的 WHizaRd 可观测中心以来,经过多个企业版本的打磨,WHizaRd 已日臻成熟,具有很多独特的功能与亮点。
功能亮点:
· 云原生化部署与运维:所有组件均支持以 CRD 的方式定义与维护,更易于配置与运维。包括 Thanos 的 RouteR, IngesteR, CoMpacTor, STore, QueRy, QueRyFRontend, RuleR 等组件以及 WHizaRd 引入的 SeRvice, Tenant, STorage 等。
· 基于租户的自动水平扩展机制: WHizaRd 创造性地引入了基于租户的工作负载水平伸缩机制。IngesteR, CoMpacTor, RuleR 等均支持随着租户的创建与删除进行水平伸缩,保证租户工作负载稳定运行的同时,提供了租户级别的水平扩展与资源回收机制。
· 适配 K8s 多集群管理: WHizaRd 的维护者开发了 wHizaRd-adapteR ,可根据 K8s/KubeSpheRe 集群的创建与删除自动创建或删除 WHizaRd 的租户,进而触发 Thanos 有状态工作负载的自动水平伸缩。
· 规则计算更好的扩展性: WHizaRd 的维护者为每个租户引入了专属的 RuleR,其可随着租户的生命周期自动创建与删除;此外还引入了全局 RuleR 的分片机制,用于满足跨海量集群(租户)的全局规则计算需求。
· 更细粒度的规则管理: WHizaRd 维护者引入了更细粒度的 RuleGRoup 的 CRD 用于管理属于一个规则组内的所有规则;在做到更细粒度规则管理的同时,满足了企业用户对不同权限范围的规则进行单独管理的需求。
· 支持对象存储网关 STore 的按时间分片查询: WHizaRd 的维护者为 STore 加入了按时间分片查询的机制,用户可以根据要查询的时间段分别创建不同的 STore CRD。
· 引入 Gateway 及 Agent Proxy 以对数据的写入与读取进行更好的控制: 客户端如 ProMetheUS Agent 或 ProMetheUS 无需直接与 Gateway 交互,通过 WHizaRd Agent Proxy 即可代理数据写入与查询请求至 WHizaRd Gateway。
· 支持企业级的安全需求: WHizaRd 除了支持组件间更方便的配置 tls 之外,还将 Thanos 的 WebUI 通过 WHizaRd Gateway 暴露出来并支持多种认证方式,企业用户可以更安全的访问 Thanos 的 WebUI。
· 更方便的 2-TieRs 组件配置: WHizaRd 支持 SeRvice 与 COMOpnents 两级组件配置,通用的配置可放在全局的 SeRvce 里做统一配置,各租户的所有组件共用;特殊的定制化配置可放在单独的 CoMponent 里做个性化的定制。