知识库

技术文档

聚焦数据中心自动化、Python 探针、DCIM 和 AI 内容流水线。

返回首页
Cloud & DevOps

Ansible vs SaltStack 迁移实战:从踩坑到真香,这份指南替你省下300小时

写在前面:为什么我决定从 SaltStack 跑路 先交代背景。我们团队之前用 SaltStack 管了三年多的生产集群,大概 500 多台机器。说实话,刚上手那会儿觉得 Salt 真香——速度快,功能强,Jinja 模板随便玩。但时间长了问题就来了。 维护成本越来越高。 每次有 …

Tan Jia Hui

Tan Jia Hui

DCIM ENG

Cybersecurity

Splunk SIEM 关联规则配置实战:从踩坑到高效告警

前言:别让规则变成噪音 说实话,我见过太多安全团队把 Splunk ES 当成一个“告警制造机”。配了一堆规则,结果每天几千条告警,真正能用的没几条。我去年接手一个客户的 SOC,他们 ES 上有 200 多条 Correlation Search,但平均每天有 70% 的告警是 …

Tan Jia Hui

Tan Jia Hui

DCIM ENG

SRE & Observability

Prometheus 告警规则配置:从入门到生产级踩坑实录

前言:为什么你的告警总在半夜炸你? 别跟我说你没经历过。凌晨三点,手机疯狂震动,群里@你一百遍。你爬起来一看——CPU 负载高?哦,是批处理任务在跑。内存快满了?哦,是缓存预热。然后你默默把告警阈值调高,回去继续睡。 这他妈的叫告警疲劳。 我踩了这个坑三年, …

Tan Jia Hui

Tan Jia Hui

DCIM ENG