如何实现系统的高可用?
高可用架构设计
采用集群,多机房,多副本,负载均衡,热备份等手段,确保系统冗余 与 可恢复能力,避免单点故障。
服务容错 与 降级
面对故障时,通常采用合适的容错机制 以及 服务降级来确保核心业务稳定运行,比如采用限流来保障核心服务免受流量冲击。
自动化运维 与 发布
建立自动化运维流程,包括发布,回滚,灰度,减少人工操作带来的失误 或 误操作
同时建立持续集成 与 交付(CI/CD流程),保证代码的稳定 与 健壮度
安全保障和漏洞修复
建立健全的安全策略 与 防护措施保障系统数据的安全,同时修复系统的漏洞及安全隐患问题,避免攻击者利用漏洞进行入侵
备份 与 恢复
定期进行数据备份(包括增量 与 全量),建立容灾恢复机制, 备份包括系统配置,数据库,日志等相关数据,保障在系统发生故障时能够快速恢复
核心: 监控系统
建立监控体系,监控关键指标(CPU, 内存,带宽)。关注是否有某些指标激增。 同时配置预警,一旦发生异常能够快速的通知相关人员解决。