如何使用 'fio" 检查 OpenShift 中的 etcd 磁盘性能
Issue
- etcd 对磁盘的响应有一定要求,通常需要确保 etcd 写入其后备存储的速度足以满足生产环境工作负载。
-
Web 控制台会出现 etcd 警报,或出现频繁的错误信息(例如以下消息),声明写操作用时过长:
2020-10-21T09:56:00.246667768Z 2020-10-21 09:56:00.246542 W | etcdserver: read-only range request "key:\"/kubernetes.io/serviceaccounts/openshift-kube-scheduler/localhost-recovery-client\" " with result "range_response_count:1 size:407" took too long (113.372697ms) to execute -
根据 etcd 性能文档,建议在生产环境工作负载中,
wal_fsync_duration_secondsp99 持续时间应小于 10ms ,以确认磁盘速度足够快。 - 根据磁盘速度问题的严重程度,影响的范围可以从频繁出现警报到整个集群不稳定。
- 有关基础设施要求的一般信息,请参阅 etcd 后端性能要求。
Environment
- Red Hat OpenShift Container Platform (RHOCP, OCP)
- 3.11
- 4
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.