Jump To Close Expand all Collapse all Table of contents Contrôle 1. Aperçu de la surveillance Expand section "1. Aperçu de la surveillance" Collapse section "1. Aperçu de la surveillance" 1.1. À propos de la surveillance de la plateforme OpenShift Container 1.2. Comprendre la pile de surveillance Expand section "1.2. Comprendre la pile de surveillance" Collapse section "1.2. Comprendre la pile de surveillance" 1.2.1. Composants de surveillance par défaut 1.2.2. Objectifs de surveillance par défaut 1.2.3. Composants pour le suivi de projets définis par l'utilisateur 1.2.4. Suivi des objectifs pour les projets définis par l'utilisateur 1.3. Glossaire des termes courants pour la surveillance de OpenShift Container Platform 1.4. Ressources supplémentaires 1.5. Prochaines étapes 2. Configuration de la pile de surveillance Expand section "2. Configuration de la pile de surveillance" Collapse section "2. Configuration de la pile de surveillance" 2.1. Conditions préalables 2.2. Maintenance et soutien pour la surveillance Expand section "2.2. Maintenance et soutien pour la surveillance" Collapse section "2.2. Maintenance et soutien pour la surveillance" 2.2.1. Considérations relatives au soutien pour le suivi 2.2.2. Politique de soutien au suivi des opérateurs 2.3. Préparation de la configuration de la pile de surveillance Expand section "2.3. Préparation de la configuration de la pile de surveillance" Collapse section "2.3. Préparation de la configuration de la pile de surveillance" 2.3.1. Création d'une carte de configuration pour la surveillance des clusters 2.3.2. Création d'une carte de configuration de surveillance de la charge de travail définie par l'utilisateur 2.4. Configuration de la pile de surveillance 2.5. Composants de surveillance configurables 2.6. Déplacement des composants de surveillance vers différents nœuds 2.7. Attribution de tolérances aux composants de surveillance 2.8. Définition de la taille limite du corps pour le raclage des métriques 2.9. Configuration du stockage persistant Expand section "2.9. Configuration du stockage persistant" Collapse section "2.9. Configuration du stockage persistant" 2.9.1. Conditions préalables au stockage permanent 2.9.2. Configuration d'une revendication de volume persistant local 2.9.3. Redimensionnement d'un volume de stockage persistant 2.9.4. Modification de la durée et de la taille de rétention des données de métrologie Prometheus 2.9.5. Modifier le temps de rétention des données de métriques de la règle de Thanos 2.10. Configuration du stockage en écriture à distance Expand section "2.10. Configuration du stockage en écriture à distance" Collapse section "2.10. Configuration du stockage en écriture à distance" 2.10.1. Paramètres d'authentification de l'écriture à distance pris en charge Expand section "2.10.1. Paramètres d'authentification de l'écriture à distance pris en charge" Collapse section "2.10.1. Paramètres d'authentification de l'écriture à distance pris en charge" 2.10.1.1. Emplacement de la carte de configuration pour les paramètres d'authentification 2.10.1.2. Exemple de paramètres d'authentification de l'écriture à distance 2.11. Ajout d'étiquettes d'identification des clusters aux métriques Expand section "2.11. Ajout d'étiquettes d'identification des clusters aux métriques" Collapse section "2.11. Ajout d'étiquettes d'identification des clusters aux métriques" 2.11.1. Création d'étiquettes d'identification des clusters pour les métriques 2.12. Contrôler l'impact des attributs de métriques non liés dans les projets définis par l'utilisateur Expand section "2.12. Contrôler l'impact des attributs de métriques non liés dans les projets définis par l'utilisateur" Collapse section "2.12. Contrôler l'impact des attributs de métriques non liés dans les projets définis par l'utilisateur" 2.12.1. Définition des limites d'échantillons et d'étiquettes pour les projets définis par l'utilisateur 2.12.2. Création d'alertes d'échantillons scrape 3. Configuration des instances externes du gestionnaire d'alerte Expand section "3. Configuration des instances externes du gestionnaire d'alerte" Collapse section "3. Configuration des instances externes du gestionnaire d'alerte" 3.1. Attacher des étiquettes supplémentaires à vos séries temporelles et à vos alertes 4. Configuration des contraintes d'étalement de la topologie des pods pour la surveillance Expand section "4. Configuration des contraintes d'étalement de la topologie des pods pour la surveillance" Collapse section "4. Configuration des contraintes d'étalement de la topologie des pods pour la surveillance" 4.1. Configuration des contraintes d'étalement de la topologie des pods pour Prometheus 4.2. Configuration des contraintes d'étalement de la topologie des pods pour Alertmanager 4.3. Mise en place des contraintes d'étalement de la topologie des pods pour Thanos Ruler 4.4. Définition des niveaux de journalisation pour les composants de surveillance 4.5. Activation du fichier journal des requêtes pour Prometheus 4.6. Activation de la journalisation des requêtes pour Thanos Querier 5. Définition des niveaux de journal d'audit pour l'adaptateur Prometheus Expand section "5. Définition des niveaux de journal d'audit pour l'adaptateur Prometheus" Collapse section "5. Définition des niveaux de journal d'audit pour l'adaptateur Prometheus" 5.1. Désactivation de l'Alertmanager local 5.2. Prochaines étapes 6. Permettre le suivi de projets définis par l'utilisateur Expand section "6. Permettre le suivi de projets définis par l'utilisateur" Collapse section "6. Permettre le suivi de projets définis par l'utilisateur" 6.1. Permettre le suivi de projets définis par l'utilisateur 6.2. Autoriser les utilisateurs à suivre des projets définis par l'utilisateur Expand section "6.2. Autoriser les utilisateurs à suivre des projets définis par l'utilisateur" Collapse section "6.2. Autoriser les utilisateurs à suivre des projets définis par l'utilisateur" 6.2.1. Octroi de permissions aux utilisateurs à l'aide de la console web 6.2.2. Octroi de permissions aux utilisateurs à l'aide de l'interface de programmation 6.3. Autoriser les utilisateurs à configurer la surveillance pour des projets définis par l'utilisateur 6.4. Accès aux métriques depuis l'extérieur du cluster pour des applications personnalisées 6.5. Exclusion d'un projet défini par l'utilisateur de la surveillance 6.6. Désactivation de la surveillance pour les projets définis par l'utilisateur 6.7. Prochaines étapes 7. Activation de l'acheminement des alertes pour les projets définis par l'utilisateur Expand section "7. Activation de l'acheminement des alertes pour les projets définis par l'utilisateur" Collapse section "7. Activation de l'acheminement des alertes pour les projets définis par l'utilisateur" 7.1. Comprendre le routage des alertes pour les projets définis par l'utilisateur 7.2. Activation de l'instance Alertmanager de la plate-forme pour l'acheminement des alertes définies par l'utilisateur 7.3. Activation d'une instance distincte d'Alertmanager pour l'acheminement des alertes définies par l'utilisateur 7.4. Autoriser les utilisateurs à configurer l'acheminement des alertes pour des projets définis par l'utilisateur 7.5. Prochaines étapes 8. Gestion des indicateurs Expand section "8. Gestion des indicateurs" Collapse section "8. Gestion des indicateurs" 8.1. Comprendre les indicateurs 8.2. Mise en place de la collecte de métriques pour des projets définis par l'utilisateur Expand section "8.2. Mise en place de la collecte de métriques pour des projets définis par l'utilisateur" Collapse section "8.2. Mise en place de la collecte de métriques pour des projets définis par l'utilisateur" 8.2.1. Déploiement d'un exemple de service 8.2.2. Spécifier comment un service est contrôlé 8.3. Affichage d'une liste des mesures disponibles 8.4. Prochaines étapes 9. Interroger les métriques Expand section "9. Interroger les métriques" Collapse section "9. Interroger les métriques" 9.1. A propos de l'interrogation des métriques Expand section "9.1. A propos de l'interrogation des métriques" Collapse section "9.1. A propos de l'interrogation des métriques" 9.1.1. Interroger les métriques de tous les projets en tant qu'administrateur de cluster 9.1.2. Interroger les métriques pour des projets définis par l'utilisateur en tant que développeur 9.1.3. Exploration des métriques visualisées 9.2. Prochaines étapes 10. Gestion des objectifs de mesure Expand section "10. Gestion des objectifs de mesure" Collapse section "10. Gestion des objectifs de mesure" 10.1. Accès à la page Cibles de mesure dans la perspective de l'administrateur 10.2. Recherche et filtrage des cibles de métriques 10.3. Obtenir des informations détaillées sur une cible 10.4. Prochaines étapes 11. Gestion des alertes Expand section "11. Gestion des alertes" Collapse section "11. Gestion des alertes" 11.1. Accès à l'interface utilisateur des alertes dans les perspectives de l'administrateur et du développeur 11.2. Recherche et filtrage des alertes, des silences et des règles d'alerte 11.3. Obtenir des informations sur les alertes, les silences et les règles d'alerte 11.4. Gérer les silences Expand section "11.4. Gérer les silences" Collapse section "11.4. Gérer les silences" 11.4.1. Silence sur les alertes 11.4.2. Editer les silences 11.4.3. Silences expirants 11.5. Gestion des règles d'alerte pour les projets définis par l'utilisateur Expand section "11.5. Gestion des règles d'alerte pour les projets définis par l'utilisateur" Collapse section "11.5. Gestion des règles d'alerte pour les projets définis par l'utilisateur" 11.5.1. Optimisation des alertes pour les projets définis par l'utilisateur 11.5.2. Création de règles d'alerte pour des projets définis par l'utilisateur 11.5.3. Réduction de la latence pour les règles d'alerte qui n'interrogent pas les métriques de la plate-forme 11.5.4. Accès aux règles d'alerte pour les projets définis par l'utilisateur 11.5.5. Liste des règles d'alerte pour tous les projets dans une vue unique 11.5.6. Suppression des règles d'alerte pour les projets définis par l'utilisateur 11.6. Gestion des règles d'alerte pour la surveillance de la plate-forme centrale Expand section "11.6. Gestion des règles d'alerte pour la surveillance de la plate-forme centrale" Collapse section "11.6. Gestion des règles d'alerte pour la surveillance de la plate-forme centrale" 11.6.1. Modifier les règles d'alerte de la plate-forme centrale 11.6.2. Création de nouvelles règles d'alerte 11.7. Envoi de notifications à des systèmes externes Expand section "11.7. Envoi de notifications à des systèmes externes" Collapse section "11.7. Envoi de notifications à des systèmes externes" 11.7.1. Configuration des récepteurs d'alerte 11.7.2. Création d'un routage d'alertes pour des projets définis par l'utilisateur 11.8. Application d'une configuration personnalisée de l'Alertmanager 11.9. Application d'une configuration personnalisée à Alertmanager pour l'acheminement des alertes définies par l'utilisateur 11.10. Prochaines étapes 12. Examen des tableaux de bord de suivi Expand section "12. Examen des tableaux de bord de suivi" Collapse section "12. Examen des tableaux de bord de suivi" 12.1. Examen des tableaux de bord de surveillance en tant qu'administrateur de cluster 12.2. Examiner les tableaux de bord de surveillance en tant que développeur 12.3. Prochaines étapes 13. Tableau de bord d'administration du GPU NVIDIA Expand section "13. Tableau de bord d'administration du GPU NVIDIA" Collapse section "13. Tableau de bord d'administration du GPU NVIDIA" 13.1. Introduction 13.2. Installation du tableau de bord d'administration des GPU NVIDIA 13.3. Utilisation du tableau de bord d'administration du GPU NVIDIA Expand section "13.3. Utilisation du tableau de bord d'administration du GPU NVIDIA" Collapse section "13.3. Utilisation du tableau de bord d'administration du GPU NVIDIA" 13.3.1. Visualisation de la vue d'ensemble du GPU de la grappe 13.3.2. Affichage du tableau de bord des GPU 13.3.3. Visualisation des mesures du GPU 14. Surveillance des événements bare-metal avec Bare Metal Event Relay Expand section "14. Surveillance des événements bare-metal avec Bare Metal Event Relay" Collapse section "14. Surveillance des événements bare-metal avec Bare Metal Event Relay" 14.1. À propos des événements "bare-metal 14.2. Fonctionnement des événements "bare-metal Expand section "14.2. Fonctionnement des événements "bare-metal" Collapse section "14.2. Fonctionnement des événements "bare-metal" 14.2.1. Flux de données du relais d'événements Bare Metal Expand section "14.2.1. Flux de données du relais d'événements Bare Metal" Collapse section "14.2.1. Flux de données du relais d'événements Bare Metal" 14.2.1.1. Nacelle gérée par l'opérateur 14.2.1.2. Relais d'événements Bare Metal 14.2.1.3. Événement "cloud native 14.2.1.4. CNCF CloudEvents 14.2.1.5. Routeur de distribution AMQP 14.2.1.6. Sidecar de proxy d'événement cloud 14.2.2. Service d'analyse de messages Redfish 14.2.3. Installation de Bare Metal Event Relay à l'aide de l'interface de programmation (CLI) 14.2.4. Installation de Bare Metal Event Relay à l'aide de la console web 14.3. Installation du bus de messagerie AMQ 14.4. Abonnement aux événements Redfish BMC bare-metal pour un nœud de cluster Expand section "14.4. Abonnement aux événements Redfish BMC bare-metal pour un nœud de cluster" Collapse section "14.4. Abonnement aux événements Redfish BMC bare-metal pour un nœud de cluster" 14.4.1. S'abonner aux événements "bare-metal 14.4.2. Interroger les abonnements aux événements Redfish bare-metal avec curl 14.4.3. Création de l'événement bare-metal et des CR secrètes 14.5. Abonnement des applications aux événements bare-metal Référence de l'API REST 15. Accès aux API de surveillance de tiers Expand section "15. Accès aux API de surveillance de tiers" Collapse section "15. Accès aux API de surveillance de tiers" 15.1. Accès aux API de services web de surveillance de tiers 15.2. Interroger les métriques en utilisant le point de terminaison de la fédération pour Prometheus 15.3. Ressources supplémentaires 16. Dépannage des problèmes de surveillance Expand section "16. Dépannage des problèmes de surveillance" Collapse section "16. Dépannage des problèmes de surveillance" 16.1. Déterminer pourquoi les mesures définies par l'utilisateur ne sont pas disponibles 16.2. Déterminer pourquoi Prometheus consomme beaucoup d'espace disque 17. Référence de la carte de configuration pour l'opérateur de surveillance des clusters Expand section "17. Référence de la carte de configuration pour l'opérateur de surveillance des clusters" Collapse section "17. Référence de la carte de configuration pour l'opérateur de surveillance des clusters" 17.1. Référence de configuration de l'opérateur de surveillance des clusters 17.2. AdditionalAlertmanagerConfig Expand section "17.2. AdditionalAlertmanagerConfig" Collapse section "17.2. AdditionalAlertmanagerConfig" 17.2.1. Description 17.2.2. Exigée 17.3. AlertmanagerMainConfig Expand section "17.3. AlertmanagerMainConfig" Collapse section "17.3. AlertmanagerMainConfig" 17.3.1. Description 17.4. AlertmanagerUserWorkloadConfig Expand section "17.4. AlertmanagerUserWorkloadConfig" Collapse section "17.4. AlertmanagerUserWorkloadConfig" 17.4.1. Description 17.5. ClusterMonitoringConfiguration Expand section "17.5. ClusterMonitoringConfiguration" Collapse section "17.5. ClusterMonitoringConfiguration" 17.5.1. Description 17.6. Moniteurs de services dédiés Expand section "17.6. Moniteurs de services dédiés" Collapse section "17.6. Moniteurs de services dédiés" 17.6.1. Description 17.7. K8sPrometheusAdapter Expand section "17.7. K8sPrometheusAdapter" Collapse section "17.7. K8sPrometheusAdapter" 17.7.1. Description 17.8. KubeStateMetricsConfig Expand section "17.8. KubeStateMetricsConfig" Collapse section "17.8. KubeStateMetricsConfig" 17.8.1. Description 17.9. OpenShiftStateMetricsConfig Expand section "17.9. OpenShiftStateMetricsConfig" Collapse section "17.9. OpenShiftStateMetricsConfig" 17.9.1. Description 17.10. PrometheusK8sConfig Expand section "17.10. PrometheusK8sConfig" Collapse section "17.10. PrometheusK8sConfig" 17.10.1. Description 17.11. PrometheusOperatorConfig Expand section "17.11. PrometheusOperatorConfig" Collapse section "17.11. PrometheusOperatorConfig" 17.11.1. Description 17.12. PrometheusRestrictedConfig Expand section "17.12. PrometheusRestrictedConfig" Collapse section "17.12. PrometheusRestrictedConfig" 17.12.1. Description 17.13. Spécification d'écriture à distance Expand section "17.13. Spécification d'écriture à distance" Collapse section "17.13. Spécification d'écriture à distance" 17.13.1. Description 17.13.2. Exigée 17.14. TelemeterClientConfig Expand section "17.14. TelemeterClientConfig" Collapse section "17.14. TelemeterClientConfig" 17.14.1. Description 17.14.2. Exigée 17.15. ThanosQuerierConfig Expand section "17.15. ThanosQuerierConfig" Collapse section "17.15. ThanosQuerierConfig" 17.15.1. Description 17.16. ThanosRulerConfig Expand section "17.16. ThanosRulerConfig" Collapse section "17.16. ThanosRulerConfig" 17.16.1. Description 17.17. TLSConfig Expand section "17.17. TLSConfig" Collapse section "17.17. TLSConfig" 17.17.1. Description 17.17.2. Exigée 17.18. UserWorkloadConfiguration Expand section "17.18. UserWorkloadConfiguration" Collapse section "17.18. UserWorkloadConfiguration" 17.18.1. Description Note légale Settings Close Language: 简体中文 한국어 日本語 English Français Language: 简体中文 한국어 日本語 English Français Format: Multi-page Single-page Format: Multi-page Single-page Language and Page Formatting Options Language: 简体中文 한국어 日本語 English Français Language: 简体中文 한국어 日本語 English Français Format: Multi-page Single-page Format: Multi-page Single-page 5.2. Prochaines étapes Permettre le suivi de projets définis par l'utilisateur Renseignez-vous sur les rapports de santé à distance et, le cas échéant, refusez-les. Previous Next