Formation DevOps | Formation AWS Services : 6- Service CloudWatch

www.itgalaxy.io

AMAZON CLOUDWATCH

Vue d’ensemble

  • Service de monitoring étendu
    • Ressources AWS + ressources externes possibles
  • Opère au niveau régional
    • Ne voit que les métriques de la région
  • Consultable et manipulable par console Web et requêtes APIs

CloudWatch : définitions

  • Métriques : collections de points ordonnés chronologiquement
    » Métriques de base collectées automatiquement par CloudWatch
    » Métriques custom envoyées par l’utilisateur via requêteAPI
    » Granularité : 1 minute
    » Rétention : 15 mois

CloudWatch : définitions

  • Dimension : clé / valeur identifiant la ressource associée à la métrique
    » ex. : Name=InstanceId, Value=i-1a2b3c4e
  • Namespaces : containers de métriques / famille de ressources
    » Un namespace par service (EC2, Billing, ELB,…)
    » Possibilité d’en créer desnouveaux
    ○ Par ex. pour uneapplication

Console CloudWatch

  • Restitue les métriques, alarmes, dashboards
  • Scope régional

Métriques de base

  • Une dizaine deservices
    » CloudFront, EMR, Route53, EC2, S3, EBS, …
  • Mesure tout ce que peut surveiller un hyperviseur
    » Les services en « PaaS » (RDS) : métriques additionnelles
  • Historique : 15 mois
  • Mesure toutes les 5 minutes
  • Mesure détaillée : toutes lesminutes

Métriques de base

  • CPU I/O Réseau
  • I/O Status disqueschecks

EC2

  • Nombrerequêtesde
  • •Latence…

ELB

  • Latence Taille de la des file I/O
  • d’attente Bande passante

  • EBS
  • Espace# Connexions mémoire DB
  • Latence stockage I/O

Console CloudWatch vs console « services »

  • Console CloudWatch
    • Concentre toutes les métriques de tous lesservices
  • Console « services » (EC2, RDS, etc.)
    » Chaque service qui dispose de sa propre console présente également les
    métriques de sonscope

CloudWatch : métriques d’une instance depuis

Métriques custom

  • Métriques constituée par un ensemble de point : valeur /horodatage
  • Nécessité de créer un namespace comme « container »
  • Envoyées à CloudWatch en mode push(APIs)
    » Requête API :PutMetricData
    » Ex. avec la CLI:
    $ aws cloudwatch put-metric-data –metric-name PageViewCount
    –namespace “MyService” –value 2 –timestamp 2021- 01 -
    18T12:00:00.000Z

CloudWatch : custom métriques contenues dans des namespaces custom

  • Exemple consommation: CPU d’une instance EC2 valeur d’une Surveillance métrique

  • Exemple consommation : CPU > 70% depuis 5 minutes

Alarmes Cloudwatch

  • Lorsque la valeur dépasse un certain seuil, pendant un certain temps… ,Une SNS notification à une “Auto Scaling notification Group

Alarmes Clouwatch : 3 valeurs possibles

  • OK : seuil non atteint, aucune action
  • ALARM : seuil atteint sur les n périodes
    consécutives, exécution de l’action
  • INSUFFICIENT_DATA : la dimension ne reçoit
    aucune données

Alarmes CloudWatch : déclenchement

  • Si action SNS
    » La notification SNS ne se fera qu’une seule fois
    » Possibilité d’être notifié lorsque l’alarme s’arrête (« recovery »)
  • Si action d’Auto Scaling
    » Les notifications à l’Auto Scaling Group se feront tant que l’alarme ne
    sera pas revenu à l’état « OK »
  1. Choix métrique d’une

Création d’une alarme

2.Paramétrage périodes,des seuils, statistiques

  • Seuil : valeur référence
  • Période : laps de temps lequel le seuilpendant est atteint
  • Statistique de calcul(moyenne, : mode max, min,sum)

3.des Paramétrage actions

  • NotificationSNS

  • EC2 :action

    • Recover,stop,terminate reboot,
  • Auto Scaling Group

    • Changement capacité

SNS : Simple Notification Service

Exemple d’alarme : stopper une instance de test, qui est sous-utilisée

la CPU n’a pas dépassé d’utilisation au cours des 1024 % derniers heures

  • Métrique : « CPU utilization»

  • Seuil : 10 %

  • Période : 24 h

  • Statistique : max

  • Action : STOPinstance

  • Exemple d’alarme : notifier qu’une instance est surchargée

L’utilisation anormalement CPU est élevé depuis 1h

  • Métrique : CPU utilization
  • Seuil : 80 %
  • Période : 1h
  • Statistique : moyenne(avg)
  • Action :SNS
  • Exemple d’alarme : notifier qu’une instance de production renvoie un trafic anormalement élevé

Le GB au trafic sortant cours des a dépassé les dernières 24h 10

  • Métrique : Network/Out
  • Seuil : 10 GB
  • Période : 24 h
  • Statistique : Somme(sum)
  • Action :SNS

SNS : Simple Notification Service

  • Gestion de « Topics » (type mailing-list)
    » Reçoit des messages et les notifie

  • Expéditeurs : « publishers »
    » Applications, serveurs, service AWS

  • Destinataires (mode push):
    » Adressese-mail
    » Numéro de tel pour SMS(US)
    » FonctionsLambda
    » Files d’attentes(SQS)
    » Applications(HTTP)

  • Envois groupés ou individuels
    » Gestion par « Topic»
    » Souscriptions

  • Interopérable avec les autres servicesAWS

  • Accessible par requêteAPI

AWS Logs : collecte, archivage, restitution, alarme

  • Les événements (logs) sont envoyés à CloudWatch par requête API
    » Agent à installer sur lesserveurs
    » Les logs sont remontés en tempsréel
  • Les logs sont organisés en « Log streams » : fichiers sources
    » Logstream :/var/log/tomcat/catalina.out
    » Logstream :/var/log/messages
  • Les « Log streams » sont regroupés par « Log group »
    » Bonne pratique : un groupe parapplication

AWS Logs

  • Rétention sans limite de temps
  • Possibilité d’automatiser la suppression des logs par groupe
    » Expiration variable de 1 jour à 10 ans
  • Export d’un groupe de logs sur S3
    » Définir lapériode
    » Préciser éventuellement un « stream»
    ○ Par ex. :/var/log/httpd/access_logs
    » Action à la demande (automatisable parcron)

AWS Logs

  • Restitution par la web console
  • Moteur de recherche par mots-clés
    » Recherche globale ou parstream
    » Recherche parpériode

AWS Logs : « metric filter »

  • Surveiller le nombre d’occurrence d’un événement
  • Création d’une métrique
    » Par ex. : réponses 4xx HTTP
  • Création d’une alarme CloudWatch
    » Notifier par mail si le nombre d’erreur 4xx explose

Events

  • Créer une règle qui va exécuter une action (target) selon un événement (Event)
  • Exemple:
    »Le statut de l’instance change -> notification SNS

Events

  • Types d’event
    » EC2
    ○ Changement d’état d’instances EC2
    ○ Running, shutting down,etc.
    » Schedule (crontab)
    » RequêteAPI
    » AutoScaling
    ○ EC2 Instance Launch Successful / Unsuccessful, Terminate,…

  • Target
    » Fonction Lambda
    » Notification SNS
    » Stream Kinesis
    » Built-in
    ○Snapshot volumeEBS
    ○Instance Reboot / terminate /stop

  • Exemples (Event / Target):
    »Le statut de l’instance a changé / notificationSNS
    »Toutes les 24h / faire un snapshot du volume EBS
    » 0 20 * * 2 - 6 * / Stopper l’instance

Dashboard

  • Tableau de bord personnalisé
  • Ajouter / supprimer des métriques et Widgets
    » Possibilité d’ajouter des métriques d’autresrégions






Decouvrez plus d’Offres de la plateform ItGalaxy.io :

Découvrez notre gamme complète de services et formations pour accélérer votre carrière.

1. Nous contactez

  • Description: Besoin de Formation et des Solutions cloud complètes pour vos applications
  • Links:

2. Infra as a Service

  • Description: Infrastructure cloud évolutive et sécurisée
  • Links:

3. Projets Développeurs


4. Développeurs


5. Formations Complètes


6. Marketplace

7. Blogs


This website is powered by ItGalaxy.io