Bâtiments intelligents

La valeur de l'évaluation des risques du centre de données pour votre prochain projet

Shad Sechrist

Pour les centres de données, le risque ne signifie pas seulement que les temps d'arrêt non planifiés peuvent engendrer une perte de chiffre d'affaires, endommager des équipements, agacer les clients et même mettre des vies en danger.

 

Réduire les risque d'un centre de données commence par répondre à une question simple : qu'est-ce qui pourrait impacter les données et les systèmes essentiels ?

 

Avant de lancer un projet, l'évaluation et l'analyse de risques du centre de données peuvent répondre à cette question en identifiant des risques potentiels, leur niveau (dans quelle mesure ces risques impacteront la performance s'ils se produisent) et les façons de réduire l'apparition de ces risques.

 

Même s'il est impossible d'éliminer toutes les causes potentielles d'une interruption de service (l'erreur humaine, les menaces relatives à la cybersécurité, les catastrophes naturelles, les pannes de serveur, et la liste est encore longue), il s'avère beaucoup plus efficace de mener une évaluation d'un centre de données pour diminuer les risques fréquents susceptibles de provoquer des temps d'arrêt.

 

Dans les nouveaux projets de centre de données, ces menaces au temps de disponibilité peuvent être réduites par des choix décidés pendant la phase de conception et le processus de planification. Cela commence par le fait de déterminer si la catégorie de disponibilité du centre de données est correcte. Comprendre cela sera utile pour vous donner une idée des exigences minimum en termes de performance et de disponibilité pour votre projet.

 

La « disponibilité » d'un centre de données se réfère à sa capacité à effectuer sa fonction prévue. Cette expression mathématique représente la disponibilité du système.

 

Temps de disponibilité/(temps de disponibilité + temps d'arrêt planifiés + temps d'arrêts non planifiés) = disponibilité

 

Dans cette équation :

 

  • Le temps de disponibilité et le temps d'arrêt sont mesurés en unités de temps dans une période donnée
  • La maintenance préventive, la configuration des équipements, les mises à jour, les tests et l'optimisation sont des exemples de temps d'arrêt planifiés.
  • Les réparations consécutives à une panne, les délais de maintenance et les coupures ou les pannes relatives à l'infrastructure sont des exemples de temps d'arrêt non planifiés

 

L'ANSI/TIA-942 catégorise les centres de données en quatre niveaux en prenant en évaluant les aspects électriques, architecturaux, mécaniques et de télécommunications selon la façon dont le centre de données devrait être conçu et construit :

 

  • Niveau 1 : composants à capacité unique et un seul chemin de distribution non redondant
  • Niveau 2 : composants de capacité redondants et un seul chemin de distribution non redondant
  • Niveau 3 : composants de capacité redondants et des chemins de distribution indépendants
  • Niveau 4 : composants de capacité redondants et chemin de distribution indépendant

 

L'Uptime Institute catégorise les centres de données avec une approche à quatre niveaux indiquant le niveau de résilience nécessaire :

 

  • Niveau 1 : niveau de capacité de base nécessitant une seule alimentation de secours (onduleur) pour les coupures, une zone pour les systèmes informatiques, un système de refroidissement dédié et un groupe électrogène
  • Niveau 2 : composants de capacité redondants pour l'alimentation et le refroidissement
  • Niveau 3 : réparables simultanément avec composants redondants
  • Niveau 4: systèmes indépendants et physiquement isolés qui agissent comme des composants de capacité redondants et des chemins de distribution

 

Il vous faut répondre à trois questions pour déterminer la bonne catégorie de disponibilité de votre projet de centre de données.

 

1. Quelles sont les exigences opérationnelles du centre de données ?

 

Prenez en considération le temps disponible pour mener des coupures pour maintenance planifiée. Cela inclut le temps disponible pour couper et éteindre les systèmes, et effectuer la maintenance. Si le centre de données doit fonctionner 24h/24 et 7 jours/7 et ne peut supporter la moindre coupure pour maintenance planifiée, il s'agit certainement d'un centre de données de niveau 4 qui nécessite une redondance intégrée pour tous les composants.

 

2. Quelle est la disponibilité opérationnelle du centre de données ?

 

Il est nécessaire de déterminer les exigences en termes de disponibilité opérationnelle du centre de données (le temps total que le centre de données doit être capable de supporter sans interruption).

 

C'est là qu'entrent en jeu les « disponibilités de 99,9999 % ». La disponibilité est généralement exprimée en 9. Par exemple, un « temps de disponibilité de cinq neuf » signifie 99,999 % de temps de disponibilité sur une moyenne de moins de six minutes de temps d'arrêt par an.

 

3. Quel est l'impact du temps d'arrêt du centre de données ?

 

La troisième et dernière étape consiste à identifier l'impact du temps d'arrêt du centre de données sur une organisation. Dans quelle mesure va-t-il impacter l'activité ? Quelles sont les conséquences ?

 

Les temps d'arrêt n'ont pas tous le même impact. Par exemple, 15 minutes de temps d'arrêt pour une compagnie d'assurance ou une entreprise de divertissement n'auront pas le même impact que 15 minutes de temps d'arrêt pour un hôpital ou une usine.

 

N'oubliez pas : les types de centres de données et le cloud

 

Après avoir répondu à ces questions, il est temps de considérer deux facteurs supplémentaires pour évaluer les risques de votre centre de données : le type de centre de données et la présence d'un cloud. Ces deux considérations jouent un rôle pour déterminer le niveau de risque ou la tolérance.

 

Par exemple, la disponibilité est cruciale dans les centres données partagés offrant des services aux institutions financières, aux centres de santé, aux centres informatiques, aux usines, aux gouvernements et aux commerces. Les clients paient pour un certain niveau de redondance et une garantie que les systèmes seront toujours disponibles. Les temps d'arrêt non planifiés peuvent avoir des conséquences négatives sur toutes les activités des clients.

 

En plus du type de centre de données avec lequel vous travaillez, il vous faut également prendre le cloud en considération lorsque vous évaluez les risques.

 

Le cloud public offre des services via un fournisseur tiers sur Internet, et un fournisseur tiers est responsable de sa gestion et de sa maintenance. Un cloud privé est un centre de données sur site comprenant un serveur, des capacités de stockage, de mémoire et de mise en réseau. Le cloud hybride associe cloud privé et cloud public. Chacun a ses propres exigences et tolérances quant aux temps d'arrêt.

 

Planifier les incidents potentiels

 

La dernière étape dans l'évaluation des risques pour un nouveau centre de données est d'établir un plan pour la continuité de l'activité ou la reprise après incident pour s'assurer que les informations puissent être retrouvées rapidement en cas de sinistre.

 

Chaque environnement informatique étant unique, il n'existe pas de procédure unique fonctionnant pour tous les centres de données. Mais chaque plan doit comprendre trois éléments :

 

  1. Des mesures préventives pour essayer d'éviter les sinistres en déterminant et en réduisant les risques. Ces mesures peuvent inclure des plans de sauvegarde logiciels, des alimentations de secours, des générateurs, ainsi que des inspections et des maintenances de routine.
  2. Des mesures de détection, nécessitant des actions pour éliminer les événements non désirés. Ces mesures incluent des systèmes dédiés à la sécurité et aux incendies, des logiciels antivirus, des sauvegarde de logiciels et la formation des employés.
  3. Des mesures correctives ou réactives minimisant les pertes ou la durée des temps d'arrêt.
    1. La reprise après sinistre en tant que service (DRaaS) est une solution de mise en miroir géographiquement dispersée permettant la récupération de données et la capacité de récupération si le centre de données principal tombe en panne ou cesse de fonctionner. Elle vous permet également de récupérer des données jusqu'à un certain délai défini.
    2. Développez un second centre de données en le faisant fonctionner de manière passive jusqu'à en avoir besoin ou de manière active aux côtés du centre de données principal pour collecter les traitements et le stockage en cas d'incident ou de sinistre.

 

Si vous avez besoin d'évaluer les risques de votre futur centre de données, nos experts sont là pour vous aider.

 

Pour en savoir plus sur l'évaluation des risques des centres de données et sur beaucoup d'autres sujets relatifs aux centres de données, explorez notre nouveau cours de formation Introduction aux éléments essentiels des centres de données niveau 1, disponible à la demande ou dans le cadre de la Belden Academy. Validez trois crédits de formation continue, explorez les caractéristiques rendant les projets de centres de données uniques et découvrez des astuces pour réussir la gestion des projets de centres de données du début à la fin.

 

Commencez ici à apprendre auprès de nos experts en centres de données et validez votre certification.