Bâtiments intelligents

La valeur de l'évaluation des risques du centre de données pour votre prochain projet

Shad Sechrist

Pour les centres de données, le risque ne signifie pas seulement des temps d'arrêt imprévus. Le risque peut être synonyme de perte de revenus, d'équipement endommagé, de clients mécontents et même de vies en danger.’—

 

Réduire les risque d'un centre de données commence par répondre à une question simple : qu'est-ce qui pourrait impacter les données et les systèmes essentiels ?

 

Avant le début d'un projet, une évaluation et une analyse des risques du centre de données peuvent révéler la réponse à cette question en identifiant les risques potentiels du centre de données, leur niveau de risque réel (dans quelle mesure les risques auront un impact sur les performances de l'entreprise s'ils se concrétisent) et les moyens d'atténuer le potentiel de survenue de ces risques. “”

 

Bien qu'il soit impossible d'éliminer toutes les causes potentielles de temps d'arrêt, telles que les erreurs humaines, les menaces de cybersécurité, les catastrophes naturelles, les pannes de serveur et la liste est longue, il est beaucoup plus pratique de prendre des mesures pour effectuer une évaluation des risques du centre de données afin de réduire les risques courants qui pourraient entraîner des temps d'arrêt.——’

 

Dans les nouveaux projets de centre de données, ces menaces au temps de disponibilité peuvent être réduites par des choix décidés pendant la phase de conception et le processus de planification. Cela commence par la détermination de la classe de disponibilité correcte du centre de données.’ Comprendre cela sera utile pour vous donner une idée des exigences minimum en termes de performance et de disponibilité pour votre projet.

 

La’disponibilité “d'un centre de données fait référence à sa capacité à remplir la fonction prévue.” Cette expression mathématique représente la disponibilité du système.

 

Temps de disponibilité/(temps de disponibilité + temps d'arrêt planifiés + temps d'arrêts non planifiés) = disponibilité

 

Dans cette équation :

 

  • Le temps de disponibilité et le temps d'arrêt sont mesurés en unités de temps dans une période donnée
  • La maintenance préventive, la configuration des équipements, les mises à jour, les tests et l'optimisation sont des exemples de temps d'arrêt planifiés.
  • Les réparations consécutives à une panne, les délais de maintenance et les coupures ou les pannes relatives à l'infrastructure sont des exemples de temps d'arrêt non planifiés

 

L'ANSI/TIA-942 catégorise les centres de données en quatre niveaux en prenant en évaluant les aspects électriques, architecturaux, mécaniques et de télécommunications selon la façon dont le centre de données devrait être conçu et construit :

 

  • Niveau 1 : composants à capacité unique et un seul chemin de distribution non redondant
  • Niveau 2 : composants de capacité redondants et un seul chemin de distribution non redondant
  • Niveau 3 : composants de capacité redondants et des chemins de distribution indépendants
  • Niveau 4 : composants de capacité redondants et chemin de distribution indépendant

 

L'Uptime Institute catégorise les centres de données avec une approche à quatre niveaux indiquant le niveau de résilience nécessaire :

 

  • Niveau 1 : niveau de capacité de base nécessitant une seule alimentation de secours (onduleur) pour les coupures, une zone pour les systèmes informatiques, un système de refroidissement dédié et un groupe électrogène
  • Niveau 2 : composants de capacité redondants pour l'alimentation et le refroidissement
  • Niveau 3 : réparables simultanément avec composants redondants
  • Niveau 4: systèmes indépendants et physiquement isolés qui agissent comme des composants de capacité redondants et des chemins de distribution

 

Il vous faut répondre à trois questions pour déterminer la bonne catégorie de disponibilité de votre projet de centre de données.

 

1. Quelles sont les exigences opérationnelles du centre de données ?’

 

Prenez en considération le temps disponible pour mener des coupures pour maintenance planifiée. Cela inclut le temps disponible pour couper et éteindre les systèmes, et effectuer la maintenance. Si le centre de données doit fonctionner 24h/24 et 7j/7 et ne peut pas supporter des heures d'arrêt pour maintenance planifiée, il s'agit probablement d'un centre de données de niveau 4 qui nécessite une redondance intégrée pour chaque composant.’

 

2. Quelle est la disponibilité opérationnelle du centre de données ?’

 

Déterminez les exigences de disponibilité opérationnelle du centre de données (la durée totale pendant laquelle le centre de données doit être capable d’offrir une assistance sans interruption).’

 

C'est là qu'entre en jeu l'expression “neuf de disponibilité” . La disponibilité est normalement exprimée en 9. Par exemple, “un temps de disponibilité de cinq neufs” se traduit par un temps de disponibilité de 99,999 %—ou une moyenne de moins de six minutes d'indisponibilité par an.

 

3. Quel est l’impact des temps d’arrêt sur le centre de données ?’

 

La troisième et dernière étape consiste à identifier l'impact du temps d'arrêt du centre de données sur une organisation. Dans quelle mesure va-t-il impacter l'activité ? Quelles sont les conséquences ?

 

Les temps d'arrêt n'ont pas tous le même impact. Par exemple, 15 minutes de temps d'arrêt pour une compagnie d'assurance ou une entreprise de divertissement n'auront pas le même impact que 15 minutes de temps d'arrêt pour un hôpital ou une usine.

 

N'oubliez pas : les types de centres de données ; le cloud’ &

 

Une fois ces questions répondues, il est temps de prendre en compte deux autres facteurs pour l'évaluation des risques de votre centre de données : le type de centre de données et la présence d'un environnement cloud.’ Ces deux considérations jouent un rôle pour déterminer le niveau de risque ou la tolérance.

 

Par exemple, la disponibilité est cruciale dans les centres données partagés offrant des services aux institutions financières, aux centres de santé, aux centres informatiques, aux usines, aux gouvernements et aux commerces. Les clients paient pour un certain niveau de redondance et une garantie que les systèmes seront toujours disponibles. Une interruption de service imprévue pourrait entraîner la fermeture de toutes les entreprises clientes.’

 

Outre le type de centre de données avec lequel vous travaillez, il faut également prendre en compte le cloud lors de la réalisation d'une évaluation des risques du centre de données.’’

 

Le cloud public offre des services via un fournisseur tiers sur Internet, et un fournisseur tiers est responsable de sa gestion et de sa maintenance. Un cloud privé est un centre de données sur site comprenant un serveur, des capacités de stockage, de mémoire et de mise en réseau. Le cloud hybride associe cloud privé et cloud public. Chacun a ses propres exigences et tolérances quant aux temps d'arrêt.

 

Planifier les incidents potentiels

 

La dernière étape dans l'évaluation des risques pour un nouveau centre de données est d'établir un plan pour la continuité de l'activité ou la reprise après incident pour s'assurer que les informations puissent être retrouvées rapidement en cas de sinistre.

 

Parce que chaque environnement informatique est unique, il n'y a’ Il existe un processus unique qui fonctionne pour tous les centres de données, mais chaque plan doit inclure trois éléments :

 

  1. Des mesures préventives pour essayer d'éviter les sinistres en déterminant et en réduisant les risques. Ces mesures peuvent inclure des plans de sauvegarde logiciels, des alimentations de secours, des générateurs, ainsi que des inspections et des maintenances de routine.
  2. Des mesures de détection, nécessitant des actions pour éliminer les événements non désirés. Ces mesures incluent des systèmes dédiés à la sécurité et aux incendies, des logiciels antivirus, des sauvegarde de logiciels et la formation des employés.
  3. Des mesures correctives ou réactives minimisant les pertes ou la durée des temps d'arrêt.
    1. La reprise après sinistre en tant que service (DRaaS) est une solution de mise en miroir géographiquement dispersée permettant la récupération de données et la capacité de récupération si le centre de données principal tombe en panne ou cesse de fonctionner. Elle vous permet également de récupérer des données jusqu'à un certain délai défini.
    2. Construisez un deuxième centre de données et faites-le fonctionner passivement jusqu'à ce que vous en ayez besoin— ou l'exécuter activement avec le centre de données principal pour récupérer le traitement et le stockage en cas de sinistre ou de catastrophe.

 

Si vous avez besoin d'évaluer les risques de votre futur centre de données, nos experts sont là pour vous aider.

 

Pour en savoir plus sur l'évaluation des risques des centres de données et sur beaucoup d'autres sujets relatifs aux centres de données, explorez notre nouveau cours de formation Introduction aux éléments essentiels des centres de données niveau 1, disponible à la demande ou dans le cadre de la Belden Academy. Validez trois crédits de formation continue, explorez les caractéristiques rendant les projets de centres de données uniques et découvrez des astuces pour réussir la gestion des projets de centres de données du début à la fin.

 

Commencez ici à apprendre auprès de nos experts en centres de données et validez votre certification.