La résilience d’un centre de données consiste à évaluer les risques et à adapter les pratiques
Le travail d’un centre de données consiste à stocker, gérer et fournir un accès aux données critiques qui permettent la prise de décision, pilotent les opérations et soutiennent les initiatives stratégiques.
Ces données doivent être protégées, que cette protection soit obligatoire ou non. Sinon, des conséquences telles que des défaillances opérationnelles, des pertes financières importantes ou pire pourraient en résulter.
Lorsqu’il s’agit de protéger les données, la sécurité de l’information vient souvent à l’esprit : cryptage, pare-feu, contrôles d’accès. Mais la protection des données repose aussi sur le temps de disponibilité. Sans cela, les temps d’arrêt peuvent entraîner une perte ou une corruption de données, ce qui a un impact négatif sur les opérations et la prise de décision.
Pour remédier aux vulnérabilités à l’origine des temps d’arrêt, vous devez d’abord comprendre les risques inhérents à votre centre de données, puis prendre des mesures pour les atténuer.
Détermination du profil de risque de votre centre de données
Le profil de risque de chaque centre de données est différent, composé d’un réseau complexe de facteurs internes et externes tels que :
- Probabilité de catastrophes naturelles (inondations, ouragans, feux de forêt, tremblements de terre, tornades, tempêtes de verglas, etc.)
- Possibilité de défaillance de l’équipement (pannes d’équipement de refroidissement, pannes de serveur, déconnexions accidentelles, etc.)
- Possibilité d’interruptions de courant (panne de réseau, fluctuations de tension, etc.)
- Emplacement et accès (probabilité d’entrée non autorisée, placement de l’infrastructure dans une installation, etc.)
Une fois que vous avez compris les risques réels, vous pouvez évaluer la probabilité d’occurrence et évaluer l’impact potentiel sur les opérations. Pour un hôpital, comment les temps d’arrêt affecteraient-ils les soins et la sécurité des patients en cas d’urgence ? Pour un fabricant, quel est le coût d’un retard dans l’exécution des commandes ou les transactions avec les clients ?
Voici quelques exemples de ce que vous devez prendre en compte lors de l’évaluation de votre profil de risque afin d’améliorer la résilience de votre centre de données.
Pour déterminer la probabilité d’une défaillance de l’équipement, vous pouvez prendre en compte des facteurs tels que :
- Formation du personnel : Les travailleurs prennent-ils des mesures pour minimiser de manière proactive les erreurs humaines et prévenir les erreurs lors des tâches de routine ?
- Configurations du système : L’espace permet-il une bonne circulation de l’air pour éviter la surchauffe ?
- Âge de l’équipement : L’équipement arrive-t-il en fin de vie ?
- Entretien: Un entretien régulier est-il effectué pour réduire les vulnérabilités ?
Pour déterminer la probabilité d’une entrée non autorisée, vous pouvez tenir compte de facteurs tels que :
- Fournisseurs tiers : Combien de vendeurs et de fournisseurs de services ont accès au site ? Sont-ils dignes de confiance ?
- Emplacement physique : Le centre de données se trouve-t-il dans un espace partagé ? Est-il facile à trouver pour les gens ? (Dans un hôpital, les patients errants pourraient-ils le trouver ? Dans une école, un élève pourrait-il le découvrir ?)
- Contrôle d’accès: Quels types de mesures de protection sont en place pour contrôler l’accès ? Les systèmes de gestion des visiteurs sont-ils utilisés ?
- Formation du personnel : Les travailleurs surveillent-ils et sont-ils capables de reconnaître les comportements suspects ? Suivent-ils les protocoles d’accès ?
À partir des réponses que vous découvrez, vous pouvez hiérarchiser les améliorations en fonction de l’urgence et de l’impact potentiel pour améliorer la résilience du centre de données.
Comprendre les exigences de fonctionnement lors de catastrophes et d’autres événements
Parce qu’elles sont essentielles à la sécurité publique, le Code international du bâtiment (IBC) exige que certains types d’installations, y compris de nombreux centres de données, poursuivent leurs activités lors de catastrophes naturelles et d’autres événements. C’est un élément à prendre en compte lorsque vous évaluez la résilience d’un centre de données.
Pour reconnaître les niveaux de risque, le BAC classe les installations en quatre groupes :
- La catégorie I comprend les bâtiments dont la défaillance présente un risque minimal pour la sécurité : installations agricoles et bâtiments de stockage
- La catégorie II comprend les bâtiments non couverts par d’autres catégories : la plupart des bâtiments commerciaux et résidentiels
- La catégorie III comprend les bâtiments où la défaillance présente un risque important pour la sécurité : amphithéâtres, théâtres, centrales électriques, prisons, stations d’épuration, etc.
- La catégorie IV comprend les installations essentielles qui doivent rester opérationnelles en cas de sinistre : tours de contrôle de l’aviation, usines chimiques, centres de données, postes de pompiers/de police, hôpitaux, etc.
Pour s’y conformer, les installations de catégorie IV doivent respecter des normes strictes de conception et de construction qui garantissent la résilience. Cela inclut également l’infrastructure de leur centre de données : racks, armoires, etc.
L’indice sismique d’une armoire ou d’un rack indique dans quelle mesure il peut protéger les équipements actifs et réduire les dommages (réduisant ainsi la perte de données) lors de fortes vibrations. Plus l’indice sismique est élevé, meilleure est la capacité du rack ou de l’armoire à tolérer un événement. Par exemple, les armoires ayant une cote sismique de zone 4 peuvent protéger l’équipement actif contre les dommages lors de tremblements de terre majeurs ou d’autres activités sismiques.
Il est essentiel de connaître votre environnement et ce qu’il faut pour protéger les infrastructures critiques afin de vous assurer que les opérations ne sont pas perturbées. Dans certaines juridictions, cela signifie également se conformer aux codes et exigences locaux.
Par exemple, parce qu’ils sont considérés comme une installation de catégorie 4 en vertu du CIB, même les hôpitaux qui ne sont pas dans des zones sismiques peuvent avoir besoind’armoires sismiques. Certains États peuvent également avoir des mandats supplémentaires pour les établissements de santé, qui pourraient inclure des exigences pour les armoires parasismiques, quel que soit l’endroit où l’établissement est situé.
Il est également important de noter que les exigences sont en constante évolution. Ils peuvent changer et changent avec le temps. Prenons l’exemple de l’évolution des meilleures pratiques pour l’installation de plateaux à échelle.
Dans le passé, les plateaux à échelle dans les hôpitaux étaient installés contre le mur avec des supports en L. Pendant l’activité sismique, cependant, les plateaux à échelle exercent parfois une force extrême sur les murs, causant des dommages. Lorsque cela a été découvert, des plateaux à échelle ont été installés à quelques centimètres des murs pour permettre la flexibilité.
Aujourd’hui, cependant, les normes d’installation exigent à nouveau que les plateaux à échelle soient installés directement contre le mur, mais ancrés sur des supports structurels tels que des poteaux au lieu de cloisons sèches. Ce changement garantit une installation plus sûre et plus stable tout en évitant d’endommager les murs et les câbles.
Il est important de se tenir au courant de ces bonnes pratiques, non seulement parce qu’il s’agit d’une exigence, mais aussi parce qu’il est essentiel de protéger vos données.
Ce qui fonctionne bien pour un centre de données ne fonctionne pas pour tous
De l’aménagement physique au climat, chaque centre de données fonctionne dans son propre cadre de variables. Ce qui fonctionne bien dans un établissement peut ne pas être efficace ou recommandé dans un autre en raison de ces différences.
Par exemple, à Los Angeles et dans certaines parties de San Francisco, il existe des exigences spécifiques pour l’installation de voies de câbles dans les hôpitaux afin d’éviter les balancements et les dommages qui provoquent des temps d’arrêt. Ici, au lieu du fil traditionnel, les suspensions de plafond doivent utiliser des tiges filetées pour une plus grande stabilité. Les supports en L doivent être solidement ancrés, avec au moins un pouce de profondeur d’ancrage.
Mais porter cette pratique à un état où les tornades sont probables peut ne pas être un bon choix. Le danger des débris volants est un facteur critique : si les tiges filetées se délogeaient, elles pourraient devenir des projectiles dans des scénarios de vent fort.
Prendre des décisions en fonction de votre environnement, des risques possibles et de la probabilité que ces risques se produisent est un bon moyen de garantir la résilience du centre de données et de protéger vos données.
Découvrez comment nous pouvons vous aider à prendre en charge les opérations critiques de votre centre de données.