Dispositifs UPS, SOX et autres désastres
Sep 9, 2014
Rapportez la Princesse des Ténèbres. La direction m'avait demandé de leur faire visiter les centres de données. Il y avait beaucoup de questions, dont beaucoup se retrouveront dans de futurs articles.
Je me souviens qu'elle s'est penchée et a regardé l'un de nos appareils APC UPS flambant neufs et a demandé doucement, « Comment savez-vous qu'ils fonctionneront réellement ? » Je la rencontre avec un silence choqué. Après tout, un UPS est l'une de ces choses que l'on prend pour acquises, n'est-ce pas. Tout comme le lever du soleil le matin, ils sont fiables à ce point. Quand vous en aurez besoin, ils répondront.
Malheureusement, ce n'est pas aussi simple.
Les alimentations sans interruption (UPS) sont désormais un élément essentiel pour l'informatique. Et ce qu'elle demandait, de manière détournée et en jouant l'avocat du diable, c'était combien de réflexion nous avions réellement consacrée à leur sujet. Ou si nous étions simplement allés en ligne, en disant, « Tiens, celle-là a l'air bien » et l'avions achetée.
Je pense que c’est ainsi que nous avons honnêtement acheté la chose, mais il y a une science pour les sélectionner.
Alors, parlons-en un peu. Les onduleurs sont conçus pour maintenir les systèmes opérationnels lors d'une baisse de tension, une fluctuation de courant, ou pour vous donner suffisamment de temps pour tout éteindre de manière ordonnée. Si vous vous souvenez du graphique d'un des articles précédents, les coupures électriques sont en tête de liste des causes poussant les entreprises à activer leurs plans d'urgence. Ainsi, nos dispositifs onduleurs deviennent notre première et meilleure ligne de défense contre ces incidents. Malheureusement, trop souvent, nous les achetons (et ils peuvent ou non répondre à nos besoins même à ce moment-là) puis nous oublions simplement qu'ils existent. Un dispositif onduleur est l'une de ces choses que nous nous attendons à fonctionner quand nous en avons besoin, mais tout comme une roue de secours sur une voiture, à moins de les vérifier de temps en temps, ils pourraient ne pas fonctionner comme nous l'espérons.
Tout d'abord, comment choisir un UPS. De nombreux fabricants ont un site où vous pouvez aller et commencer à saisir des données telles que le nombre de systèmes généralement en panne par fabricant, numéro de modèle, etc. Vous indiquez également combien de temps vous souhaitez rester opérationnel. Si la première partie n'est pas très compliquée, la seconde l'est. Plus vous souhaitez rester opérationnel avec votre charge, plus le coût est élevé. Donc, à un moment donné, nous devons simplement accepter les faits et réaliser que les batteries sont là pour nous permettre de continuer à fonctionner pendant un certain temps et, si ce temps est dépassé, de nous permettre d'éteindre les systèmes sans pertes.
Deuxièmement, un onduleur a une date d'expiration pour ainsi dire, ou plus spécifiquement, les batteries en elles le font. Avec le temps, elles commencent à perdre la capacité de prendre ou de conserver une charge, et la plupart des gens le remarquent quand il est trop tard (en bref, lorsque les lumières s'éteignent, et les serveurs également). Il y a un certain nombre de tâches que nous devons effectuer en tant qu'administrateurs de réseau et de systèmes, et l'une d'elles est que nous devons, au moins, effectuer des vérifications mensuelles de nos appareils UPS. La plupart ont de nos jours une interface web qui vous permet d'entrer et d'obtenir un rapport sur la batterie. L'une des choses qu'elle vous indiquera est la quantité de charge qu'elles prennent, un temps projeté lorsqu'elles s'épuiseront sous la charge actuelle si le courant se coupe, comment les batteries se portent, identifier les cellules défectueuses, etc. De plus, si certains problèmes surviennent, vous pouvez en être notifié par e-mail (et vous devriez vraiment les configurer).
Il y a bien plus à faire avec un UPS que simplement les brancher, brancher nos systèmes et les oublier. Ils représentent une forme ultime d'assurance et, comme toute assurance, vous devez y prêter une certaine attention. La prise en charge et l'administration de vos appareils UPS est quelque chose qui doit être réfléchi, consigné par écrit et traité tout comme vous le feriez pour la gestion des correctifs ou l'administration AV. C'est important et le fait de ne pas y prêter attention peut vous coûter cher en serveurs endommagés, en perte de données, ce qui se traduit par une perte d'argent.
Cela nous amène aux générateurs. Un générateur serait une excellente chose à avoir, mais vous devez l'envisager de plusieurs points de vue différents pour justifier ou non d'en avoir un, mais tout se résume à cela. À quelle fréquence en avez-vous vraiment besoin ? Si vous subissez des coupures de courant prolongées disons une fois par an et que cela dure peut-être une ou deux heures, cela justifie-t-il la dépense pour l'achat d'un générateur, son intégration au système électrique de votre centre de données, puis le coût mensuel assorti pour maintenir ce système ?
Il y a un autre aspect à cela, et c'est très simple. Existe-t-il une obligation quelconque qui stipule que nous devons en avoir une ? Si vous êtes un établissement de santé, alors cela pourrait s'appliquer, mais une petite entreprise ?
Tout se résume à cela, est-ce que cela coûtera plus cher que la somme d'argent que vous perdrez lors d'une panne de courant.
Si vous décidez d'acquérir un générateur, il y a des règles à suivre. Tout d'abord, vous devez les tester, et cela au moins tous les trimestres. La plupart des gens pensent qu'il suffit de le démarrer. Cela peut être suffisant pour un test mensuel, mais de temps en temps, vous devez vérifier s'il fera réellement ce qu'il est censé faire, c'est-à-dire maintenir votre centre de données opérationnel. Cela signifie s'assurer que si le courant se coupe, il peut alimenter vos systèmes.
Ce n'est pas une mauvaise idée de tester les batteries dans des situations similaires. Retirez la prise du mur et voyez si le système reste opérationnel comme il le devrait.
Je ne ferais certainement pas cela pendant la période où tout le monde les utilise, mais c’est quelque chose qui doit être planifié et programmé pour minimiser l'impact de la panne. Nous en parlerons un peu plus lorsque nous aborderons les exercices plus tard.
Oh, puisque SOX accorde beaucoup d'importance à la documentation, on pourrait vous demander de présenter les journaux lorsqu'ils ont été testés, les résultats de la maintenance, etc. Donc, gardez une trace de tout cela. J'aime tout intégrer dans un ticket et le classer sous les tâches mensuelles.
Partager sur
En savoir plus
À propos de l'auteur
Richard Muniz
Consultant informatique indépendant
Richard est consultant informatique indépendant, blogueur et enseignant chez Saisoft où il donne des cours d'administration VMware, Citrix XenApp, de planification et de récupération après sinistre pour l'IT, ainsi que Comptia Server+.
En savoir plus sur ce sujet
Lois sur la confidentialité des données par État : Différentes approches de la protection de la vie privée
Exemple d'analyse des risques : Comment évaluer les risques
Le Triangle CIA et son application dans le monde réel
Qu'est-ce que la gestion des documents électroniques ?
Analyse quantitative des risques : Espérance de perte annuelle