Gardez vos clusters en bonne santé !

Mon collègue danois, Craig Forster, a publié récemment un article en anglais qui me semble très intéressant (Pour les rétifs à l’anglais, la traduction automatique est à peu près compréhensible). Il y est question de l’offre intitulée Cluster Server Risk Assessment Program ou CSRAP. Je vous avais déjà parlé des offres de services proactifs du support Microsoft autour de l’Active Directory. Pour les services de Cluster, Craig évoque uniquement l’offre CSRAP, mais indique les éléments testés. Une analyse sur les problèmes les plus fréquemment rencontrés serait également intéressante, sachant qu’une étude très ancienne du Gartner Group indiquait que près de 80% des causes d’indisponibilité étaient liées à des causes humaines.

Je retiens un conseil sous-jacent à l’expression “A cluster is for life, not just when the project goes live” : lorsque vous mettez en œuvre un cluster, vous en prenez pour toute sa vie. C’est à dire que l’exploitation, au quotidien, d’un cluster est considérablement plus complexe que des serveurs autonomes. Par conséquent, et certains d’entre vous m’ont déjà entendu le dire, voire l’écrire, il est plus simple d’exploiter des serveurs indépendant et de planifier correctement des plans de reprise d’activité et de continuité de services.