Le Centre de calcul du CERN se prépare à la deuxième période d’exploitation

Alors que le monde attend les données de la deuxième période d’exploitation avec une grande impatience, le Centre de calcul du CERN se prépare au déluge. Avec plus de cent pétaoctets supplémentaires attendus au cours des trois prochaines années, le volume de données de la deuxième période d’exploitation du LHC sera nettement plus important que celui de la première période. Comment le CERN gérera-t-il cette avalanche de résultats ? Le Bulletin a enquêté du côté du département IT pour le savoir...

 

Le Centre de calcul du CERN : le coeur de toute l'infrastructure scientifique, administrative et informatique du CERN.

Pour chaque seconde de temps d’exploitation, plusieurs gigaoctets de données parviendront au Centre de calcul du CERN pour y être stockés, triés et partagés avec des physiciens dans le monde entier. Afin de faire face à cet afflux massif de données, le groupe Stockage des données et services des données du CERN s’est concentré sur trois aspects : vitesse, capacité et fiabilité.

Le groupe s’est attaché avant tout à augmenter le rythme auquel les données peuvent être stockées. « Pendant la première période d’exploitation, nous stockions 1 Go/s, avec des pics occasionnels de 6 Go/s, explique Alberto Pace, qui dirige le groupe Stockage des données et services des données au sein du département IT. Pour la deuxième période d’exploitation, le débit qui constituait notre maximum sera maintenant considéré comme une moyenne, et nous pensons pouvoir aller jusqu’à 10 Go/s si nécessaire. »

Cette augmentation du rythme de stockage des données est rendue possible notamment par les améliorations apportées au système de stockage CASTOR. CASTOR donne la priorité au stockage sur bandes, lesquelles sont plus robustes et par conséquent idéales pour la conservation à long terme. Grâce aux nouvelles améliorations apportées au logiciel CASTOR, les dérouleurs de bandes et les bibliothèques de bandes du CERN peuvent être utilisés de manière plus efficace, sans temps mort ni retard, ce qui permet au Centre de calcul d'augmenter le rythme auquel les données peuvent être mises sur bande et en être extraites.

Le groupe Stockage des données et service des données a également dû, en vue de la deuxième période d’exploitation, réduire le risque de perte de données – et le problème du stockage massif de données que cela représente. « Nous voulions donner aux expériences la possibilité de choisir leur solution de stockage en fonction du type de données qu’elles ont besoin de conserver, poursuit Alberto Pace. Nous avons donc ajouté à notre système EOS une option de "découpage" des données. Cette option segmente les données et permet de garder sur disque les données récemment enregistrées afin qu’elles soient accessibles rapidement. »

« Cela nous a permis d’augmenter nettement notre capacité totale de données en ligne, ajoute Alberto Pace. Nous avons 140 pétaoctets d’espace brut sur disque disponible pour les données de la deuxième période d’exploitation, répartis entre le Centre de calcul du CERN à Meyrin et le Centre de calcul Wigner à Budapest (Hongrie). Cela signifie environ 60 Po de capacité de stockage, en comptant les fichiers de secours. »

À présent, en plus d’utiliser la technique habituelle de la « réplication » – par laquelle une copie dupliquée est conservée pour toutes les données –, les expériences pourront répartir les données entre plusieurs disques. Cette technique de « découpage » divise les données en fragments. L’utilisation d’algorithmes de reconstruction signifie que le contenu ne sera pas perdu, même si plusieurs disques connaissent une défaillance. Cela permet non seulement de diminuer le risque de perte de données, mais aussi de diviser par deux l’espace nécessaire au stockage des fichiers de secours.

« Même si ce n’est pas la solution optimale pour les données auxquelles l’accès est très demandé, la reconstruction des données à partir de fragments étant plus exigeante en termes d’entrée et de sortie, c’est une très bonne solution pour des données auxquelles on accède moins fréquemment, précise Alberto Pace. Nous avons à présent un système qui nous permet d’effectuer des réglages favorisant la performance ou la fiabilité, selon le type de données. »

Enfin, le groupe Stockage des données et services des données vise aussi à améliorer encore la disponibilité du système EOS. Pendant la première période d’exploitation du LHC, EOS était disponible pour les utilisateurs environ 98,5 % du temps. Le groupe a maintenant l’objectif ambitieux d’améliorer ce chiffre et de le porter à plus de 99,5 % pour la durée de la deuxième période d’exploitation.

Avec une plus grande vitesse et de nouvelles solutions de stockage, le Centre de calcul du CERN est fin prêt à relever tous les grands défis de la deuxième période d'exploitation.

par Katarina Anthony