Supercomputació

Instal·lacions DC

El DC té un sistema de refrigeració amb redundància integrada, també disposa d'un SAI capaç de mantenir el subministrament d'electricitat per a tots els servidors durant diversos minuts (30+) i múltiples línies d'alimentació per a cada armari. El CPD disposa d'un sistema automàtic d'extinció de gasos trifluorometà, com a protecció contra el foc.

Clúster de computació

16 nodes de càlcul formant un total de:

  • 240 Nuclis
  • 2 Tb de RAM
  • 16 Tb d'emmagatzematge local (1Tb/node)

Compostos per tres tipus de node diferents:

  • HP DL160 G6: 8 Nuclis (Xeon E5640) i 64 GB de RAM (x8)
  • Fujitsu RX200 S7: 12 Nuclis (Xeon E5-2640) i 120 GB de RAM (x3)
  • HP DL 360 G9: 28 Nuclis (Xeon E5-2680 v4) i 256 GB de RAM (x5)

Un servidor de GPUs compost per 4 acceleradores gràfiques amb un total de:

  • 27.648 CUDA Cores
  • 1TB de RAM
  • 7TB d'emmagatzematge ràpid

Cada acceleradora gràfica NVIDIA A100-SXM4-40GB compta amb:

  • 6.912 nuclis CUDA FP32
  • 3.456 nuclis CUDA FP64
  • 432 Tensor Cores

Sistema d'emmagatzematge

El sistema d’emmagatzematge principal és un Isilon d’alta disponibilitat (Dell/EMC) Gen 6 amb quatre nodes H400 i quatre nodes A200.

Capacitat d’emmagatzematge disponible 450TB sistema Snapshot disponible per a usuaris.

S’ofereix un sistema d’arxiu unificat per a tots els usuaris i disponible des dels nodes computacionals o des dels punts de treball, simplificant així la feina per al personal investigador.

Backup/Recuperació de dades

El sistema de backup i recuperació de dades consisteix en:

  • Llibreria HPE 4048 amb dos LTO-7 drives i capacitat per a 48 cintes (768 Tbs de capacitat)
  • Quantum Scalar i80 dos discs LTO-5 amb capacitat per a 50 cintes. Totes les llibreries es gestionen amb software de backup Bacula.

La llibreria principal (HPE 4048) és per còpies de seguretat de dades dels grups, màquines virtuals, bases de dades i dades allotjades a llarg termini.

La llibreria secundària (Quantum Scalar i80) treballa amb còpies redundants de màquines virtuals i feina arxivada en cintes LTO5.

El sistema fa backups diaris de dades i amb una política de retenció de dades per defecte de 3 mesos. L’arxiu de feines recuperades es desen indefinidament.

Xarxa

La xarxa la conformen 3 switchs d’1Gb 3com 4210G i 3 switchs de 10Gb HPE 5700. Els switchs i connexions de les maquines estan configurats per una màxima disponibilitat. El sistema d’emmagatzematge Isilon, principal sistema de backup i DL 360 nodes computacionals estan connectats a través de 10GB, la resta del clúster utilitza 1Gb amb interfícies agregades.