Supercomputación

CPD instalaciones

El CPD cuenta con un sistema de ventilación redundado y en rotación además de un SAI capaz de proveer de suministro eléctrico a todos los servidores durante varios minutos (+30') y lineas de alimentación múltiples para cada armario. Como medida de protección anti incendios, el CPD dispone de un sistema automático de extinción de gas trifluorometano.

Cluster de cálculo

9 nodos de cálculo formando un total de:

  • 160 Núcleos
  • 1,42 TB de RAM
  • 9 TB de almacenamiento local (1TB/nodo)

Compuestos por tres tipos de nodo diferentes:

  • HP DL160 G6 : 8 Núcleos (Xeon E5640)  y 64 GB de RAM (x8)
  • Fujitsu RX200 S7: 12 Núcleos (Xeon E5-2640) y 120 GB de RAM (x3)
  • HP DL 360 G9: 28 Núcleos (Xeon E5-2680 v4) y 256 GB de RAM (x5)

Un servidor de GPUs compuesto por 4 aceleradoras gráficas con un total de:

  • 27.648 CUDA Cores
  • 1TB de RAM
  • 7TB de almacenamiento rápido

Cada aceleradora gráfica NVIDIA A100-SXM4-40GB cuenta con:

  • 6.912 núcleos CUDA FP32
  • 3.456 núcleos CUDA FP64
  • 432 Tensor Cores

Sistema de almacenamiento

El sistema de almacenamiento principal es un clúster Isilon (Dell/EMC) Gen 6 de alta disponibilidad  formado por 4 nodos H400 y 4 nodos A200.

  • Capacidad de almacenamiento de 550TB
  • Sistema de snapshots accesibles para los usuarios

El sistema provee de un sistema de ficheros unificado y homogéneo para todos los usuarios y está disponible tanto desde los nodos de cálculo como desde las estaciones de trabajo, simplificando así el trabajo de los investigadores.

Copias de seguridad / Recuperación de datos

El sistema de copias de seguridad está compuesto por:

  • Librería HPE 4048 de dos drives LTO-7 y capacidad de 48 cintas (capacidad 768TBs)
  • Librería Quantum Scalar i80 dos drives LTO-5 y capacidad de 50 cintas

Ambas librerías están gestionadas por el software de copias de seguridad Bacula.

La librería principal (HPE 4048) está destinada a copias de seguridad de los datos de los grupos, máquinas virtuales, bases de datos y archivado de datos a largo plazo.

La librería secundaria (Quantum Scalar i80) se encarga de copias redundantes de máquinas virtuales y trabajos de archivo en cinta LTO-5.

El sistema realiza copias de seguridad diarias de todos los datos y se mantiene un histórico de 3 meses. Las copias de seguridad de archivo, se guardan de forma indefinida.

Red

Los switches y la conexión de los equipos están configurados para alta disponibilidad. El sistema de almacenamiento Isilon, copias de seguridad y nodos DL 360 G9 están conectados mediante 10GB, el resto del clúster utiliza 1GB con interfaces agregadas.