Supercomputación

CPD instalaciones

El CPD cuenta con un sistema de ventilación redundado y en rotación además de un SAI capaz de proveer de suministro eléctrico a todos los servidores durante varios minutos (+30') y lineas de alimentación múltiples para cada armario. Como medida de protección anti incendios, el CPD dispone de un sistema automático de extinción de gas trifluorometano.

Cluster de cálculo

16 nodos de cálculo formando un total de:

  • 240 Núcleos
  • 2 Tb de RAM
  • 16 Tb de almacenamiento local (1Tb/nodo)

Compuestos por tres tipos de nodo diferentes:

  • HP DL160 G6 : 8 Núcleos (Xeon E5640)  y 64 GB de RAM (x8)
  • Fujitsu RX200 S7: 12 Núcleos (Xeon E5-2640) y 120 GB de RAM (x3)
  • HP DL 360 G9: 28 Núcleos (Xeon E5-2680 v4) y 256 GB de RAM (x5)

Un servidor de GPUs compuesto por 4 aceleradoras gráficas con un total de:

  • 27.648 CUDA Cores
  • 1TB de RAM
  • 7TB de almacenamiento rápido

Cada aceleradora gráfica NVIDIA A100-SXM4-40GB cuenta con:

  • 6.912 núcleos CUDA FP32
  • 3.456 núcleos CUDA FP64
  • 432 Tensor Cores

Sistema de almacenamiento

El sistema de almacenamiento principal es un clúster Isilon (Dell/EMC) Gen 6 de alta disponibilidad  formado por 4 nodos H400 y 4 nodos A200.

  • Capacidad de almacenamiento de 450Tb
  • Sistema de snapshots accesibles para los usuarios

El sistema provee de un sistema de ficheros unificado y homogéneo para todos los usuarios y está disponible tanto desde los nodos de cálculo como desde las estaciones de trabajo, simplificando así el trabajo de los investigadores.

.

Copias de seguridad - recuperación de datos

El sistema de copias de seguridad está compuesto por:

  • Librería HPE 4048 de dos drives LTO-7 y capacidad de 48 cintas (capacidad 768Tbs)
  • Librería Quantum Scalar i80 dos drives LTO-5 y capacidad de 50 cintas

Ambas librerías están gestionadas por el software de copias de seguridad Bacula.

La librería principal (HPE 4048)  está destinada a copias de seguridad de los datos de los grupos, máquinas virtuales, bases de datos y archivado de datos a largo plazo.

La librería secundaria (Quantum Scalar i80) se encarga de copias redundantes de máquinas virtuales y trabajos de archivo en cinta LTO-5.

El sistema realiza copias de seguridad diarias de todos los datos y se mantiene un histórico de 3 meses. Las copias de seguridad de archivo, se guardan de forma indefinida.

Red

La red del CPD está formada por 3 switches de 1Gb 3com 4210G y 3 switches de 10Gb HPE 5700. Los switches y la conexión de los equipos están configurados para alta disponibilidad. El sistema de almacenamiento Isilon, copias de seguridad y nodos DL 360 G9 están conectados mediante 10Gb, el resto del clúster utiliza 1Gb con interfaces agregadas.