Supercomputación
CPD instalaciones
El CPD cuenta con un sistema de ventilación redundado y en rotación además de un SAI capaz de proveer de suministro eléctrico a todos los servidores durante varios minutos (+30') y lineas de alimentación múltiples para cada armario. Como medida de protección anti incendios, el CPD dispone de un sistema automático de extinción de gas trifluorometano.
Cluster de cálculo
9 nodos de cálculo formando un total de:
- 160 Núcleos
- 1,42 TB de RAM
- 9 TB de almacenamiento local (1TB/nodo)
Compuestos por tres tipos de nodo diferentes:
- HP DL160 G6 : 8 Núcleos (Xeon E5640) y 64 GB de RAM (x8)
- Fujitsu RX200 S7: 12 Núcleos (Xeon E5-2640) y 120 GB de RAM (x3)
- HP DL 360 G9: 28 Núcleos (Xeon E5-2680 v4) y 256 GB de RAM (x5)
Un servidor de GPUs compuesto por 4 aceleradoras gráficas con un total de:
- 27.648 CUDA Cores
- 1TB de RAM
- 7TB de almacenamiento rápido
Cada aceleradora gráfica NVIDIA A100-SXM4-40GB cuenta con:
- 6.912 núcleos CUDA FP32
- 3.456 núcleos CUDA FP64
- 432 Tensor Cores
Sistema de almacenamiento
El sistema de almacenamiento principal es un clúster Isilon (Dell/EMC) Gen 6 de alta disponibilidad formado por 4 nodos H400 y 4 nodos A200.
- Capacidad de almacenamiento de 550TB
- Sistema de snapshots accesibles para los usuarios
El sistema provee de un sistema de ficheros unificado y homogéneo para todos los usuarios y está disponible tanto desde los nodos de cálculo como desde las estaciones de trabajo, simplificando así el trabajo de los investigadores.
Copias de seguridad / Recuperación de datos
El sistema de copias de seguridad está compuesto por:
- Librería HPE 4048 de dos drives LTO-7 y capacidad de 48 cintas (capacidad 768TBs)
- Librería Quantum Scalar i80 dos drives LTO-5 y capacidad de 50 cintas
Ambas librerías están gestionadas por el software de copias de seguridad Bacula.
La librería principal (HPE 4048) está destinada a copias de seguridad de los datos de los grupos, máquinas virtuales, bases de datos y archivado de datos a largo plazo.
La librería secundaria (Quantum Scalar i80) se encarga de copias redundantes de máquinas virtuales y trabajos de archivo en cinta LTO-5.
El sistema realiza copias de seguridad diarias de todos los datos y se mantiene un histórico de 3 meses. Las copias de seguridad de archivo, se guardan de forma indefinida.
Red
Los switches y la conexión de los equipos están configurados para alta disponibilidad. El sistema de almacenamiento Isilon, copias de seguridad y nodos DL 360 G9 están conectados mediante 10GB, el resto del clúster utiliza 1GB con interfaces agregadas.