Supercomputación (HPC)

GINYS-IGTP-003
Francisco Javier Perez Vicente
Administrador Científic de Sistemes

DC, IGTP
Edifici Muntanya
Carretera de Can Ruti, Camí de les escoles, s/n
08916 Badalona, ​​Barcelona, ​​Spain

La plataforma provee la infraestructura de hardware y herramientas de software que los investigadores (bioinformáticos y bioestadísticos) necesitan. La finalidad de la plataforma es ayudar a los investigadores en sus necesidades computacionales, liverando la carga que supone la gestión de sistemas y software, de manera que puedan centrarse en los retos científicos. Esas necesidades varían desde el consejo en buenas prácticas de computación científica, instalación de software, configuracion de servicios y servidores e incluso la modificación o creación de soluciones personalizadas en caso de necesidad. La plataforma está continuamente actualizándose a las últimas tecnologías de almacenamiento, virtualización y gestión de software para ofrecer servicios de la máxima calidad.

Servicios

Mantenimiento y apoyo a la infraestructura

  • Mantener la infraestructura en funcionamiento 24/7
  • Instalación y mantenimiento del sistema operativo, actualmente Debian GNU/Linux en todos los equipos del clúster de cálculo y estaciones de trabajo
  • Instalación, mantenimiento y actualización del software científico
  • Administración del sistema de ficheros del clúster
  • Administración de la infraestructura de red del clúster
  • Administración del sistema de copias de seguridad y restauración de datos

Instalación y mantenimiento de servidores y servicios

(incluídos pero no limitados a:)

  • Servidores web y de servicios públicos y privados
  • Instalación y mantenimiento de bases de datos
  • Servicio FTP(s)
  • Sistema interno de control de versiones (gitlab)
  • Sistema de monitorización de rendimiento y alertas
  • Sistema de colas (SGE)

Seguridad de sistemas (hardening, auditing, patching)

Asesoramiento a los investigadores en tareas computacionales

  • Supercomputación
  • Buenas prácticas en diseño de pipelines y programas
  • Asesoramiento en compra de hardware

Accés obert al portal de bioinformàtica

Acceso abierto a las herramientas desarrolladas por IGTP

Herramientas de Maplab (plotter de metilación, ontología de Alu, wanderer, Chainy, trackhub TrukeTCGA 450k)

Illot Regulome

Ferritina alta

SERES

Equipos

El CPD cuenta con un sistema de ventilación redundado y en rotación además de un SAI capaz de proveer de suministro eléctrico a todos los servidores durante varios minutos (+30′) y lineas de alimentación múltiples para cada armario. Como medida de protección anti incendios, el CPD dispone de un sistema automático de extinción de gas trifluorometano.

  • Cluster de cálculo

16 nodos de cálculo formando un total de:

240 Núcleos
2 Tb de RAM
16 Tb de almacenamiento local (1Tb/nodo)
Compuestos por tres tipos de nodo diferentes:

HP DL160 G6 : 8 Núcleos (Xeon E5640) y 64 GB de RAM (x8)
Fujitsu RX200 S7: 12 Núcleos (Xeon E5-2640) y 120 GB de RAM (x3)
HP DL 360 G9: 28 Núcleos (Xeon E5-2680 v4) y 256 GB de RAM (x5)

  • Sistema de almacenamiento

El sistema de almacenamiento principal es un clúster Isilon (Dell/EMC) Gen 6 de alta disponibilidad formado por 4 nodos H400 y 4 nodos A200.

Capacidad de almacenamiento de 450Tb
Sistema de snapshots accesibles para los usuarios
El sistema provee de un sistema de ficheros unificado y homogéneo para todos los usuarios y está disponible tanto desde los nodos de cálculo como desde las estaciones de trabajo, simplificando así el trabajo de los investigadores.

  • Copias de seguridad – recuperación de datos

El sistema de copias de seguridad está compuesto por:

Librería HPE 4048 de dos drives LTO-7 y capacidad de 48 cintas (capacidad 768Tbs)
Librería Quantum Scalar i80 dos drives LTO-5 y capacidad de 50 cintas
Ambas librerías están gestionadas por el software de copias de seguridad Bacula.

La librería principal (HPE 4048) está destinada a copias de seguridad de los datos de los grupos, máquinas virtuales, bases de datos y archivado de datos a largo plazo.

La librería secundaria (Quantum Scalar i80) se encarga de copias redundantes de máquinas virtuales y trabajos de archivo en cinta LTO-5.

El sistema realiza copias de seguridad diarias de todos los datos y se mantiene un histórico de 3 meses. Las copias de seguridad de archivo, se guardan de forma indefinida.

  • Red

La red del CPD está formada por 3 switches de 1Gb 3com 4210G y 3 switches de 10Gb HPE 5700. Los switches y la conexión de los equipos están configurados para alta disponibilidad. El sistema de almacenamiento Isilon, copias de seguridad y nodos DL 360 G9 están conectados mediante 10Gb, el resto del clúster utiliza 1Gb con interfaces agregadas.

Personal

Francisco Javier Perez Vicente | hpc@igtp.cat | 935 543 079

CENTRO

IGTP - Institut d'Investigació en Ciències de la Salut Germans Trias i Pujol

Edifici Mar
Ctra. de Can Ruti,
Camí de les escoles, s/n

08916 Badalona http://www.germanstrias.org/ca-index/

ÁMBITOS RIS3CAT

  • Sistema educativo y de generación de conocimiento
  • Sistema industrial
  • Sistema sociosanitario

CATEGORÍAS

  • TECNOLOGIAS DE LA INFORMACIÓN
    • Sistemas de Información
    • Supercomputación

TARIFAS Y ACCESO

Nivel de disponibilidad: Alta
Procedimiento de Acceso:

Abierto

FACILITIES NETWORKS

BiB – Xarxa Bioinformatica de Catalunya

Bioinformatics Barcelona (BIB) es una asociación para la provisión de educación y formación, el fomento de la investigación avanzada, la transferencia de conocimiento y tecnología, la estimulación de la competitividad y la innovación en el sector industrial, y la dotación de una mayor visibilidad como entidad internacional. BIB nace para cubrir la necesidad de generar sinergias entre la biología y la informática, para una mayor unión entre estas áreas y para el desarrollo de programas de educación y formación de alta calidad en la creación de talento bioinformático.

Reach: Catalonia
Estado: Activa
INB – Plataforma de Bioinformática
Proporcionar recursos bioinformáticos básicos de clase mundial a la comunidad nacional e internacional de investigación en ciencias de la vida en campos clave como la genómica funcional, la transcriptómica con ARN-Seq, el genotipado, la medicina genómica y las simulaciones de dinámica molecular. Proporcionar una plataforma de servicios básicos integrados de bioinformática en la comunidad investigadora. Facilitar la participación coordinada de grupos de bioinformática en proyectos nacionales e internacionales de gran envergadura que requieren y benefician de equipos estrechamente colaboradores que se conocen y están acostumbrados a trabajar conjuntamente.
Reach: Spain
Estado: Activa
CERCA - Ginys