Bioinformática
GINYS-CRG-006
Julia Ponomarenko
Responsable de la unidad
PRBB (Parc de Recerca Biomèdica de Barcelona) Building
Doctor Aiguader, 88
08003 Barcelona
Spain
Room L460
La Unidad de Bioinformática ofrece a los investigadores del CRG-CNAG/PRBB y de organizaciones externas servicios de consulta, planificación de NGS y otros experimentos genómicos, procesamiento de datos de NGS, análisis y gestión, desarrollo de software y bases de datos, formación en bioinformática y acceso a recursos informáticos de alto rendimiento. en el CRG.
La Unidad trabaja en sinergia con la Unidad de Genómica y la Unidad de Tecnologías de Proteínas y Cribado Biomolecular (BMS-PT) para apoyar a los usuarios que utilizan tecnologías de secuenciación de alto rendimiento, desde la planificación de un experimento hasta el entrega de resultados oportunos y fiables.
Web de la unidad en las facilidades del CRG.
Servicios
GENÓMICA
- Ensamblaje basado en referencia y de novo de genomas eucariotas y procariotas.
- Resecuenciación del genoma y evaluación de la calidad de los conjuntos del genoma.
- ChIP-seq (TFs, modificaciones de histona): llamada de pico, análisis de unión diferencial entre grupos de muestras, anotación de pico.
- Análisis del exoma entero y del genoma entero: llamada de variantes, CNV.
- Identificación y anotación de variantes estructurales de ADN para enfermedades humanas comunes y raras: análisis individual y familiar, mutaciones del gen conductor del cáncer.
- Comparación de genomas.
- Anotación funcional del genoma: predicción de genes ab initio, anotación de genes, transcripciones, motivos de ADN, promotores y otros elementos reguladores del ADN.
- Análisis de 5C, Hi-C, ATAC-seq y otros datos de alto rendimiento.
TRANSCRIPTOMICA
- Ensamblaje de nuevo y basado en referencia de transcriptomas eucariotas y procariotas.
- Anotación funcional del transcriptoma: predicción de genes ab initio, anotación de genes, transcripciones, motivos de ADN, promotores y otros elementos reguladores.
- Llamamiento de variantes a partir de datos de secuenciación del transcriptoma.
- Análisis de microarrays comerciales y personalizados: nada expresados de manera diferencial, comparación de grupos.
- ARN-seq para ARNm: descubrimiento de nuevas transcripciones, genes/transcripciones expresados de forma diferente.
- Análisis funcional de genes/transcripciones expresados de manera diferencial: términos de ontología génica, motivos de ADN y análisis de enriquecimiento de vías.
- ARN-seq para ARN pequeño y no codificante: expresión diferencial, descubrimiento de nuevos microRNAs, predicción de objetivos de microRNA.
- Análisis de PCR en tiempo real de OpenArray y otros datos experimentales de alto rendimiento.
- Identificación de los efectos del lote y visualización de datos y resultados: agrupación jerárquica, mapas de calor, dendrogramas, gráficos de volcanes, análisis de componentes principales para la (des)similaridad global entre experimentos.
- Secuenciación basada en diana de ARN: RIP-seq, iCLIP, CLIP-seq y otros.
- Análisis de repertorios de células B y T (repertorios de receptores inmunitarios adaptativos, o AIRR) a partir de datos de secuenciación de alto rendimiento: asignación de alelos de línea germinal, identificación de clones, visualización de frecuencias clonales.
METAGENÓMICA
- Análisis del amplicón (genes del ARNr 16S), datos de secuenciación del genoma entero y del transcriptoma.
- Identificación de comunidades microbianas, diversidad taxonómica y abundancia a niveles de género, familia, orden, clase, filo.
- Conservación y abundancia de módulos funcionales de genes bacterianos y vías bioquímicas.
- Estimación de la diversidad microbiana y cobertura de secuencias.
- Predicción ORF y anotación funcional.
- Análisis filogenético.
- Análisis comparativo de muestras: perfiles microbianos, términos de ontología genética, análisis metabólicos y de vías.
PROTEÓMICA Y BIOINFORMÁTICA ESTRUCTURAL
- Predicción y anotación funcional de proteínas.
- Análisis de los efectos de los SNP y otras variaciones sobre la estructura y función de las proteínas.
- Alineación de múltiples secuencias.
- Asignación de ortólogos y paralogos.
- Análisis filogenético y construcción de árboles.
- Comparación de estructura de proteínas y modelización de homología 3D.
- Acoplamiento 3D proteína-proteína y proteína-atando.
- Predicción de epítopos de células B y T.
BASES DE DATOS, SITIOS WEB Y SOFTWARE
Tenemos una amplia experiencia en diseño, desarrollo y soporte de los siguientes recursos bioinformáticos (consulte nuestros proyectos relacionados aquí):
- Bases de datos: relacionales y NoSQL.
- Sitios web para enviar, buscar y análisis de datos.
- Herramientas web.
- LIMSs (Laboratory Information Management System) para la gestión de las operaciones del laboratorio, el flujo de datos y la comunicación con usuarios y colaboradores externos.
- Evaluación y benchmarking de software.
- Desarrollo de software: scripts bioinformáticos; tuberías de procesamiento y análisis de datos; aplicaciones web de bioinformática integradora; navegadores personalizados del genoma.
- Conducciones NextFlow.
- Soluciones de integración de datos externos e internos.
OTROS
Por favor, póngase en contacto con nosotros con cualquier problema de bioinformática que tenga, aunque no encaje con los que figuran en nuestros servicios. Formando parte de diversas comunidades y alianzas bioinformáticas podemos encontrar la solución o expertos en la materia. Entre los servicios personalizados y adicionales que ofrecemos son los siguientes:
- Apoyo en el diseño y análisis de experimentos NGS personalizados.
- Análisis y gráficos estadísticos: scripts R, estadística descriptiva e inferida, prueba de hipótesis, estimación del tamaño de la muestra, PCA, agrupación, regresión lineal, correlación, ANOVA.
- Formación individual.
- Envío de datos a GEO, ArrayExpress, SRA y otros repositorios de datos públicos.
- Explotar bases de datos públicas y publicaciones y reanalizar los datos publicados.
- Preparación del manuscrito: métodos de escritura, resultados, interpretación y visualización de los resultados.
- Subvenciones: métodos de escritura, metodología de gestión e intercambio de datos, diseño de análisis experimentales y bioinformáticos, obtención de resultados preliminares, interpretación de resultados.
Equipos
Software
Master of Pores: Nextflow pipeline for analysis of direct RNA Nanopore reads (https://github.com/biocorecrg/master_of_pores)
FA-nf (functional annotation): NextFlow pipeline for functional annotation of proteins from non-model organisms based on InterPro and Blast (https://github.com/guigolab/FA-nf)
HiC-inspector: High-throughput conformation capture (Hi-C) allows to study the three-dimensional architecture of whole genomes through the detection of long range chromosomal interactions (https://github.com/HiC-inspector/HiC-inspector)
Indrop-Flow: Indrops analysis pipeline based on DropEST (https://github.com/biocorecrg/indrop)
Mothur procedures: Shell scripts for processing ITS (fungi) and 16S rRNA (bacteria) amplicon sequencing data (MiSeq) in mothur. (https://github.com/biocorecrg/microbiome_procedures)
TEQC: R package for Quality control of target capture experiments (https://www.bioconductor.org/packages/devel/bioc/html/TEQC.html)
Transcriptome assembly: Nextflow pipeline for de novo transcriptome assembly and annotation based on Trinity and Transdecoder (https://github.com/biocorecrg/transcriptome_assembly)
Equipment
- Linux cluster with 3020 cores for computing and more than 200 compute nodes and servers.
- Univa Grid Engine batch queuing system
- 87 compute nodes with 2 Intel Xeon E5-2680 20M Cache 8 core at 2.70 Ghz, 128 GB memory
- 56 compute nodes with 2 Intel Xeon E5530 4 core at 2.40GHz, 48 GB memory
- High memory compute node with 2 processor Intel Xeon E5-2699 v4 22 core at 2.20GHz, 1 TB memory
- High memory compute node: with 8 processor Intel Xeon E7450 6 core at 2.40 GHz, 512GB memory
- High memory compute node with 4 processors Intel Xeon E7540 6 core at 2.00 GHz, 256 GB memory
- 60 heterogeneous compute nodes with different hardware specifications
- 4.5 PB of storage EMC-Isilon, DDN and Nexsan
Personal
Publicaciones
Selective cleavage of ncRNA and antiviral activity by RNase2/EDN in THP1-induced macrophages
Cellular and molecular life sciences: CMLS.
Cellular and molecular life sciences: CMLS.
LCOR mediates interferon-independent tumor immunogenicity and responsiveness to immune-checkpoint blockade in triple-negative breast cancer
Nature Cancer
Nature Cancer
Coordinated post-transcriptional control of oncogene-induced senescence by UNR/CSDE1
Cell Reports
Cell Reports