untitled

Desarrollo de herramientas bioinformáticas para la anotación de genomas


Development of bioinformatic tools for genome annotation

Burguener, Germán F.

Director(a):
Turjanski, Adrián
 
Institución otorgante:
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Fecha:
2017-04-28
Tipo de documento: 
info:eu-repo/semantics/doctoralThesis
 
Formato:
application/pdf
Idioma:
spa
Temas:
BIOINFORMATICA - GENOMICA - TRANSCRIPTOMICA - ENSAMBLADO - ALINEAMIENTO - PIPELINE - BIOINFORMATICS - GENOMICS - TRANSCRIPTOMICS - ASSEMBLY - ALIGNMENT - PIPELINE
Descripción:
El ensamblado y la anotación de genomas es un área de particular interés en genómica, que ha abierto un horizonte de posibilidades impensadas en la época de los primeros avances de la genómica preinformática. Desde las primeras secuenciaciones de genomas completos, se han desarrollado diferentes métodos y herramientas para el procesamiento y anotación de datos genómicos. La aparición de las tecnologías de secuenciación de nueva generación ha significado una verdadera revolución en la biología y, sobre todo, en las denominadas ciencias ómicas. Sin embargo, los enormes volúmenes de datos generados representan nuevos desafíos, tanto a nivel técnico como de análisis. Se genera mucha más datos de los que pueden procesarse para posibilitar la extracción de información en forma confiable, con lo que la cantidad de datos no curados en diferentes repositorios es cada vez mayor. La velocidad con la que crecen las bases de datos y la dificultad de garantizar la calidad de las mismas, hacen que las anotaciones, principalmente automáticas, requieran siempre un gran esfuerzo posterior de curado manual. Asimismo, la disparidad en los formatos y fuentes de datos y la falta de estandarización en las metodologías dificulta la integración entre diferentes análisis, lo que suele requerir también un gran insumo de tiempo para poder extraer información a partir de datos obtenidos por medios diversos. El presente trabajo de tesis tuvo como principal objetivo el diseño, programación, testeo y aplicación de protocolos de trabajo (pipelines) para ensamblado y anotación de genomas y transcriptomas de organismos con diversos niveles de complejidad. Se programaron pipelines para ensamblar y anotar organismos desde virus y bacterias a eucariotas superiores. Cada pipeline fue organizado en forma modular, permitiendo iniciar el proceso desde los primeros pasos de secuenciación hasta las etapas más avanzadas, con la posibilidad de incorporar información procedente de fuentes diversas, tanto internas como externas y de combinar los diferentes pipelines entre sí, según el nivel de análisis que se necesite y la información de que se disponga. A su vez, las anotaciones finales son incorporadas a la plataforma web de BIA (Plataforma de Bioinformática Argentina), interrelacionándose y enriqueciéndose con otros módulos y pudiendo visualizarse y filtrarse en forma flexible. Paralelamente al proceso de desarrollo de los pipelines, los mismos fueron aplicándose a diversos organismos, en un proceso iterativo de testeo y mejoramiento. De esta forma, se ensamblaron y anotaron diversas especies de bacterias, arqueas, eucariotas inferiores y eucariotas superiores, entre ellos: anotación de la arquea extremófila Halorubrum sp. AJ67 y de la bacteria probiótica Lactobacillus acidophilus ATCC 4356, ensamblado y anotación de las cepas M y B del complejo Mycobacterium Tuberculosis; ensamblado y anotación de un hongo no caracterizado del género Trichoderma, ensamblado, anotación y estudio comparativo del patógeno de maíz Puccinia sorghi race RO10H11247; ensamblado y anotación de Ilex Paraguariensis A. St.-Hil., en el marco del Proyecto de Secuenciación del Genoma de Yerba Mate (PRO.MATE.AR).
Identificador:
https://hdl.handle.net/20.500.12110/tesis_n6264_Burguener
Derechos:
info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/2.5/ar/
Licencia de uso:
Licencia Creative Commons


Cita bibliográfica:

Burguener, Germán F.  (2017-04-28).     Desarrollo de herramientas bioinformáticas para la anotación de genomas.  (info:eu-repo/semantics/doctoralThesis).    Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.    [consultado:  ] Disponible en el Repositorio Digital Institucional de la Universidad de Buenos Aires:  <https://hdl.handle.net/20.500.12110/tesis_n6264_Burguener>