Introducción a la Bioinformática

Descripción del curso:

El objetivo de este curso es familiarizar a los estudiantes con las herramientas bioinformáticas básicas más importantes y de uso frecuente en el área. Se abordarán temas como el sistema operativo Linux, bases de datos biológicas, manejo de secuencias y genomas, alineamientos y automatización de tareas con scripts.

Información del curso

  • Semestre: agosto-diciembre
  • Modalidad: Curso regular
  • Lugar: Centro de Ciencias Genómicas, UNAM
  • Duración: 2 horas por sesión, 28 sesiones
  • Disponibilidad en línea: Sí, el curso contará con modalidad virtual

Temario

Biología Computacional

  • Introducción a la bioinformática
  • Secuencias y genomas
    • Tipos de secuencias
    • Código genético
    • Formatos de secuencias (FASTA)
  • Bases de datos biológicas
    • NCBI: Genomes, Nucleotide, PubMed, etc.
    • EMBL, DDBJ
  • Alineamientos de secuencias
    • Alineamientos de pares y múltiples secuencias
    • Herramienta BLAST
    • Homología entre secuencias (Homólogo, Ortólogo, Parálogo, Xenólogo)

Computación

  • Uso de buenas prácticas
  • Introducción al Shell de Linux
  • Navegación y manipulación de archivos
  • Uso de tuberías y filtros
  • Patrones y expresiones regulares
  • Automatización con scripts de Shell

Temas

El Plan de clases detallado con actividades, recursos, plantillas, material de lectura esta disponible en pdf. Aquí listamos la organización de los temas y las habilidades que el alumno debe lograr.

Tema Objetivo
Markdown a) Los alumnos deberán conocer y usar un estándar (markdown) para la creación de documentos textos con formato, muy usado unix y bioinformática.
b) El alumno debe entender las fases del análisis de datos necesarias al abordar un problema en bioinformática.
Buenas Practicas a) El alumno deben comprender la importancia de las buenas prácticas en el análisis de datos (FAIR datos, FAIR software).
b) El alumno debe Identificar/crear los medatados de los datos a usar en proyectos de análisis bioinformáticos.
c) El alumno debe Identificar/crear los metadatos del software a usar en proyectos de análisis bioinformáticos.
El shell y protocolos de internet. a) El alumnos debe comprender que es unix y para que se usa.
b) El alumno debe comprender los protocolos que existen de intercambio de datos en internet.
c) El alumno debe comprender y usar el protocolo de transferencia de archivos y acceso a servidores remotos.
El shell: Sistema de archivos y comandos básicos de navegación. a) El alumnos debe entender y saber desplazarse en el sistema de archivos en unix ( diapo 39 - 60)
b) El alumnos debe conocer los comandos usados para las operaciones básicas de archivos y directorios.
El shell: Tipos de archivos y operaciones básicas. a) El alumno debe entender los tipos de archivos, visualizar su contenido y como se manejan en unix.
b) El alumnos debe saber comprimir/descomprimir archivos.
c) El alumno debe comprender el uso de permisos en la estructura de archivos de unix.
Dogma Central y Formatos de secuencias biológicas. DB: Genbank. a) Lxs alumnxs deberán ser capaces de comprender el dogma central de la biología, los formatos de secuencias biológicas.
b) Los alumnos deben comprender los conceptos relacionados a bases de datos, como ID, registro, propiedades, etc.
c) El alumno explorará la base de datos GenBank.
DB: Genomes y PubMed. Archivos: Descarga, Integridad y Visualización. a) El alumno conocerán los comandos para descargar secuencias, ver los archivos de secuencias y generar nuevos archivos.
b) El alumno conocerá la base de datos PubMed y Genomes.
c) El alumno debe comprender la importancia de la integridad en la descarga de archivos.
Archivos: Visualizar, Editar y Crear a) El alumno debe aprender a usar los comandos para visualizar el contenido de un archivo.
b) El alumno debe aprender a usar editores de texto en el servidor
Procesos a) El alumno debe comprender el manejo de procesos en unix.
redireccionamientos y tuberias a) El alumno debe aprender a usar los rediccionamientos y tuberias en unix para tareas en bioinformática.
Análisis de un Genoma: comandos para el análisis de archivos fasta y GFF. a) El alumno deberá aplicar los conocimientos adquiridos previamente para el análisis de un genoma.
Análisis de un Genoma: patrones y filtros a) El alumno deberá aplicar el uso de patrones para filtrar información de un archivo GFF o fastA
Análisis de Genomas: Expresiones regulares a) El alumno deberá aprender las expresiones regulares y aplicarlas para filtrar información genética.
Sustituciones El alumno aprenderá como realizar sustituciones y transformaciones de datos.
Base de datos ensembl y Formateo de datos con awk a) El alumno debe ser capaz de aplicar filtros y reformatear archivos de datos con awk.
b) El alumno conocerá la base de datos ensembl y aprenderá a usar biomart.
Alineamientos a) El alumno debe ser capaz de entender el concepto de similitud entre secuencias.
Blast, variables y scripts a) El alumno debe ser capaz de entender el uso de blast y el uso de variable y scripts en unix.
Homología y ciclos a) El alumno debe ser capaz de entender el uso de ciclos

Evaluación

  • Participación en clase: 10%
  • Proyecto de investigación: 30%
  • Trabajos: 50%
  • Exámenes: 10%

Bibliografía recomendada

  1. Buffalo, V. (2015). Bioinformatics Data Skills: Reproducible and Robust Research with Open Source Tools. O’Reilly Media, Inc.
  2. Shotts Jr, W. E. (2012). The Linux Command Line: A Complete Introduction. No Starch Press.

Contacto

LI Heladia Salgado
- Entidad académica: Programa de Genómica Computacional, Centro de Ciencias Genómicas, UNAM
- Correo electrónico:

Créditos

  • Este material fue desarrollado con base en una primera versión elaborada por Laura Gómez, disponible el latex.