Анализ данных в системной биологии

Материал из Mironov's lab wiki
(перенаправлено с «NgsCourse»)
Перейти к: навигация, поиск

Содержание

Анализ данных в системной биологии

Сервер для расчётов

Летний курс по NGS

С 11 по 19 августа в Пущино пройдёт летний интенсив по мотивам NGS-курсов на ФББ МГУ. Подробности здесь: http://ngs2015.bioinfschool.ru/

Структура курса

1 лекция

NGS technologies (overview) [М.Логачева, ЖК(?)]

  • Physical principles and technological solutions
  • Typical data: output size, runtime, read length, paired and strand-assigned reads, error types and rates, etc.
  • Cost-performance
  • Typical use cases for different platforms

Presentation(PowerPoint)

Видео лекции 1

The media player is loading...

2 лекция

Preprocessing of data [М.Щелкунов] + ДЗ

  • Quality control
  • Trimming, sequencing error correction, digital normalization

Presentation

De novo genome sequencing [Д.Виноградов]

  • Theory

Presentation

  • UNIX briefing

Presentation

Видео лекции 2

The media player is loading...

3 лекция

De novo genome sequencing [С.Науменко, А.Касьянов] + ДЗ

  • Choice of platform
  • Selection of libraries (insert size)
  • Genome assembly
    • Single-cell sequencing and assembly
    • Whole genome alignment, synteny blocks

Presentation

  • RNA-Seq de novo assembly

Presentation

Домашнее задание

Часть 1: Материалы к заданию

Часть 1: Веб-форма для ответов на домашнее задание

Часть 2: Задание

Часть 2: Веб-форма для ответов на домашнее задание

Видео лекции 3

The media player is loading...

4 лекция

Genome resequencing [Е.Набиева, М.Пятницкий] + ДЗ

  • Resequencing: when the genome sequence is known
  • NGS in medicine: exome and targeted sequencing
  • Short-read mapping
  • SNP and short indel calling
  • SNP evaluation
  • Intro to cancer: background, cancer evolution, passenger and driver mutations, analysis of functional subsystems
  • Cancer genomics: somatic mutations

Presentation

Домашнее задание

Задание

Видео лекции 4

The media player is loading...

5 лекция

Statistical analysis of transcriptomic data [П.Мазин] + ДЗ

  • introduction (statistical tests, robustness, multiple testing, false discovery rate)
  • dimension reduction (principal component analysis, multidimensional scaling)
  • clustering methods
  • regression and ANOVA, discrete distributions, GLM, log-likelihood text. Biological variability (overdispersion).
    • classification and machine learning methods (linear and quadratic discriminant analysis, support vector machines, neural networks, decision trees)

Материалы к лекции

Домашнее задание

Видео лекции 5

The media player is loading...


6 лекция

Transcriptomics [П.Мазин] + ДЗ

  • lm/anova; glm/anodev
  • Data normalization and analysis of gene expression
    • edgeR
    • limma
    • DESeq

Материалы к лекции

Домашнаяя работа

Видео лекции 6

The media player is loading...

7 лекция

Transcriptomics training [П.Мазин]

  • Analysis of alternative splicing
  • Clustering
  • interpretations of results (annotation of gene sets, hypergeometric test, GOStat, GSEA etc.)

Материалы к лекции

  • Презентация. Поправка: в презентации на шестом слайде ­"batch_out: 0,1,2,3" следует читать как ­"batch_out=0,1,2,3"

ДЗ в презентации, используются результаты предыдущих двух ДЗ.

Веб-форма для сдачи ДЗ

Видео лекции 7

The media player is loading...

8 лекция

Protein-DNA interactions: ChIP-Seq for transcription factor binding sites [И.Кулаковский]

  • pre-NGS experimental methods to study protein-DNA interaction
  • wet-lab + dry-lab workflow overview
  • applications: brief overview
  • dry-lab details (TF binding): peak calling, motif discovery & finding
  • homework: peak calling + motif discovery

Slides online use Google Chrome or Firefox, wait patiently for the presentation to load completely (it may take few minutes)

Slides zip-file unpack and open index.html with Google Chrome or Firefox

Slides zip-file mirror use if the previous link is not working

Homework notes Краткие заметки, полезные для выполнения домашнего задания

Homework form Форма для сдачи домашнего задания


Видео лекции 8

The media player is loading...

9 лекция

3D structure of chromatin: 3C and related techniques, in particular, HiC [Е.Храмеева] + ДЗ

  • Overview of ‘C’ techniques (3C, 4C, 5C, HiC)
  • Data analysis strategies (existing biases, normalization, ...)
  • Mirny lab tools for the HiC data analysis

Презентация

Домашнее задание

Задание


Ответы и комментарии

Видео лекции 9

The media player is loading...

10 лекция

Epigenetics [М.Гельфанд, А.Миронов]

  • Methylome
  • DNAse I analysis
  • Epigenetics-II: histone modifications

Презентация 1 Презентация 2

Видео лекции 10

The media player is loading...

Рейтинг

Если Вы делали домашнее задание и не получили письма с рейтингом, обращайтесь oxia.com@gmail.com или vita.stepanova@gmail.com

Лекторы

  • Мария Логачёва <maria.log@gmail.com>
  • Михаил Щелкунов <shelkmike@gmail.com>
  • Михаил Пятницкий <mpyat@bioinformatics.ru>
  • Елена Набиева <enabieva@gmail.com>
  • Артём Касьянов <artem.kasianov@gmail.com>
  • Дмитрий Виноградов <dimavin@bioinf.fbb.msu.ru>
  • Сергей Науменко <evolgenomicslab@gmail.com>
  • Павел Мазин <iaa.aka@gmail.com>
  • Иван Кулаковский <ivan-dot-kulakovskiy-at-gmail-dot-com>
  • Артём Артёмов <limefire@gmail.com>
  • Екатерина Храмеева <ekhrameeva@gmail.com>
  • Михаил Сергеевич Гельфанд <mikhail.gelfand@gmail.com>
  • Андрей Александрович Миронов <mironov@bioinf.fbb.msu.ru>

Q&A

Онлайн-трансляция

Необходимые навыки

  • Знание молекулярной биологии и математической статистики
  • Знание основ Unix (bash scripting, grep, wc, awk, head, tail, sort)
  • Базовые знания R

Ответы на ДЗ

  • Транскриптомика (лекции 5-7)
    • Правильные решения можно скачать тут (на каждое задание прилагается R и bash (если необходим) - скрипты).
    • Скрипт использованный для проверки ДЗ, и статистика правильных ответов - тут
Персональные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты