Биоинформатика для технологий секвенирования нового поколения, 2015

Материал из Mironov's lab wiki
(перенаправлено с «NgsCourse2015»)
Перейти к: навигация, поиск

Содержание

Летний курс по NGS

С 11 по 19 августа в Пущино пройдёт летний интенсив по мотивам NGS-курсов на ФББ МГУ. Подробности здесь: http://ngs2015.bioinfschool.ru/

Место проведение курса

Факультет Биоинженерии и Биоинформатики, аудитория 221

Как добраться: http://fbb.msu.ru/doc/index.php?ID=99

Информация

Курс подготовлен на основе образовательной программы "Анализ данных в системной биологии", разработанной НП "Биоинформатический семинар" по заказу Фонда инфраструктурных и образовательных программ РОСНАНО

Онлайн-трансляция курса

Онлайн-трансляция лекций начинается непосредственно перед лекцией.

Видеозаписи лекций

Необходимые навыки

  • Знание молекулярной биологии и математической статистики
  • Знание основ Unix (bash scripting, grep, wc, awk, head, tail, sort)
  • Базовые знания R

NGS группа

Присоединяйтесь к группе: NGS2015

Ведомость с оценками

Результаты

Если есть еще слушатели, кто не высылал свои данные (ФИО, аффиляция/факультет), сделайте это, прислав письмо на почту oxia.com@gmail.com и vita.stepanova@gmail.com

Зачет

Выставление зачета будет проходить 12 мая.

Для получения зачета необходимо выполнить дополнительное задание по тем лекциям, где у Вас нет баллов.

Дополнительное задание для получения зачета:

Задание

Hard deadline: 10 мая 2015

Список лекций

Лекция 1. 18 февраля 2015, 17:00


Технологии секвенирования (М. Логачева)

  • Физические принципы и технологические решения
  • Характеристика данных: размер выходных данных, длина чтений, парные и цепь­-специфичные чтения, частота и типы ошибок, время работы и т.д.
  • Цена
  • Использование различных платформ для секвенирования

Презентация

Лекция 2. 25 февраля 2015, 17:00


Предварительная обработка результатов секвенирования (М.Щелкунов)

  • Контроль качества
  • Тримминг, коррекция ошибок секвенирования, нормализация

Презентация Список терминов Важные мелочи, не рассказанные на лекции

Сборка геномов de novo (теория). Unix (Д.Виноградов)

  • Сборка геномов de novo (применение графов)
  • Unix (кратко: команды, полезные источники информации)

Презентация Сборка Презентация Unix

Домашнее задание

Задание Риды к заданию Адаптеры к заданию

Решение домашнего задания

Оценки

soft deadline: 4.03.2015

hard deadline: 10.03.2015 (до лекции)

Разбор домашнего задания(после лекции): 11.03.2015

Лекция 3. 4 марта 2015, 17:00

Лекция пройдет в аудитории 117 ФББ


Сборка геномов и транскриптомов de novo (С.Науменко, А.Касьянов)

  • Повторение терминов: рид, длина вставки, контиг, скаффолд, покрытие, k-mer, N50
    • быстрый старт: velvet, spades
    • чем хорошая сборка отличается от плохой

Презентация1

  • RNA­seq сборка de novo

Презентация2

Домашнее задание

Домашнее задание по сборке геномов в презентации1

Форма для ответов 1

Домашнее задание по сборке транскриптомов

Форма для ответов 2

soft deadline: 11.03.2015

hard deadline: 18.03.2015 (до лекции)

Разбор домашнего задания: 18.03.2015

Разбор1 Разбор2

Лекция 4. 11 марта 2015, 17:00


Пересеквенирование геномов. NGS в медицине (Е.Набиева)

  • Пересеквенирование: когда известен геном
  • NGS в медицине: экзом и таргетное секвенирование
  • Картирование чтений
  • SNP и короткие индел,­ оценка SNP

Презентация

Домашнее задание

Задание

soft deadline: 18.03.2015

hard deadline: 25.03.2015 (до лекции)

Разбор домашнего задания: 1.04.2015 Презентация

Лекция 5. 18 марта 2015, 17:00


Введение в геномику рака (М.Пятницкий)

  • Клональная эволюция рака, гетерогенность
  • Мутации­: пассажиры и драйверы, поиск драйверов
  • Онкогены и супрессоры, раковый геном
  • Базы данных по раковым мутациям (dbSNP)
  • Функциональная аннотация мутаций. Предсказание значимых (SIFT, Polyphen, Annovar и т.д.)

Презентация

Домашнее задание

Список мутаций

soft deadline: 25.03.2015

hard deadline: 01.04.2015 (до лекции)

Разбор домашнего задания: 1.04.2015

Лекция 6. 25 марта 2015, 17:00


Статистический анализ транскриптомных данных (П.Мазин)

  • Введение, картирование и подсчёт транскриптомных ридов
  • Проверка самосогласованности: корреляционная тепловая карта, PCA/MDS, t-test, поправка на множественное тестирование

Презентация

R-код иллюстрирующий лекцию

R-код иллюстрирующий лекцию в виде pdf с картинками

Домашнее задание

Домашнее задание

soft deadline: 1.04.2015

hard deadline: 8.04.2015 (до лекции)

Разбор домашнего задания: 8.04.2015

результаты ДЗ (все ДЗ проверены)

bash-код для выполнения ДЗ

R-код для выполнения ДЗ

Лекция 7. 1 апреля 2015, 17:00


Транскриптомика (П.Мазин)

  • lm/ANOVA, glm/ANODEV, нормализация
  • Дифференциальная экспрессия (cuffdiff, edgeR, DEXseq)

Презентация

R-код иллюстрирующий lm и anova

R-код иллюстрирующий edgeR, DEXseq и limma

Домашнее задание

Инструкции по выполнению ДЗ находятся в конце презентации

Данные можно скачать тут:

числа ридов

информация о образцах. 3, 4 и 5 столбцы это возраст (в днях), пол и RIN. Возраст надо прологарифмировать чтобы сделать изменения более равномерными (т.к. большинство изменений происходит в молодости). Порядок образцов (строки) в этой таблице соответствует порядку образцов (столбцов) в таблице с числами ридов.

веб-форма для ответов возможно у вас получится слишком много генов и web-форма их не съест. Тогда пришлите ответы на почту в виде файла, каждый вопрос в анкете - один столбец, столбцы разделены знаком табуляции (т.е. весь ответ в одну строчку). ID генов перечислять через запятую.

soft deadline: 7.04.2015

hard deadline: 15.04.2015 (до лекции)

Разбор домашнего задания: 15.04.2015

подробные результаты ДЗ

R-код для выполнения ДЗ

Лекция 8. 8 апреля 2015, 17:00


Транскриптомика (П.Мазин)

  • Дифференциальная сплайсинг (cuffdiff, DEXseq, MISO, SAJR)
  • Кластеризация
  • Функциональный анализ
  • Визуализация
  • Машинное обучение

презентация

Примеры кода:

GO-анализ

дифф. сплйсинг с DEXseq

кластеризация R

кластеризация pdf

иллюстрация работы SOM

Домашнее задание

!!!для проведения GO-анализа из имен генов нужно удалить точку, и все что после нее!!!

web-форма для ответов возможно у вас получится слишком много генов и web-форма их не съест. Тогда пришлите ответы на почту в виде файла, каждый вопрос в анкете - один столбец, столбцы разделены знаком табуляции (т.е. весь ответ в одну строчку). ID генов перечислять через запятую.

soft deadline: 15.04.2015

hard deadline: 22.04.2015 (до лекции)

Разбор домашнего задания: 22.04.2015

подробные результаты ДЗ

bash-код для решения ДЗ

R-код для решения ДЗ

Лекция 9. 15 апреля 2015, 17:00

Лекция пройдет в аудитории 117 ФББ


ДНК-­белковые взаимодействия. ChIP­-Seq (И.Кулаковский)

  • Экспериментальные методы изучения ДНК-­белковых взаимодействий (до и после NGS)­
  • ChIP-Seq: «wet­lab» + «dry­lab» методики для сайтов связывания факторов транскрипции (обзор)
  • Downstream Analysis: идентификация пиков, поиск мотивов

Слайды

Рекомендуемый интерактивный вариант, zip-архив, распаковать и смотреть index.html внутри с помощью Google Chrome

Запасной вариант, PDF

Домашнее задание

Материалы к домашнему заданию

В большинстве случаев выкачивать их не нужно - все программы и файлы уже доступны на учебном сервере. Подробное описание домашнего задания дано в конце презентации.

Форма для сдачи домашнего задания

soft deadline: 22.04.2015

hard deadline: 29.04.2015(до лекции)

Разбор домашнего задания: 29.04.2015

Лекция 10. 22 апреля 2015, 17:00


3D-­структура хроматина и технологии ее определения (5С, HiC) (Е.Храмеева)

  • Обзор «С» технологий (3C, 4C, 5C, HiC)
  • Стратегии анализа данных (существующие смещения, нормализация и т.п.)
  • Способы анализа данных HiC в лаборатории Мирного

Презентация

Домашнее задание

Задание

soft deadline: 29.04.2015

hard deadline: 5.05.2015

Разбор домашнего задания: 6.05.2015 Ответы

Лекция 11. 29 апреля 2015, 17:00


Метагеномика (С.Гарушянц)

  • способы анализа метагеномов: методы секвенирования и задачи
  • сборка и аннотация метагеномов

Презентация

Домашнее задание

Форма для домашнего задания

hard deadline: 5.05.2015

Разбор домашнего задания: 6.05.2015

Лекция 12. 6 мая 2015, 17:00


Эпигенетика (М.Гельфанд, А.Миронов)

  • Метилом
  • Анализ ДНКаза I
  • Модификация гистонов

Презентация 1 Презентация 2

Лекторы

  • Мария Логачёва <maria-dot-log-at-gmail-dot-com>
  • Михаил Щелкунов <shelkmike-at-gmail-dot-com>
  • Михаил Пятницкий <mpyat-at-bioinformatics-dot-ru>
  • Елена Набиева <enabieva-at-gmail-dot-com>
  • Артём Касьянов <artem-dot-kasianov-at-gmail-dot-com>
  • Дмитрий Виноградов <dimavin-at-bioinf-dot-fbb-dot-msu-dot-ru>
  • Сергей Науменко <sergey-to4ka-naumenko-sabaka-yahoo-e6eto4ka-com>
  • Павел Мазин <iaa-dot-aka-at-gmail-dot-com>
  • Иван Кулаковский <ivan-dot-kulakovskiy-at-gmail-dot-com>
  • Екатерина Храмеева <ekhrameeva-at-gmail-dot-com>
  • Софья Гарушянц <garushyants-at-gmail-dot-com>
  • Михаил Сергеевич Гельфанд <mikhail-dot-gelfand-at-gmail-dot-com>
  • Андрей Александрович Миронов <mironov-at-bioinf-dot-fbb-dot-msu-dot-ru>
Персональные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты