Анализ транскриптомных данных

О курсе

Участникам образовательной программы предлагается практико-ориентированный курс, который нацелен на помощь обучающимся в приобретении знаний, умений и навыков работы с транскриптомными данными. Курс состоит из четырех разделов: введение в дисциплину, изучение механизмов образования молекул РНК, анализ структурной организации транскриптома, а также его функциональная аннотация. Эти разделы охватывают пятнадцать основополагающих тем – от фундаментальных вопросов транскриптомики до использования транскриптомных данных в построении прогнозов выживаемости людей, страдающих различными заболеваниями. Каждая тема курса включает релевантную теоретическую часть и практическую работу. Кроме того, по каждой теме предлагается серия заданий для самостоятельной работы, а также всеобъемлющая консультативная помощь.

К оглавлению

Программа курса

Программа состоит из пятнадцати тем, объединенных в четыре раздела. Изучение каждой темы включает одну лекцию (2 часа), одно или два практических занятия (от 2-х до 4-х часов, соотвественно), а также самостоятельную работу. Пробные видеолекции можно посмотреть в плейлисте «Вычислительная транскриптомика» на YouTube канале «Grinev’s Educational Channel». На изучение каждой темы отводится одна неделя, однако возможны изменения в расписании по желанию обучающихся. Общий план обучения представлен ниже.

Неделя 1: Фундаментальная транскриптомика.
Введение в дисциплину. Транскриптомика как интегральная часть современной молекулярной биологии. Объект и предмет исследований в транскриптомике. Организация транскриптома, структурное и функциональное разнообразие молекул РНК. Транскрипция и процессинг молекул РНК, ядерно-цитоплазматический экспорт/импорт молекул РНК. Динамичность транскриптома.
Посмотреть пробную видеолекцию.

Неделя 2: Экспериментальные методы транскриптомики.
Типовой дизайн исследования в транскриптомике. Исходный генетический материал: типы, количественно-качественные характеристики, биологические и технические повторы. Классические методы молекулярной биологии в транскриптомике. Высокопроизводительные технологии генерации транскриптомных данных. Основные форматы данных. Оценка качества первичных данных. Предобработка и постобработка данных. Руководства и стандарты, принятые в транскриптомике.
Посмотреть пробную видеолекцию.

Неделя 3: Картирование коротких прочтений.
Данные в формате FASTQ. Оценка качества секвенирования, пред-обработка и фильтрация первичных данных. Картирование коротких прочтений. Алгоритмы картирования. Локальное и глобальное картирование. Контроль качества картирования. Обзор программных решений. Данные в формате SAM/BAM.
Посмотреть пробную видеолекцию.

Неделя 4: Анализ мотивов.
ДНК и РНК связывающие белки. Алгоритмы поиска сайтов связывания. Подготовка данных. Мотивы, консенсусные последовательности и логотипы. Частотные, вероятностные и весовые матрицы. Поиск сайтов связывания по матрицам мотивов. Валидация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 5: Идентификация и аннотация малых кэппированных РНК.
Механизм транскрипции. Малые кэппированные РНК, механизм образования и биологическая роль. Методы детекции малых кэппированных РНК. Особенности пред-обработки, фильтрации, нормализации и трансформации первичных данных. Полный пайплайн. Аннотация идентифицированных малых кэппированных РНК. Визуализация и интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 6: Оценка скорости работы РНК полимеразы II.
Обзор методов оценки скорости работы РНК полимеразы II. Оценка качества первичных данных, их пред-обработка и фильтрация. Картирование и суммаризация коротких прочтений. Фильтрация, нормализация и трансформация данных. Скрытые модели Маркова и их использование для идентификации «волн» активности РНК полимеразы II. Расчет скорости работы РНК полимеразы II. Визуализация и интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 7: Идентификация и аннотация сайтов полиаденилирования.
Механизмы терминации транскрипции у эукариот. Кор полиаденилирования, его структура и активность. Особенности пред-обработки, фильтрации, нормализации и трансформации первичных данных. Обзор алгоритмов идентификации сайтов полиаденилирования. Полный пайплайн. Аннотация идентифицированных сайтов полиаденилирования. Визуализация и интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 8: Анализ экспресcии генов.
Полный пайплайн. Изучение экспресcии генов на уровне индивидуальных транскриптов или целого гена, преимущества и недостатки каждого из подходов. Пред-обработка, фильтрация, нормализация и трансформация первичных данных. Гетероскедастичность данных, стабилизация вариабельности, устранение эффекта партии. Анализ дифференциальной экспресcии генов, модели, программные решения. Визуализация и интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 9: Сборка транскриптома.
Формализация проблемы сборки транскриптома по данным транскриптомного секвенирования. Сборка de novo: обзор алгоритмов и программных решений, преимущества и недостатки. Сборка с опорой на эталонные аннотации: источники аннотаций, обзор алгоритмов и программных решений, преимущества и недостатки. Оценка качества сборки транскриптома. Аннотирование транскриптома. GTF/GFF формат файлов для хранения сборок и аннотаций транскриптомов.
Посмотреть пробную видеолекцию.

Неделя 10: Анализ сплайсинга РНК.
Сплайсинг РНК, краткое введение. Детекция событий сплайсинга по данным транскриптомного секвенирования. Изучение сплайсинга на уровне экзонов, экзон-экзонных стыков и полноразмерных транскриптов. Дифференциальное использование экзонов и экзон-экзонных стыков. Модели, алгоритмы, программные решения, преимущества и недостатки. Аннотация событий сплайсинга. Визуализация и интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 11: Оценка кодирующего потенциала молекул РНК.
Структура кодирующих РНК. Идентификация открытых рамок считывания. Структурная и функциональная аннотация кодирующих РНК. Малые и длинные некодирующие РНК, их идентификация по данным транскриптомного секвенирования. Модели, алгоритмы, программные решения, преимущества и недостатки. Структурная и функциональная аннотация некодирующих РНК.
Посмотреть пробную видеолекцию.

Неделя 12: Анализ клеточных молекулярных сетей.
Молекулярные сети клетки. Теория графов в молекулярной биологии. Графы сплайсинга: определение, типы, алгоритмы реконструкции и оценки качества. Сети согласованной экспрессии генов: типы, алгоритмы реконструкции и оценки качества. Сети генных регуляций: типы, алгоритмы реконструкции и оценки качества. Эталонные молекулярные сети. Модульная организация сетей. Топологический анализ сетей. Биологическая интерпретация сетевой топологии.
Посмотреть пробную видеолекцию.

Неделя 12: Анализ молекулярных путей клетки.
Организация и разнообразие молекулярных путей. Основные базы данных по молекулярным путям. Обзор алгоритмов и программных решений в области анализа молекулярных путей. Базовый пайплайн. Визуализация молекулярных путей. Биологическая интерпретация результатов анализа молекулярных путей.
Посмотреть пробную видеолекцию.

Неделя 14: Генные онтологии.
Концепция генных онтологий. Типы генных онтологий. Структура генных онтологий. Основные понятия и термины. Анализ обогащений. Анализ обогащения набора генов. Модели, алгоритмы, программные решения. Визуализация и биологическая интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

Неделя 15: Анализ выживаемости.
Выживаемость пациентов как интегральный показатель структурно-функционального состояния транскриптома клеток человека. Особенности подготовки клинических данных, а так же данных по экспресии изучаемых генов. Варианты клинического исхода. Фильтрация, нормализация и трансформация первичных данных. Расчет параметров одномерных и многомерных регрессионных моделей пропорционального риска Кокса. Обобщение статистических характеристик модели. Графическая визуализация результатов анализа с помощью кривой Каплана-Мейера. Интерпретация результатов анализа.
Посмотреть пробную видеолекцию.

К оглавлению

Зачисление на курс

Зачисление на курс проводится по итогам собеседования. Ключевым фактором отбора является собственная мотивация абитуриента. При этом следует отметить, что образовательная программа курса построена так, что от обучающегося на старте не требуются какие-то специальные знания в области транскриптомики. Тем не менее, пользовательские знания компьютерной техники, равно как и базовые навыки программирования на языке R и/или Python приветствуются. Кроме того, условием официального зачисления на курс является заключение договора установленного образца.

К оглавлению

Форма, место и время проведения занятий, стоимость

Программа обучения может быть реализована:

  • очно аудиторно;
  • в смешанной форме (часть занятий – очно аудиторно, часть – очно дистанционно);
  • очно дистанционно (с использованием удаленной конференц-связи типа Zoom);
  • on-line (с использованием видеолекций, видеоруководст и заданий для самостоятельной работы; эта форма обучения находится в разработке).

Занятия могут проводится как в дневное, так и в вечернее время по согласованию со слушателями. Выбор формы обучения также согласуется с желаниями слушателей. Все формы проведения занятий включают, при необходимости, индивидуальные и групповые консультации, которые могут проходить как аудиторно, так и дистанционно (по согласованию).

Занятия проводятся на базе Государственного учреждения образования «Институт повышения квалификации и переподготовки в области технологий информатизации и управления» Белорусского государственного университета по адресу г. Минск, ул. Кальварийская, д. 9, ауд. 730.

Время проведения:

  • дневная форма обучения предполагает проведение занятий на протяжении максимум 5 дней в неделю, 8 академических часов в день (академический час равен 40 мин) с 9:00 по 18:00. Оптимальным является 4 академических часа два-три раза в неделю. Точное время и количество занятий согласовывается со слушателями и, кроме того, зависит от загруженности аудиторий и преподавателей;
  • вечерняя форма обучения предполагает использование 4 академических часа в день с 18:00 до 20:50 или с 19:00 до 21:50.

Стоимость обучения на данный момент составляет 450 BYN.

К оглавлению

Преподаватели курса

Гринев В.В.

Кандидат биологических наук, доцент кафедры генетики Белорусского государственного университета. Молекулярный генетик, биоинформатик, специализируется в области вычислительной (компьютерной) транскриптомики.

Телефон рабочий: +375 (17) 209-58-60.
E-mail: grinev_vv@bsu.by

К оглавлению

Окончание курса

Для получения свидетельства о повышении квалификации государственного образца обучающийся должен успешно справиться со всеми заданиями практических занятий, а также заданиями, предназначенными для самостоятельной работы. Завершающим этапом обучения в этом случае является сдача зачета.

К оглавлению

Обратная связь

Василий Викторович Гринев.

Рабочий адрес: кафедра генетики, биологический факультет, Белорусский государственный университет, ул. Курчатова, д. 10, каб. 425, 220010, г. Минск, Беларусь.

Почтовый адрес: Белорусский государственный университет, пр. Независимости, д. 4, 220030, г. Минск, Беларусь.

Телефон рабочий: +375 (17) 209-58-60.
Viber: +375 (29) 188-16-93
E-mail: grinev_vv@bsu.by или grinev_vv@mail.ru
ВКонтакте: https://vk.com/vasilygrinev
ВКонтакте (BioData Analytics): https://vk.com/biodataanalytics
Instagram: https://www.instagram.com/biodataanalytics
Профессиональная Web-страница: http://bio.bsu.by/genetics/grinev_ru.html
YouTube канал “Grinev’s Educational Channel”:  https://www.youtube.com/channel/UCYQ8QwQAX8ubVYYuegxNTYQ

ГУО «Институт повышения квалификации и переподготовки в области технологий информатизации и управления» БГУ (по вопросам зачисления).

E-mail: Klimova@bsu.by
Телефон рабочий: +375 (17) 259-70-59.
Адрес: ул. Кальварийская, д. 9, ауд. 826, г. Минск, Беларусь.

К оглавлению