Биоинформатика в 2025: чего ждать в следующие 5 лет? | Александр Предеус, Институт биоинформатики

YOUTUBE · 19.11.2025 03:34

Ключевые темы и таймкоды

Введение

0:01
  • Лекция будет вводной и не очень серьезной.
  • Автор занимался многими аспектами, но не глубоко.
  • Цель лекции - дать ширину, а не глубину.

Уровень информатики в России

0:52
  • Уровень информатики в России значительно вырос.
  • Автор не будет повторять очевидные вещи.
  • Лекция будет более хайлайтовой.

Биоинформатика

2:04
  • Биоинформатика сочетает биологию и информатику.
  • Информатика в англоязычной культуре называется computer science.
  • Биоинформатика занимается хранением, получением и анализом биологических данных.

Разделы биоинформатики

3:05
  • Биоинформатика включает геномную, транскрипционную и протеомную информатику.
  • Также существуют структурная биоинформатика, молекулярная динамика и моделирование.
  • Сегодняшняя лекция будет посвящена секвенированию.

Секвенирование

4:59
  • Секвенирование доминирует в последние десять лет.
  • Клетка - это густой суп с биополимерами и малыми молекулами.
  • Основная информация в клетке связана с ДНК и РНК.

Протеины и ДНК

6:27
  • Протеины несут основную химическую и структурную функцию в клетке.
  • ДНК и РНК могут быть секвенированы, но протеины сложнее.
  • Обратная транскриптаза позволяет превращать РНК в ДНК.

Методы секвенирования

8:13
  • Секвенирование ДНК по Сэнгеру стало революцией.
  • Метод использует радиоактивные нуклеотиды и флуоресцентные метки.
  • Секвенирование по Сэнгеру используется до сих пор и автоматизировано.

Прогресс в секвенировании

10:53
  • Прогресс в секвенировании произошел благодаря автоматизации.
  • Нет одного героя, который бы отвечал за все достижения.
  • Секвенирование стало возможным благодаря прогрессу в методах.

Закон Мура и секвенирование

11:21
  • Закон Мура описывает рост эффективности полупроводниковой электроники.
  • В секвенировании закон Мура соблюдался до 2007 года, после чего эффективность и цены упали катастрофически.
  • Секвенирование стало массовым, но эффективность на единицу данных снизилась.

Проблемы с эффективностью

12:31
  • Сенгер и другие методы секвенирования были забыты, начался хайп.
  • Вопрос о необходимости такой эффективности остается открытым.
  • Программы и задачи требуют дополнительного размышления и адаптации.

Размеры геномов

13:38
  • Геномы варьируются в широком спектре, от вирусов до человека.
  • У человека геном составляет около 3 миллиардов оснований.
  • Современные методы секвенирования позволяют делать это массово и дешево.

Проблемы в науке

15:16
  • Хайп в науке искажает приоритеты и структуру образования.
  • Биохимия теряет финансирование и позиции в образовательном процессе.
  • Это приводит к забыванию важных научных достижений.

Развитие методов в биологии

17:15
  • В XIX веке методы оставались неизменными, но в XX веке прогресс диктовался новыми технологиями.
  • В 1950-60-х годах биохимия доминировала в науках о живом.
  • Нобелевские премии в области биохимии определили наше понимание физиологии.

Молекулярное клонирование и ПЦР

19:24
  • Молекулярное клонирование и рекомбинантная ДНК изменили науку.
  • ПЦР позволил амплифицировать ДНК и РНК, что стало прорывом.
  • Эти методы доминировали в 1970-80-х годах.

Структурная биология и геномная биология

21:27
  • Структурная биология развивалась в 1990-х годах благодаря компьютерным технологиям и рентгеновской кристаллографии.
  • Геномная биология доминирует с 2000 года, определяя развитие науки.
  • Несмотря на прогресс, некоторые методы забываются, что приводит к цикличности в развитии науки.

Введение в секвенирование

22:50
  • Высокоэффективное секвенирование позволяет быстро секвенировать ДНК и РНК.
  • Можно секвенировать геномы и транскриптомы новых и известных видов.
  • Геномы людей отличаются на уровне генома и протеин-кодирующих регионов.

Методы и задачи секвенирования

24:21
  • Современные методы секвенирования включают Illumina и другие.
  • Задача сборки включает получение более длинных фрагментов из коротких прочтений.
  • Транскриптомы могут быть полезны для анализа экспрессии генов и выявления мутаций.

Примеры использования секвенирования

27:06
  • Пример: секвенирование гена человека для выявления гетерозиготных вариантов.
  • Профайлинг популярен в медицинской генетике для выявления мутаций, вызывающих заболевания.
  • Транскриптом используется для анализа дифференциальной экспрессии генов.

Методы анализа транскриптов

29:02
  • Сравнение количества генов и прочтений между образцами.
  • Пример: использование антител для определения сайтов связывания транскрипционных факторов.
  • Иммунопреципитация позволяет выявить участки генома, где связывается протеин.

Чипсеты и регуляция генов

30:30
  • Чипсеты помогают понять, где находятся гены на геноме.
  • Это позволяет строить сложные модели регуляции генов.
  • Текст о чипсетах вызывает неоднозначную реакцию у биологов.

Проблемы биоинформатики

31:05
  • Биоинформатика вызывает фрустрацию у многих специалистов.
  • Проблемы включают плохую воспроизводимость результатов и устаревший код.
  • Некоторые программы работают стабильно спустя десятилетия, но большинство устаревает.

Вольное обращение со статистикой

33:26
  • Биоинформатики часто вольно обращаются со статистикой.
  • Это приводит к проблемам с воспроизводимостью и дизайном экспериментов.
  • Способы борьбы включают привлечение профессиональных программистов и разработку новых стандартов образования.

Алгоритмическая биоинформатика

34:44
  • Алгоритмическая биоинформатика улучшает качество решений.
  • Многие задачи могут быть решены, но требуют улучшения алгоритмов.
  • Параллельные процессы могут значительно ускорить выполнение задач.

Анализ больших данных

36:37
  • Анализ больших данных включает сравнение и копание в данных.
  • Этим занимаются как программисты, так и биологи с компьютерным образованием.
  • Алгоритмы, такие как BLAST, играют ключевую роль в биоинформатике.

Дата сайнс и биологические данные

38:07
  • Дата сайнс включает пересечение компьютерных наук и биологии.
  • Биологические данные часто плохие, что усложняет работу с ними.
  • Методы визуализации и кластеризации помогают анализировать данные.

Проблемы с данными в биологии

39:43
  • Данные в биологии часто зависят от множества факторов, что приводит к искажениям.
  • Пример: проект Mouse-Human RNA-Stack показал, что данные группируются по лабораториям, а не по видам.
  • Это связано с эффектом донора, когда результаты зависят от рук экспериментаторов.

Перспективы длинных прочтений

41:57
  • Длинные прочтения позволяют решать задачи, которые раньше были невозможны.
  • Пример: сборка бактериального генома стала дешевле и точнее.
  • Ультра-длинные прочтения открывают новые возможности для анализа ДНК.

Технологии и алгоритмы

45:06
  • Технология ридатил позволяет обогащать ДНК, что помогает в секвенировании экзома.
  • Алгоритмы, такие как Fly, помогают собирать длинные прочтения и уменьшать ошибки.
  • Определение модификаций ДНК и РНК становится возможным благодаря алгоритмам.

Биоинформатика и бактериальный иммунитет

46:58
  • Биоинформатика помогает находить гены, связанные с фенотипами.
  • Система рестрикции-модификации играет важную роль в бактериальном иммунитете.
  • Открытие новых антифаговых систем может привести к новым молекулярным методам.

Образование в биоинформатике

50:07
  • Образование в биоинформатике в России существует, но оно не устоявшееся.
  • В сильных научных центрах можно получить качественное образование.
  • Взаимодействие с биологами и индустрией важно для роста в этой области.

Место классического физического образования в биоинформатике

53:40
  • Классическое физическое образование полезно в биоинформатике.
  • Не рекомендуется инвестировать время в классическую биологию, но знания морфологов ценны.
  • Эти знания можно интегрировать с биоинформатикой.

Применение физического мышления в биоинформатике

54:59
  • Физическое мышление полезно в биоинформатике, особенно в симуляциях и биофизике.
  • Физика находится на более продвинутом уровне теории, чем биология.
  • В определенных отраслях физическое мышление помогает в функциональном анализе и построении моделей.