Введение 0:01 Лекция будет вводной и не очень серьезной. Автор занимался многими аспектами, но не глубоко. Цель лекции - дать ширину, а не глубину.
Уровень информатики в России 0:52 Уровень информатики в России значительно вырос. Автор не будет повторять очевидные вещи. Лекция будет более хайлайтовой.
Биоинформатика 2:04 Биоинформатика сочетает биологию и информатику. Информатика в англоязычной культуре называется computer science. Биоинформатика занимается хранением, получением и анализом биологических данных.
Разделы биоинформатики 3:05 Биоинформатика включает геномную, транскрипционную и протеомную информатику. Также существуют структурная биоинформатика, молекулярная динамика и моделирование. Сегодняшняя лекция будет посвящена секвенированию.
Секвенирование 4:59 Секвенирование доминирует в последние десять лет. Клетка - это густой суп с биополимерами и малыми молекулами. Основная информация в клетке связана с ДНК и РНК.
Протеины и ДНК 6:27 Протеины несут основную химическую и структурную функцию в клетке. ДНК и РНК могут быть секвенированы, но протеины сложнее. Обратная транскриптаза позволяет превращать РНК в ДНК.
Методы секвенирования 8:13 Секвенирование ДНК по Сэнгеру стало революцией. Метод использует радиоактивные нуклеотиды и флуоресцентные метки. Секвенирование по Сэнгеру используется до сих пор и автоматизировано.
Прогресс в секвенировании 10:53 Прогресс в секвенировании произошел благодаря автоматизации. Нет одного героя, который бы отвечал за все достижения. Секвенирование стало возможным благодаря прогрессу в методах.
Закон Мура и секвенирование 11:21 Закон Мура описывает рост эффективности полупроводниковой электроники. В секвенировании закон Мура соблюдался до 2007 года, после чего эффективность и цены упали катастрофически. Секвенирование стало массовым, но эффективность на единицу данных снизилась.
Проблемы с эффективностью 12:31 Сенгер и другие методы секвенирования были забыты, начался хайп. Вопрос о необходимости такой эффективности остается открытым. Программы и задачи требуют дополнительного размышления и адаптации.
Размеры геномов 13:38 Геномы варьируются в широком спектре, от вирусов до человека. У человека геном составляет около 3 миллиардов оснований. Современные методы секвенирования позволяют делать это массово и дешево.
Проблемы в науке 15:16 Хайп в науке искажает приоритеты и структуру образования. Биохимия теряет финансирование и позиции в образовательном процессе. Это приводит к забыванию важных научных достижений.
Развитие методов в биологии 17:15 В XIX веке методы оставались неизменными, но в XX веке прогресс диктовался новыми технологиями. В 1950-60-х годах биохимия доминировала в науках о живом. Нобелевские премии в области биохимии определили наше понимание физиологии.
Молекулярное клонирование и ПЦР 19:24 Молекулярное клонирование и рекомбинантная ДНК изменили науку. ПЦР позволил амплифицировать ДНК и РНК, что стало прорывом. Эти методы доминировали в 1970-80-х годах.
Структурная биология и геномная биология 21:27 Структурная биология развивалась в 1990-х годах благодаря компьютерным технологиям и рентгеновской кристаллографии. Геномная биология доминирует с 2000 года, определяя развитие науки. Несмотря на прогресс, некоторые методы забываются, что приводит к цикличности в развитии науки.
Введение в секвенирование 22:50 Высокоэффективное секвенирование позволяет быстро секвенировать ДНК и РНК. Можно секвенировать геномы и транскриптомы новых и известных видов. Геномы людей отличаются на уровне генома и протеин-кодирующих регионов.
Методы и задачи секвенирования 24:21 Современные методы секвенирования включают Illumina и другие. Задача сборки включает получение более длинных фрагментов из коротких прочтений. Транскриптомы могут быть полезны для анализа экспрессии генов и выявления мутаций.
Примеры использования секвенирования 27:06 Пример: секвенирование гена человека для выявления гетерозиготных вариантов. Профайлинг популярен в медицинской генетике для выявления мутаций, вызывающих заболевания. Транскриптом используется для анализа дифференциальной экспрессии генов.
Методы анализа транскриптов 29:02 Сравнение количества генов и прочтений между образцами. Пример: использование антител для определения сайтов связывания транскрипционных факторов. Иммунопреципитация позволяет выявить участки генома, где связывается протеин.
Чипсеты и регуляция генов 30:30 Чипсеты помогают понять, где находятся гены на геноме. Это позволяет строить сложные модели регуляции генов. Текст о чипсетах вызывает неоднозначную реакцию у биологов.
Проблемы биоинформатики 31:05 Биоинформатика вызывает фрустрацию у многих специалистов. Проблемы включают плохую воспроизводимость результатов и устаревший код. Некоторые программы работают стабильно спустя десятилетия, но большинство устаревает.
Вольное обращение со статистикой 33:26 Биоинформатики часто вольно обращаются со статистикой. Это приводит к проблемам с воспроизводимостью и дизайном экспериментов. Способы борьбы включают привлечение профессиональных программистов и разработку новых стандартов образования.
Алгоритмическая биоинформатика 34:44 Алгоритмическая биоинформатика улучшает качество решений. Многие задачи могут быть решены, но требуют улучшения алгоритмов. Параллельные процессы могут значительно ускорить выполнение задач.
Анализ больших данных 36:37 Анализ больших данных включает сравнение и копание в данных. Этим занимаются как программисты, так и биологи с компьютерным образованием. Алгоритмы, такие как BLAST, играют ключевую роль в биоинформатике.
Дата сайнс и биологические данные 38:07 Дата сайнс включает пересечение компьютерных наук и биологии. Биологические данные часто плохие, что усложняет работу с ними. Методы визуализации и кластеризации помогают анализировать данные.
Проблемы с данными в биологии 39:43 Данные в биологии часто зависят от множества факторов, что приводит к искажениям. Пример: проект Mouse-Human RNA-Stack показал, что данные группируются по лабораториям, а не по видам. Это связано с эффектом донора, когда результаты зависят от рук экспериментаторов.
Перспективы длинных прочтений 41:57 Длинные прочтения позволяют решать задачи, которые раньше были невозможны. Пример: сборка бактериального генома стала дешевле и точнее. Ультра-длинные прочтения открывают новые возможности для анализа ДНК.
Технологии и алгоритмы 45:06 Технология ридатил позволяет обогащать ДНК, что помогает в секвенировании экзома. Алгоритмы, такие как Fly, помогают собирать длинные прочтения и уменьшать ошибки. Определение модификаций ДНК и РНК становится возможным благодаря алгоритмам.
Биоинформатика и бактериальный иммунитет 46:58 Биоинформатика помогает находить гены, связанные с фенотипами. Система рестрикции-модификации играет важную роль в бактериальном иммунитете. Открытие новых антифаговых систем может привести к новым молекулярным методам.
Образование в биоинформатике 50:07 Образование в биоинформатике в России существует, но оно не устоявшееся. В сильных научных центрах можно получить качественное образование. Взаимодействие с биологами и индустрией важно для роста в этой области.
Место классического физического образования в биоинформатике 53:40 Классическое физическое образование полезно в биоинформатике. Не рекомендуется инвестировать время в классическую биологию, но знания морфологов ценны. Эти знания можно интегрировать с биоинформатикой.
Применение физического мышления в биоинформатике 54:59 Физическое мышление полезно в биоинформатике, особенно в симуляциях и биофизике. Физика находится на более продвинутом уровне теории, чем биология. В определенных отраслях физическое мышление помогает в функциональном анализе и построении моделей.