[МУЗЫКА] [МУЗЫКА] Итак, мы начинаем наш курс «Введение в биоинформатику». Определение «биоинформатика» было введено в 1970 году голландским ученым Полиной Хогевег. Был определен ею как «изучение информатических процессов в биотических системах». Определения «биоинформатики» с тех пор претерпели изменения и зависят они от того, кем они даются — программистами, биологами, математиками, статистиками, алгоритмистами или людьми, работающими со сложными биологическими системами. Национальный институт здоровья Америки определяет «биоинформатику» как «исследование развития использования компьютерных программ и подходов к расширенному использованию биологических, медицинских и поведенческих данных, что включает хранение, организацию, архивирование, анализ и визуализацию данных». К этому нам также хочется добавить, что биоинформатика уже стала наукой — наукой о биологических данных. Целью этой науки является не только развитие алгоритмов хранения и использования данных, но и подготовка данных для получения наиболее важных и достоверных результатов. Три составные части обуславливают становление и бурный рост биоинформатики в наши дни. Это современные и высоко производительные экспериментальные технологии, Интернет и облачные компьютерные технологии. Давайте вспомним о центральной догме молекулярной биологии. Она определяет движение генетической информации в биологических системах, от ДНК к РНК и от РНК к белкам. Процессы транскрипций и трансляций обуславливают это движение. Для изучения механизмов передачи информации между ДНК, РНК и белками, и их регуляции ученые проводят эксперименты по определению первичной структуры биологически активных молекул, изменений, происходящих в них в зависимости от тех или иных условий; определяют функционально значимые области молекул, их вторичные структуры и механизмы взаимодействия молекул. Для этого определяется первичная последовательность ДНК, РНК и белков, мутации, происходящие в ДНК в зависимости от тех или иных условий, кодирующие и некодирующие области ДНК, перестройки в молекулах, проводится сравнительный анализ. Также определению механизмов и их роли и регуляций способствует знание структуры как белков, так и РНК, а также белок-белковых взаимодействий. Для работы с данными, получаемых в результате всех этих экспериментов, необходимо хорошо их понимать и уметь с ними обращаться. Биоинформатика облегчает эту задачу, создавая программы обработки первичных данных, их сборки, анализа, систематизации и сравнения. Многообразие биологических подходов и задач влечет за собой и многообразие специфических биоинформатических подходов. Геномика вобрала в себя задачи, связанные с функционированием молекул ДНК в клетках живых организмов. Транскриптомика изучает поведение молекул РНК. Протеомика охватывает все разнообразие сложных задач, связанных с синтезом и работой белков. Однако ДНК, РНК и белки — не единственные молекулы в клетках, обеспечивающие ее жизненный цикл. Необходимость понимания роли жиров и метаболитов дали рождение еще двух «омиксам», которым нужна помощь биоинформатики. Комплексное изучение всех этих биологически активных молекул и процессов, в которые они вовлечены, является задачей системной биологии. А теперь попробуйте представить себе, какое количество информации свалится на голову бедного биолога в результате такого комплексного подхода. Можно себе представить, что он справится со всеми этими задачами без использования компьютеров? Конечно, нет. Количество нуклеотидов, депонируемых в генбанк Национального института здоровья Америки, удваивается каждые полтора года. Появление новых высокотехнологичных секвенсных подходов привело к необходимости создания нового хранилища, получившего название «Архив коротких ридов». [МУЗЫКА] [МУЗЫКА] [МУЗЫКА]