Что такое Биоинформатика?
Биоинформатика — междисциплинарная область, объединяющая общую биологию, молекулярную биологию, кибернетику, генетику, химию, компьютерные науки, математику и статистику. Крупномасштабные биологические проблемы, требующие анализа больших объёмов данных, решаются биоинформатикой с вычислительной точки зрения. Биоинформатика главным образом включает в себя изучение и разработку компьютерных методов и направлена на получение, анализ, хранение, организацию и визуализацию биологических данных.
В похожем контексте часто упоминается термин вычислительная биология. Эта область акцентирует свое внимание на разработке алгоритмов и математическом моделировании социальных, поведенческих и биологических систем. Биоинформатику считают областью внутри вычислительной биологии, которая главным образом сфокусирована на статистической обработке биологических данных. Различия в подходе с разных сторон: биоинформатики — это биологи, специализирующиеся на использовании вычислительных систем и инструментов для решения биологических задач, а вычислительные биологи — это специалисты по компьютерным наукам, математики, статистики и инженеры, разрабатывающие инструменты для таких расчётов
Краткая история биоинформатика
Термин "биоинформатика" был введен в обиход в 1970-х годах, однако становление дисциплины началось раньше. Ключевые вехи развития:
Для чего нужна Биоинформатика?
Биоинформатика в широком смысле подразумевает работу с любыми видами биологических данных, включая исследование электронных микрофотографий, поиск ключевых слов в биологической литературе и так далее. Если рассматривать биоинформатику как набор подходов и методов для работы с данными, то в зависимости от типов технических задач она включает в себя:
Однако, биоинформатические методы анализа также неразрывно связаны со многими научными областями, которые подразумевает поиск ответов на конкретные биологические вопросы. В таком случае основные направления можно выделить на основании исследуемых объектов:
Для каждого из перечисленных разделов можно выделить свои стандартные типы данных, способы их обработки, биоинформатические алгоритмы и базы данных.
В биоинформатике используются методы прикладной математики, статистики и информатики. Биоинформатика используется в биохимии, биофизике, экологии и в других областях. Наиболее часто используемыми инструментами и технологиями в этой области являются языки программирования Python, R, Java, C#, C++; язык разметки — XML; язык структурированных запросов к базам данных — SQL; программно-аппаратная архитектура параллельных вычислений — CUDA; пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете — MATLAB, и электронные таблицы.
Главная цель Биоинформатики
Главная цель биоинформатики — способствовать пониманию биологических процессов. Отличие биоинформатики от других подходов состоит в том, что она фокусируется на создании и применении интенсивных вычислительных методов для достижения этой цели. Примеры подобных методов: распознавание образов, data mining, алгоритмы машинного обучения и визуализация биологических данных. Основные усилия исследователей направлены на решение задач выравнивания последовательностей, нахождения генов (поиск региона ДНК, кодирующего гены), расшифровки генома, конструирования лекарств, разработки лекарств, выравнивания структуры белка, предсказания структуры белка, предсказания экспрессии генов и взаимодействий «белок-белок», полногеномного поиска ассоциаций и моделирования эволюции. Биоинформатика сегодня подразумевает создание и совершенствование баз данных, алгоритмов, вычислительных и статистических методов и теории для решения практических и теоретических проблем, возникающих при управлении и анализе биологических данных.
Примеры применения биоинформатики в реальной жизни
Биоинформатика давно вышла за пределы научных лабораторий. Её методы активно используются в самых разных сферах:
Будущее биоинформатики
С каждым годом объём биологических данных растёт экспоненциально. Если в 2000-х годах расшифровка одного генома человека стоила миллиарды долларов и занимала годы, то сегодня это можно сделать за несколько часов и за сумму около 200–300 долларов. Такая доступность данных порождает новые вызовы: как хранить, обрабатывать и извлекать пользу из петабайт информации?
Именно здесь биоинформатика продолжает развиваться. Уже сейчас активно внедряются:
В ближайшие десятилетия биоинформатика станет такой же обыденной и необходимой, как сегодня интернет или мобильная связь. Она изменит подход к медицине, экологии и даже к пониманию того, что значит быть человеком.