Быстрое развитие методов машинного и глубокого обучения привело к их повсеместному распространению во многих областях исследований, в том числе они нашли применение и для решения задач протеомики. Сегодня методы машинного обучения играют важную роль в прогнозировании трехмерных структурных компонентов белков, интерпретируя то, как белковые последовательности и их гомология управляют межостаточными контактами и структурной организацией. На последних CASP (Critical Assessment of Structure Prediction – критическая оценка предсказания структуры), где оценивалось положение дел в моделировании структуры белка на основе аминокислотной последовательности, был продемонстрирован значительный прогресс в моделировании конструкций без использования структурных шаблонов (исторически моделирование «ab initio»). Прогресс был обусловлен успешным применением методов глубокого обучения для прогнозирования расстояний между остатками. В свою очередь, эти результаты привели к значительному повышению точности трехмерной структуры при условии, что для семейства белков известно достаточное количество последовательностей. Кроме того, количество последовательностей, необходимых для выравнивания, существенно сократилось, а точность моделей на основе шаблонов также значительно улучшилась. В данной работе предлагается обзор последних успехов в применении методов глубокого обучения, использующихся для предсказания трехмерной структуры белка. Также рассмотрены возможности использования нейронных сетей для выявления неизвестных белковых структур и функций белков, что является одной из главнейших задач протеомики. Описываются проблемы, которые еще предстоит решить, однако ожидается, что в ближайшем будущем описанные методы будут играть решающую роль в структурной биоинформатике белков.
Ключевые слова: глубокое обучение, биоинформатика, структура белка, белковая последовательность, протеомика.