Белки необходимы для жизни, и их форма тесно связана с их функциями. Способность точно прогнозировать белковые структуры позволяет лучше понять, что они делают и как работают. В настоящее время в основной базе данных содержится более 200 миллионов белков, и только часть их трехмерных структур нанесена на карту.

искусственный интеллект, белок, атом, 3D
 

Белки - это основные механизмы биологических процессов. Они состоят из длинных цепочек аминокислот, кодируемых в ДНК. Однажды произведенные клеткой, они спонтанно складываются в сложные формы, которые часто напоминают клубок с лентами и завитушками. Точная структура белка важна для его функции. Это также имеет решающее значение для разработки небольших молекул, которые могут связываться с белком и изменять эту функцию. Именно так создаются новые лекарства.

До сих пор основным способом получения модели структуры белка с высоким разрешением была рентгеновская кристаллография. Раствор белков превращают в кристалл, что само по себе является сложным и трудоемким процессом. Затем этот кристалл раскалывают при помощи рентгеновских лучей. Картина дифракции рентгеновских лучей позволяет исследователям составить картину внутренней структуры белка. По оценке Университета Торонто, для получения структуры одного белка с помощью рентгеновской кристаллографии требуется около года и около 120 000 долларов.

 

 

 

Достижение, которое решает проблему молекулярной биологии 50-летней давности, было представлено командой DeepMind. Это лаборатория из Лондона, которая является частью материнской компании Google Alphabet. До сих пор DeepMind была известна только благодаря созданию ИИ, способного побеждать лучших игроков-людей в стратегической игре Go. И это стало важной вехой в компьютерных технологиях.

 плазмонные поляритоны, плазмон, графен, наноматериал
 

DeepMind добился прорыва в изучении формы белка во время двухгодичного конкурса алгоритмов (CASP), которые могут быть использованы для прогнозирования белковых структур. Конкурс предлагает участникам взять последовательность ДНК белка, а затем использовать ее для определения трехмерной формы белка.

Программа DeepMind для искусственного интеллекта, названная AlphaFold 2, способна предсказать структуру с очень высокой точностью. По словам Джона Моулта, молекулярного биолога из Университета Мэриленда и директора конкурса, это было намного лучше, чем любой другой представленный метод.

 

Демис Хассабис, соучредитель и главный исполнительный директор DeepMind, сказал, что компания хочет «оказать максимальное положительное влияние на общество с помощью этих технологий». Но он уточнил, что DeepMind еще не определила, как она предоставит академическим исследователям доступ к программному обеспечению для прогнозирования структуры белка. Не ясно, будет ли она стремиться к коммерческому сотрудничеству с фармацевтическими и биотехнологическими фирмами.

Хассабис сказал, что компания объявит «дополнительные подробности о том, как мы сможем предоставить доступ к системе с возможностью масштабирования»  в следующем году.

 

«Эта вычислительная работа представляет собой ошеломляющий прогресс в проблеме сворачивания белков», - сказал об AlphaFold 2 Венки Рамакришнан, лауреат Нобелевской премии по структурной биологии.

Джанет Торнтон, эксперт по структуре белка и бывший директор Европейского института биоинформатики Европейской лаборатории молекулярной биологии, сказала, что прорыв DeepMind открыл путь к отображению всего «человеческого протеома» - набора белков, обнаруженных в организме человека.

В настоящее время только около четверти белков были использованы в качестве «мишеней для лекарств», сказала она. Теперь же будут создаваться огромные возможности для изобретения новых лекарств.

 

 

Торнтон также сказал, что система искусственного интеллекта DeepMind будет иметь серьезные последствия для ученых, создающих синтетические белки. ИИ окажет большое влияние на большинство этапов: от создания новых генетически модифицированных штаммов сельскохозяйственных культур, которые станут гораздо более питательными, до новых ферментов.

Совсем недавно были использованы два других экспериментальных метода - ядерный магнитный резонанс и криогенная электронная микроскопия. Эти способы быстрее и дешевле, но создают менее точные модели, чем рентгеновская кристаллография.

В 1972 году химик Кристиан Анфинсен (лауреат Нобелевской премии) предположил, что только ДНК должна полностью определять, какую окончательную структуру принимает белок. Это предположение положило начало многолетним поискам математической модели, которая могла бы делать то, что предлагал Анфинсен. Однако проблема заключалась в том, что, несмотря на то, что законы физики контролируют сворачивание белка, существует слишком много непредсказуемых изменений. Это потребует больше времени, чтобы разгадать структуру отдельного белка с помощью случайный метод проб и ошибок.

AlphaFold 2 способен рассчитать каждую структуру белка за несколько дней. Для этого будет использоваться то, что один из исследователей DeepMind Джон Джампер, охарактеризовал как «скромные» вычислительные ресурсы. Для обучения системы потребовалось 128 специализированных вычислительных блоков AI на 16 микросхемах, созданных Google. Они называются блоками тензорной обработки и способны непрерывно работать в течение нескольких недель. Джампер отметил, что это намного меньше той вычислительной мощности, которая требовалась для других прорывов в области ИИ, включая предыдущую работу DeepMind над Go.

 

Но AlphaFold 2 от DeepMind сделал то, что предлагал Анфинсен. Теперь есть надежда, что исследователи смогут использовать AlphaFold 2 или, по крайней мере, тот же метод, чтобы перейти непосредственно от последовательности ДНК белка, которую стало относительно легко и недорого получить, к знанию его трехмерной формы. Это можно будет сделать без необходимости использования рентгеновской кристаллографии или каких-то других физических методов.

 

Андрей Лупас, директор отдела эволюции белков Института биологии развития им. Макса Планка в Тюбингене (Германия) выступал в качестве одного из экспертов по оценке конкурса CASP в этом году. Именно он назвал результаты DeepMind «поразительными».

В рамках усилий CASP по проверке возможностей системы DeepMind, Лупас использовал прогнозы AlphaFold 2, чтобы увидеть, сможет ли он узнать последнюю часть структуры белка. Интересно, что он не мог завершить эту работу с помощью рентгеновской кристаллографии в течение десяти лет. С помощью прогнозов, созданных AlphaFold 2, Лупас определил форму последнего белкового сегмента всего за полчаса.

 

AlphaFold 2 уже использовался для точного прогнозирования структуры белка ORF3a, который обнаружен в SARS-CoV-2. Это тот самый вирус, вызывающий COVID-19.

Лупас сказал, что программное обеспечение ИИ «полностью изменит правила игры» для тех, кто работает с белками. В настоящее время последовательности ДНК известны примерно для 200 миллионов белков, и каждый год обнаруживаются еще десятки миллионов. Но 3D-структуры есть только у 200 000 белков.

AlphaFold 2 был обучен только предсказывать структуру отдельных белков. Но в природе белки часто находятся в сложной структуре с другими элементами. Джампер сказал, что следующим шагом должна быть разработка системы искусственного интеллекта, которая могла бы предсказывать сложную динамику между белками. Например, надо понять, как два белка будут связываться друг с другом или как белки, находящиеся в непосредственной близости, изменяют форму друг друга.

 

DeepMind принял участие в конкурсе CASP и выиграл его два года назад. Но в то время, используя систему искусственного интеллекта AlphaFold можно было  получить только средний «общий результат теста на глобальную дистанцию» (GDT). Это показатель, который приблизительно эквивалентен процентному содержанию каждого белка.

 

Это было на шесть баллов лучше, чем у следующей выигравшей команды. Однако такой результат не мог конкурировать с эмпирическими методами, такими как рентгеновская кристаллография.

В этом году даже для этих самых сложных белков DeepMind достиг среднего GDT 87, что близко к показателю кристаллографии. Кроме того, это на 26 пунктов лучше, чем у его ближайшего конкурента.

 

Источник

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

Новости о науке, технике, вооружении и технологиях.

Подпишитесь и будете получать свежий дайджест лучших статей за неделю!