Именно поэтому недавний прогресс в понимании структуры белков и появление возможностей для создания абсолютно новых белков с помощью искусственного интеллекта представляют собой значительное научное достижение. Три ученых-информатика недавно были удостоены Нобелевской премии по химии именно за вклад в эту область исследований.
Тем не менее, наука не стоит на месте. 2024 год принес новые успехи в разработке белков с применением искусственного интеллекта.
В начале года ученые существенно продвинулись в использовании искусственного интеллекта для моделирования взаимодействий белков с другими биомолекулами, такими как ДНК, РНК и малые молекулы, которые влияют на их форму и функции. Благодаря этому обновлению, популярный инструмент для проектирования белков RoseTTAFold получил возможность визуализировать сложные белковые комплексы на атомном уровне, что открыло путь к созданию более сложных методов лечения.
Затем компания DeepMind представила AlphaFold3 — новую модель искусственного интеллекта, которая тоже способна прогнозировать взаимодействия белков с другими молекулами. Теперь этот мощный инструмент доступен исследователям, и, скорее всего, его внедрение ускорит разработку инновационных методов лечения и углубление знаний о биологических процессах.
Также в этом году произошел важный сдвиг в дизайне белков: модели искусственного интеллекта смогли создавать так называемые "эффекторные" белки, которые способны менять свою форму и функциональность в ответ на определенные молекулярные сигналы. Эти белки оказались чрезвычайно гибкими и смогли трансформироваться в самые разные структуры, включая клетки, способные инкапсулировать и доставлять лекарства, подобно миниатюрным космическим кораблям.
Так работают ли на практике белки, созданные искусственным интеллектом? Ответ положительный: несколько исследований подтвердили их эффективность.
Одним из выдающихся достижений стало создание вселенной потенциальных редакторов генов CRISPR с помощью искусственного интеллекта. Модель, вдохновлённая крупными языковыми моделями вроде тех, что лежат в основе ChatGPT, смогла разработать систему редактирования генов, сравнимую по точности с существующими инструментами на базе CRISPR при испытаниях на клетках.
Другой искусственный интеллект создал белки круглой формы, которые эффективно преобразуют стволовые клетки в различные типы сосудистых клеток. Также были разработаны белки, направленные на утилизацию белкового "мусора": они отправляли ненужные белки в лизосомы — внутриклеточные органеллы, заполненные кислотой, где отходы перерабатываются и удаляются, поддерживая чистоту и порядок внутри клетки.
Помимо медицинских приложений, искусственный интеллект смог разработать минералообразующие белки, которые, внедренные в водные микроорганизмы, потенциально могут поглощать избыточный углерод и превращать его в известняк. Несмотря на то, что эта технология всё ещё находится на начальной стадии развития, она может сыграть важную роль в борьбе с изменением климата благодаря созданию долговременного углеродного поглотителя.
Кажется, что единственным ограничением для проектирования белков на основе искусственного интеллекта является человеческое воображение. Однако остаются задачи, с которыми ИИ пока справляется не идеально. Природа имеет обширный перечень таких задач, но некоторые из них особенно заметны.
Вернёмся к основам: связывание молекул
Когда белки взаимодействуют друг с другом, связующие молекулы могут усиливать или ослаблять эти взаимодействия. Такие молекулы привлекают особое внимание разработчиков белков, поскольку они могут действовать как препараты, блокирующие вредные клеточные реакции или усиливающие полезные.
Есть и значительные успехи. Генеративные модели искусственного интеллекта, такие как RFdiffusion, хорошо справляются с моделированием связующих веществ, особенно для свободных белков внутри клеток. Эти белки координируют большинство внутренних сигнальных путей клетки, включая те, что связаны со старением и раком. Молекулы, нарушающие цепочки коммуникации, могут останавливать нежелательные процессы. Кроме того, они могут применяться в диагностике. Например, учёные создали светящийся маркер для отслеживания состояния клетки, который активируется при наличии определённого гормона, когда связующая молекула прикрепляется к нему.
Однако разработка связующих веществ остаётся сложной задачей. Они должны точно взаимодействовать с ключевыми участками белков. Проблема усугубляется тем, что белки — это динамичные трёхмерные структуры, которые постоянно меняют форму, из-за чего сложно предугадать, какие участки наиболее важны для связывания.
Кроме того, существует недостаток данных. Хотя сотни тысяч белковых структур доступны в открытых базах данных, что позволяет моделям ИИ обучаться предсказанию взаимодействий между белками, информация о связующих веществах зачастую остаётся закрытой. Фармацевтические компании держат собственные базы данных, содержащие сведения о взаимодействии малых молекул с белками, что затрудняет доступ к данным для широкого использования.
Сейчас несколько исследовательских групп применяют искусственный интеллект для разработки простых связывающих веществ, используемых в научных экспериментах. Тем не менее, специалисты подчёркивают необходимость тестирования этих соединений на живых организмах. На данный момент ИИ неспособен предсказать биологические эффекты связывающего вещества — оно может как ускорить, так и заблокировать целевой процесс. Помимо этого, возникает проблема так называемых "галлюцинаций", когда модель генерирует связывающие элементы, которые оказываются совершенно нереалистичными.
Поэтому главная задача сейчас — накопить больше точных данных о том, каким образом белки связывают молекулы, и, возможно, дополнить анализ элементами биофизики.
Разработка новых ферментов
Ферменты — это белки-катализаторы, обеспечивающие жизнедеятельность. Они участвуют в разложении или синтезе молекул, позволяя организму усваивать пищу, строить ткани и поддерживать здоровую мозговую активность. Синтетические ферменты могут выполнять ещё более сложные задачи, например, извлекать углекислый газ из атмосферы или разлагать пластмассу.
Однако создание дизайнерских ферментов по-прежнему остается вызовом. Большинство моделей обучались на натуральных ферментах, но биологическая функция не всегда определяется одинаковой структурой. Ферменты, имеющие совершенно различную архитектуру, могут осуществлять схожие химические реакции. ИИ ориентирован на оценку структуры, а не функции, что требует лучшего понимания взаимосвязей между ними.
Подобно связующим веществам, ферменты обладают своими "горячими точками". Исследователи активно ищут их с помощью машинного обучения. Первые результаты показывают, что ИИ способен создавать такие активные центры на новых ферментах, однако эти выводы требуют дальнейшей проверки. Для эффективной работы активная зона часто нуждается в поддержке, без которой фермент может не захватить свою мишень или не удержать её.
Создание ферментов — непростая задача, особенно учитывая их подвижность. Сейчас ИИ испытывает трудности с моделированием изменений, происходящих в процессе работы фермента. Это вызывает сложности для всей отрасли.
Головоломки, меняющие форму
ИИ-модели обучаются на статичных изображениях белковых структур, полученных путём многолетних усилий, когда учёные буквально "замораживали" белок, чтобы зафиксировать его форму. Однако эти снимки отражают лишь одну, наиболее устойчивую конфигурацию белка, игнорируя его динамику — например, изменение формы при связывании с молекулой или скручивание для размещения в белковом комплексе.
Для полноценного понимания белков ИИ придётся учиться на изменяющихся структурах, отслеживающих трансформации белков. Биофизика может помочь в моделировании изгибов и поворотов белка, но это крайне сложная задача. Сегодня учёные собирают библиотеки синтетических и природных белков, постепенно мутируя каждый из них, чтобы наблюдать, как незначительные изменения влияют на их структуру и гибкость.
Введение элемента случайности в генерацию новых структур моделью ИИ также может оказаться полезным. Например, AF-Cluster, основанный на AlphaFold2, добавил небольшую долю неопределённости в прогнозы нейронной сети относительно известных белков, меняющих форму, и успешно применил этот подход к ряду структур.
Гонка за предсказанием белков
Прогнозирование белков — это соревнование, требующее сотрудничества. Команды, вероятно, будут вынуждены объединять усилия для ускорения прогресса. Создание общей инфраструктуры для обмена данными может значительно упростить совместную работу. Использование так называемых "негативных данных" — например, сведений о токсичности белков или связующих веществ, разработанных ИИ, — также могло бы помочь другим специалистам в данной сфере. Сложность заключается в том, что тестирование белков, созданных с помощью ИИ, может занимать годы, тогда как базовые алгоритмы уже успевают претерпеть обновления.
Несмотря на все трудности, очевидно, что ИИ ускоряет разработку белков. Осталось дождаться, что принесёт следующий год.