Впервые создана единая база почти всех известных белков
Опубликована база данных AlphaFold Protein Structure от DeepMind. В нее входит более 200 млн белков. В 2021 году компания Alphabet DeepMind выпустила базу данных с открытым исходным кодом, в которой были 3D-структуры сотен тысяч белков. В частности, 20 тыс. известных белков, которые есть в человеческом организме.
Теперь эту базу данных расширили до 200 млн. В нее входят почти все известные науке белки.
Сегодня ученым по прежнему сложно рассчитать точную структуру белка на основе аминокислот, из которых он состоит. Обычно для этого нужно затратить огромное количество вычислительных мощностей и времени. Это назвали проблемой сворачивания белка. Поэтому прогресс в этой области идет относительно медленно.
Теперь компания Alphabet натренировала мощный ИИ DeepMind. Он был обучен на 100 000 известных белковых структур. Такая система, по словам разработчиков, может предсказывать структуры миллионов других белков. На определение каждого уходили минуты или секунды, а не месяцы или годы.
Теперь DeepMind выпустила новое масштабное обновление базы данных. В нее входит около 214 млн структур из миллиона видов. Это почти все белки, известные в настоящее время науке. Отмечается, что база данных поможет проводить исследования в области лечения заболеваний, создания вакцин, а также поможет решить проблему устойчивости к антибиотикам.
Всю базу, которая состоит из 25 терабайт данных, можно загрузить из Google Cloud.
Источник: https://hightech.fm/
1.08.2022