Машинное обучение помогает найти бактерии, устойчивые к лекарствам

Машинное обучение помогает найти бактерии, устойчивые к лекарствам
9 Июля 2020

Устойчивость к противомикробным препаратам (AMR) возникает, когда бактерии или другие микроорганизмы развиваются или приобретают гены, которые кодируют механизмы лекарственной устойчивости. Например, у бактерий, вызывающих стафилококковые или стрептококковые инфекции или заболевания, такие как туберкулез и пневмония, развились штаммы, на которые не действуют лекарственные препараты, в том числе антибиотики.

Поскольку крупномасштабное генетическое секвенирование сегодня стало проще, исследователи ищут гены, ответственные за устойчивость к препаратам. Чтобы точнее и быстрее определить AMR-устойчивые гены, ученые разработали специальынй алгоритм машинного обучения.

Программа использует признаки «белков устойчивости», а не сходство последовательностей генов для идентификации AMR-генов. Исследователи обратились к теории игр, инструменту, который используется в нескольких областях (особенно в экономике) для моделирования стратегических взаимодействий между игроками. Как ни странно, теория игр помогает идентифицировать AMR-гены. Используя алгоритм машинного обучения и подход теории игр, исследователи изучили взаимодействие нескольких характеристик генетического материала, включая его структуру и физико-химические и композиционные свойства белковых последовательностей, а не просто сходство последовательностей.

«Достоинство этой программы заключается в том, что мы можем фактически обнаружить AMR в недавно секвенированных геномах», – отмечают авторы работы.

Команда Университета штата Вашингтон рассмотрела «гены устойчивости», обнаруженные у видов Clostridium, Enterococcus, Staphylococcus, Streptococcus и Listeria. Эти бактерии являются причиной многих крупных инфекций и инфекционных заболеваний, включая стафилококковые инфекции, пищевые отравления, пневмонию и опасный для жизни колит. Они смогли точно классифицировать «гены устойчивости» с точностью до 90%.

Они разработали программный пакет, который могут загружать и использовать другие исследователи для поиска AMR в больших данных генетического материала. Программное обеспечение также может быть улучшено с течением времени. Алгоритм также можно будет переучивать, когда будут появляться новые данные и последовательности.

Источник: Научная Россия