Использующая искусственный интеллект платформа функциональной аннотации омиксных данных в биологии и медицине

О проекте

Будет создана платформа обработки больших омиксных данных в контексте интерактомной модели человеческой клетки. Обученная модель сможет достраивать недостающие слои данных и создавать цифровой двойник объекта для моделирования изменения фенотипа в ответ на модификаторы (препараты, метаболиты и др). Модель позволит определить круг оптимальных молекулярных маркеров различных патологических состояний и будет применима в диагностике, при генетическом скрининге популяции и для превентивной медицины.

Руководитель

Актуальность проекта

Быстрое развитие технологий молекулярного профилирования приводит к экспоненциальному накоплению омиксных данных, отражающих различные аспекты функционирования живых клеток и организмов. При этом становится всё более очевидной ограниченность производительности и аналитического потенциала мозга исследователя, даже самого талантливого и плодотворного, что оставляет большую часть накопленных данных без адекватного анализа.

Наверное, не вызывает сомнений то, что максимально полное использование получаемой информации возможно только с совершенствованием вычислительных аналитических платформ.

При этом совместное применение алгоритмических подходов, а также подходов, основанных на машинном обучении и искусственном интеллекте, способно создавать наиболее производительные аналитические платформы, обладающие при этом также и воспроизводимостью действия.

Выполнение настоящего проекта приведёт к созданию такой гибридной аналитической платформы, моделирующей различные типы клеток и тканей человека. Основываясь на интерактомном графе, сконструированном для каталогизированных независимо валидированных молекулярных взаимодействиях, будет создана многослойная модель, объединяющая геномные, эпигеномные, транскриптомные, протеомные, метаболомные, а также фенотипические данные. Ожидается, что модель сможет решить проблему взаимного соответствия различных типов омиксных данных и позволить проведение «омиксной импутации», то есть достройки недостающей части омиксных данных для исследуемого образца по имеющимся.

При этом алгоритмическая часть будет отвечать за связку отдельных узлов интерактома на уровне конкретных слоёв омиксных данных. Задачей модулей, использующих машинное обучение, будет динамическая фильтрация данных, нацеленная на минимизацию присутствия артефактов среди анализируемых массивов информации, а также взаимное сопоставление слоёв омиксных данных или их отдельных фрагментов. Задачей модулей искусственного интеллекта станет также и проблема связи фенотипической аннотации и доступных омиксных данных.

К модели будут привязаны структуры молекул-модификаторов (ингибиторов, индукторов), которые способны влиять на функционирование молекулярных путей клетки, включая биохимические реакции, внутриклеточную и межклеточную сигнализацию.

Вместе взятое, это позволит создавать цифровой двойник исследуемого объекта и проводить глубокое моделирование его реакции на отдельные так называемые пертурбагены, то есть на контролируемую регуляцию отдельных молекулярных узлов системы.

Научная и практическая значимость проекта

Проект нацелен на создание платформы обработки больших омиксных данных, включая геномные, эпигеномные, транскриптомные, протеомные и метаболомные профили, в контексте интерактомной модели человеческой клетки. Такая модель основывается на интеграции данных о межмолекулярных взаимодействиях, в результате чего создаётся связанный граф, учитывающий взаимодействие максимального количества различных биологических молекул в клетке. К модели привязаны структуры молекул- модификаторов (ингибиторов, индукторов), которые способны влиять на функционирование молекулярных путей клетки, включая биохимические реакции, внутриклеточную и межклеточную сигнализацию. Создаваемая модель будет иметь ряд приложений для нужд практической медицины:

Приложения в онкологии

– геномный анализ для аннотации герминальных и соматических мутаций, вариабельности копийности генов, потери гетерозиготности хромосомных участков, предрасположенности к побочным эффектам терапии, микросателлитной нестабильности, дефицита гомологичной рекомбинации; 

– транскриптомный, протеомный и метаболомный анализ для установления молекулярного диагноза и поиска оптимальных активированных мишеней противоопухолевой терапии, в том числе комбинированной, в том числе на основе противоопухолевых вакцин и клеточных технологий;

– single-cell (единичноклеточный);

– транскриптомный анализ для определения клеточного состава опухоли и персонализации специфической терапии против опухолевых и неопухолевых стромальных клеток.

Генетический анализ неопухолевых патологий

– скрининг известных патогенных и потенциально патогенных мутаций/вариантов;

– поиск нестабильных хромосомных участков и вариабельности копийности генов; – определение новых патогенных вариантов в исследуемых образцах;

– аннотация предрасположенности к побочным эффектам лекарств;

– персонализация подбора дозировки терапевтических препаратов.

Генетический скрининг условно здоровой части популяции 

– скрининг известных патогенных и потенциально патогенных мутаций/вариантов;

– поиск нестабильных хромосомных участков и вариабельности копийности генов;

– аннотация предрасположенности к побочным эффектам лекарств;

– персонализация подбора дозировки терапии препаратов;

– реконструкция фенотипического портрета индивидуума.

Превентивная медицина условно здоровой части популяции

определение эффективности репарации ДНК в функциональных тестах на живых мононуклеарных клетках крови испытуемых;

– определение активности молекулярных путей репарации ДНК по данным транскриптомного профилирования мононуклеарных клеток крови испытуемых;

– определение корреляции генетических вариантов генов системы репарации с наблюдаемой эффективностью репарации ДНК в живых мононуклеарных клетках крови испытуемых;

– выработка практических рекомендаций для испытуемого на основании проведённого анализа.

Ожидаемые результаты

Результаты проекта будут обладать новизной, оригинальностью и иметь существенную научную значимость.

Создание дополненных омиксными данными интерактомных моделей само по себе представляет научный интерес, и в данном случае для этого в значительной мере будут использованы собственные оригинальные подходы, разработанные нами ранее. Создание аналитической платформы для автоматического поиска/перепозиционирования/прогноза препаратов и их мишеней будет представлять как методический интерес, так и интерес с точки зрения конкретных получаемых результатов. Важным результатом будет и масштабное решение проблемы сопоставления основных типов омиксных данных друг с другом, а также с фенотипическими проявлениями.

Мы ожидаем, что результаты работы будут соответствовать мировому уровню исследований и, возможно, в отдельных аспектах идти впереди ввиду оригинальности постановки задачи и использования современного оригинального инструментария исследований. Такая оценка косвенно опирается на наш предыдущий опыт публикации работ сходного профиля в международных научных изданиях (например, In silico Pathway Activation Network Decomposition Analysis (iPANDA) as a method for biomarker development. Ozerov IV, et al., Nat Commun. 2016 doi: 10.1038/ncomms13427 IF 17.69; VEGF blockade enhances the antitumor effect of BRAFV600E inhibition. Comunanza V, et al. EMBO Mol Med. 2017 doi: 10.15252/emmm.201505774, IF 14.3; Molecular pathway activation - New type of biomarkers for tumor morphology and personalized selection of target drugs. Buzdin A, et al. Semin Cancer Biol. 2018 doi: 10.1016/j.semcancer.2018.06.003, IF 15.7; Constitutive interferon signaling maintains critical threshold of MLKL expression to license necroptosis. Sarhan J, et al. Cell Death Differ. 2019 doi: 10.1038/s41418-018-0122-7, IF 12.07; RNA sequencing for research and diagnostics in clinical oncology. Buzdin A, et al. Semin Cancer Biol. 2020 doi: 10.1016/j.semcancer.2019.07.010, IF 15.7; Growth factor signaling predicts therapy resistance mechanisms and defines neuroblastoma subtypes. Lebedev T, et al. Oncogene. 2021 doi: 10.1038/s41388-021-02018-7, IF: 9.3; OncoboxPD: human 51 672 molecular pathways database with tools for activity calculating and visualization. Zolotovskaia MA, et al. Comput Struct Biotechnol J. 2022 doi: 10.1016/j.csbj.2022.05.006, IF 7.271).

Важно не «отравить» созданные модели данными низкого качества, поэтому в проекте большое внимание будет уделено экспериментальной валидации разрабатываемой платформы, например, на полученных в параллель различных видах омиксных данных. Несмотря на очевидную фундаментальность проекта, он имеет ряд относительно быстро достижимых конкретных приложений в биомедицине.

Партнеры

Обратная связь

Нажимая на кнопку «СОГЛАСЕН», Вы подтверждаете, что проинформированы об использовании на нашем сайте файлов cookie, а также ознакомлены с нашей Политикой конфиденциальности.

Согласен