ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Целью исследования является создание часов старения, учитывающих новые аллельные полиморфизмы в результатах полногеномного секвенирования, для определения биологического возраста. Для изучения структуры данных были использованы .vcf-файлы 21 образца из исследования, посвященного установлению роли отдельных геномных вариантов факторов морфогенеза головного мозга в развитии когнитивных нарушений. В качестве исходных данных собственного исследования будут использованы результаты полногеномного секвенирования (GWAS) в формате .vcf. Для анализа данных будут применены методы корреляционного анализа и машинного обучения. Предлагается следующий алгоритм обработки данных: препроцессинг сырых данных, сравнение найденных полиморфизмов с известными, установление зависимости между обнаруженными полиморфизмами и известными возраст-ассоциированными заболеваниями, оценка статистической значимости найденных новых полиморфизмов с возрастными показателями (использование обученных моделей), выбор модели, проверка работы часов. В процессе разработки алгоритма была изучена структура .vcf-файлов с целью автоматизации поиска новых аллельных полиморфизмов в генах с известным участием в развитии возраст-ассоциированных заболеваний. Анализ результатов полноэкзомного секвенирования 21 образца позволил идентифицировать несколько геномных вариантов (rs6265, rs4760, rs4758443 и др.), ассоциированных по данным литературы с нарушением развития головного мозга и возникновением когнитивных нарушений, а также возраст-ассоциированных заболеваний. Предварительные результаты анализа демонстрируют, что предложенный метод обработки биоинформатических данных потенциально может быть использован для оценки биологического возраста исследуемого образца, однако малый объем выборки не позволяет установить точность предложенного метода анализа. По этой причине планируется провести анализ 5000 дополнительных образцов, в ходе которого будет проведена оптимизация алгоритмов предлагаемых часов старения и оценена их точность. Анализ большей выборки биологических образцов от пациентов с возраст-ассоциированными заболеваниями позволит выявить новые аллельные полиморфизмы, что в дальнейшем повысит точность часов старения.