— Какой именно софт для анализа ДНК-данных вы используете? В чём его особенности?
— Обработка результатов ДНК-исследования предполагает несколько этапов: первичный контроль качества полученных данных, биоинформатическая и статистическая обработка. Весь этот процесс мы называем Pipeline (в переводе с английского – «трубопровод»). Это означает, что последовательно выполняется множество различных модулей, написанных на разных языках программирования (R, Perl, Python, Java, C++).
Помимо софта, большое значение имеют базы данных, которые являются принципиальной основой для ДНК-исследования как для продукта. Одна из наших отличительных особенностей заключается в том, что мы работаем только с базами данных, собранными «вручную».
Кроме того, мы используем собственную базу, составленную из результатов исследований, которые мы проводили на территории России – это позволит учитывать особенности российской популяции, т.е. народов, которые в плане генетики существенно отличаются от, например, европейцев.
— Каким образом расшифровываются данные исследований?
— Первый этап ДНК-исследования – это контроль качества биологического образца, пробоподготовка и выделение ДНК. Эта работа проводится в лаборатории, чтобы подготовить материал для запуска оборудования.
Второй этап – непосредственно расшифровка. Запускается прибор, с него по конкретным точкам на микрочипах поступают данные в «сыром» виде (raw data).
Третий этап – биоинформатическая обработка, контроль качества данных, полученных с прибора, и конвертация в удобные для нас форматы. Фактически это уже геном, представленный в виде набора букв A,C,G,T. При этом нам известно, какая буква в какой позиции генома находится и какой эффект оказывает на организм человека.
Завершающий этап – набор данных (например, анкетные данные), необходимых для расчёта рисков. Собственно, именно на этом этапе генетические данные человека конвертируются в информацию о его здоровье, предрасположенностях и происхождении.
После этого мы выдаём результаты исследования вместе с генетической информацией в виде отчётов в личном кабинете клиента.
— А как происходит диагностика, например, наследственных заболеваний?
— Сейчас мы используем две технологии: секвенирование и генотипирование. Секвенирование (NGS) подразумевает под собой прочтение подряд больших последовательностей генома. Полный геном прочитывается практически полностью (более 99 %). В случае диагностики наследственных заболеваний и определения статуса носительства, прочитываются большие фрагменты областей генома с клинически значимой информацией о генетических заболеваниях.
Если говорить о предрасположенности к заболеваниям, происхождения (генеалогии) и прочих исследованиях, относящихся к персональной генетике, то здесь удобнее проводить генотипирование на микрочипах. В этом случае набор точек и последовательность генов не читается подряд, а рассматриваются только те, которые нас интересуют.
Их общее количество – более полумиллиона, и наша команда специально отбирала именно те точки, которые необходимы в наших исследованиях. Часть были выбраны, так как имеют клиническую значимость, часть – разбросана по всему геному, чтобы покрыть его с достаточной плотностью. Это важно как для генеалогии, когда необходимо искать целые паттерны (участки геномов, которые могли прийти к нам от общих предков), так и для GWAS-исследований (Genome-Wide Association Studies), которые выявляют наличие генетических маркеров, ассоциированных с развитием какого-либо заболевания.
— Чем ценны эти исследования на практике? Какую пользу они принесут людям?
—Поскольку наш геном не меняется в течение жизни, польза безусловна: человек получает о себе информацию, которой может руководствоваться в дальнейшем и которая будет применима в различных обстоятельствах.
С точки зрения практической пользы наиболее важны ДНК-тесты, когда на основе генетических данных и информации об образе жизни и состоянии здоровья конкретного человека мы рассчитываем вероятность возникновения мультифакторных заболеваний.
Также мы проводим исследования, помогающие, например, при составлении персональной программы питания и тренировок, если вы хотите похудеть или накачать мышцы. С учетом особенностей своего организма сделать это будет гораздо проще.
При планировании беременности практическая значимость нашей работы очевидна: мы определяем, являются ли будущие родители носителями какого-либо генетического заболевания и, если оно выявлено, рассчитываем вероятность его наследования ребёнком. В случае высокого риска паре будет рекомендовано обратиться к врачу-репродуктологу. К сожалению, внешнее здоровье родителей не может гарантировать их ребёнку отсутствие тяжёлого наследственного заболевания – от этого никто не застрахован. С помощью генетического исследования эти риски можно свести к нулю.
— Как происходит работа с большими данными? Как вы их анализируете?
— Один файл с полной расшифровкой генома человека весит около 80Гб. Понятно, что обрабатывать такие объёмы данных на персональном компьютере затруднительно. Поэтому мы прибегаем к помощи облачных вычислительных мощностей.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.