Преграды на пути внедрения секвенирования генома в клиническую практику

06.03.201619280

Результаты нового исследования, оценивавшего точность современных методов секвенирования человеческого генома, показали, что множество значимых с медицинской точки зрения участков ДНК человека находится в сложных и труднодоступных для анализа областях, при секвенировании которых в настоящее время возникают систематические ошибки.

Гены и фрагменты генов, расположенные в сложных областях, в настоящее время составляют почти четверть генома человека, который насчитывает 3,2 млрд. пар оснований.

По мнению исследователей из Стэнфордского Университета (Stanford University, США) и Национального Института Стандартов и Технологий (National Institute of Standards and Technology, NIST, США), результаты их исследования могут стать «призывом для тех, кто заинтересован в высокой технической точности при проведении секвенирования генома в клинических целях». По словам ученых, поскольку секвенирование генома начинает проникать из лабораторий в клиническую практику, необходимо иметь материалы и методы для верификации результатов исследования во всех областях генома, которые секвенируются для диагностических или других медицинских целей.

Статья, описывающая трудности при проведении сравнительного анализа сложных, но клинически значимых областей генома, была опубликована в журнале Genome Medicine. Полученные результаты подчеркивают необходимость получения дополнительных референсных материалов, с которыми могут быть сопоставлены данные секвенирования и анализа.

По сути, эти референсы должны быть инструментами контроля и обеспечения качества исследования. Они необходимы для проверки точности данных секвенирования и анализа, то есть предотвращения получения ложно-положительных и ложно-отрицательных результатов исследования.

Одним из таких инструментов, занимавшим центральное место в исследовании, проведенным учеными из Стэнфордского Университета и NIST, был референсный материал, созданный NIST и его партнерами в рамках консорциума Genome in a Bottle, – NIST RM 8398, образец ДНК человека для полногеномной оценки вариантов, который в настоящее время содержит характеристики около 77% генома с высокой степенью достоверности.

«Сложные области, последовательность которых мы даже не можем уверенно секвенировать, включают в себя области, обладающие клинической значимостью. Это означает, что в настоящее время наш референсный геном не может быть использован для анализа сложных генов и сложных областей генома, которые уже тестируются или для которых уже были разработаны новые методы секвенирования», – говорит Джастин Зук (Justin Zook), биомедицинский инженер из NIST.

«Хорошая новость заключается в том, что в данном случае 77% донорского генома было достоверно секвенировано с использованием современных методов. Задача, стоящая перед нами сейчас, заключается в том, чтобы сосредоточить наши исследования на оставшихся 23% генома, главным образом, на тех областях, которые пока остаются недетектируемыми. Только тогда мы сможем в полной мере реализовать потенциал точной медицины», – говорит один из авторов исследования, Рэйчел Голдфедер (Rachel Goldfeder) из Стэнфордского Университета.

Ученые из Стэнфордского Университета и NIST использовали данные, полученные при проведении полногеномного и полноэкзомного секвенирования (секвенирования только белок-кодирующих участков генома).

Пробоподготовка для секвенирования нового поколения (next generation sequencing, NGS) выглядит следующим образом: нити ДНК разъединяются и случайным образом нарезаются на короткие фрагменты. Затем эти фрагменты амплифицируются (нарабатываются их многочисленные копии), а затем секвенируются – с каждой копии производится и одновременно читается ее комплементарная цепь. Затем сигналы прочтения анализируются, чтобы определить последовательность букв в исходных фрагментах, состоящую из четырех букв генетического алфавита: А (аденин), С (цитозин), G (гуанин) и Т (тимин).

Затем фрагменты выравниваются на референсный геном, чтобы выявить их расположение в геноме, а также изменения анализируемого генома относительно референса (изменения в последовательности нуклеотидов, вставки (инcерции) или выпадения (делеции) «букв» или целых геномных регионов. Когда метод выявляет различия, регистрируется обнаруженный вариант (variant call).

Консорциум Genome in a Bottle каталогизировал высоко достоверные варианты в хорошо охарактеризованных областях референсного образца РМ 8398. Ученые из Стэнфордского Университета и NIST сравнили эти варианты с таковыми, полученными на двух разных платформах для секвенирования. Особый интерес вызвали различия в 56 имеющих практическую значимость с медицинской точки зрения генах, которые Американский Колледж Медицинской Генетики и Геномики (American College of Medical Genetics and Genomics, ACMG) рекомендует использовать при составлении клинических отчетов.

Точность определения вариантов зависела от области генома, типа различий (например, была ли это замена нуклеотида или инсерция), степени покрытия (количества раз, которое конкретный фрагмент ДНК был прочитан) и аналитических методов.

Например, исследователи продемонстрировали, что при полногеномном секвенировании ложно-отрицательные варианты (невыявленные варианты или мутации) возникали в основном из-за программных инструментов, используемых для фильтрации ошибок в данных секвенирования. Большинство ложно-отрицательных вариантов, полученных при проведении полноэкзомного секвенирования, было обусловлено недостаточно большим покрытием.

Можно сказать, что значительные части генома представляют собой в значительной степени неизведанную территорию. Только около 5% из 19-21 тыс. генов, кодирующих белки, полностью расположены в участках человеческого генома, которые в настоящее время были охарактеризованы с высокой степенью достоверности.

По словам ученых, ложно-отрицательный результат в клиническом отчете пациента может привести к опасным последствиям для здоровья как самого пациента, так и его семьи. Именно поэтому, по словам исследователей, очень важно понять, насколько точно могут быть исследованы интересующие ученых области генома.

Поскольку современные платформы для секвенирования склонны совершать систематические ошибки в определенных регионах генома, некоторые варианты, аннотированные в базах данных с открытым доступом, на самом деле являются ложно-положительными. Также возможно, что трудно провести различия между существующими вариантами и систематическими ошибками секвенирования.

Ученые из Стэнфордского Университета и NIST продемонстрировали, что в среднем примерно пятая часть каждого из 56 генов, ассоциированных с заболеваниями и отмеченных ACMG, расположена за пределами хорошо охарактеризованных регионов с высокой степенью доверия референсного образца, созданного NIST. По мнению ученых, решение этой задачи требует работы в направлении разработки единой технологии или, по крайней мере, прозрачности при сообщениях об уровне доверия для каждого обнаруженного варианта.

По материалам National Institute of Standards and Technology (NIST)

Оригинальная статья:
Rachel L. Goldfeder, James R. Priest, Justin M. Zook, Megan E. Grove, Daryl Waggott, Matthew T. Wheeler, Marc Salit, Euan A. Ashley. Medical implications of technical accuracy in genome sequencing. Genome Medicine, 2016; 8 (1) DOI: 10.1186/s13073-016-0269-0


Ваш комментарий:
Только зарегистрированные пользователи могут оставлять комментарии. Чтобы оставить комментарий, необходимо авторизоваться.
Вернуться к списку статей