Разработана новая программа сверхбыстрого анализа геномов

02.02.201518500

Исследователи из Общенациональной детской больницы (Nationwide Children's Hospital, США) разработали программное обеспечение (ПО) для геномного анализа, позволяющее сократить время, необходимое для поиска в геноме человека патогенных (связанных с заболеваниями) генетических вариантов, с недель до нескольких часов. Результаты опубликованы в журнале Genome Biology.

«Секвенирование первого генома человека потребовало примерно 3 млрд. долларов США и 13 лет, – рассказывает Питер Уайт (Peter White), доктор философии, ведущий исследователь и директор Центра Биомедицинской Геномики (Biomedical Genomics Core) при Общенациональной детской больнице, главный автор исследования, – Сейчас даже самые маленькие исследовательские группы могут провести секвенирование генома в течение нескольких дней. Однако после получения данных секвенирования многие группы попадают в тупик. Исследователи остаются с миллиардами данных, которые необходимо проанализировать, прежде чем полученную информацию можно будет тщательно отобрать для использования в исследовательских и медицинских целях».

Для преодоления проблем анализа больших объемов данных доктор Уайт и его исследовательская группа разработали вычислительное программное решение Churchill. Используя новые вычислительные методы, Churchill позволяет эффективно анализировать целые геномы всего лишь за 90 минут.

«Churchill полностью автоматизирует аналитический процесс – на входе используются «сырые» данные секвенирования, а на выходе после серии сложных и интенсивных вычислительных процессов генерируется список генетических вариантов, готовых для клинической интерпретации и третичного анализа, – объясняет доктор Уайт. – Каждый шаг процесса был оптимизирован таким образом, чтобы значительно снизить время анализа, что, в конечном итоге, привело к методу анализа, воспроизводимому на 100%».

Продуктивность Churchill была оценена с использованием критериев оценки Национального Института Стандартов и Технологий (National Institute of Standards and Technology, США). По сравнению с другими вычислительными подходами, Churchill показал самую высокую чувствительность (99,7%), точность (99,99%) и общую диагностическую эффективность (99,66%).

«В Общенациональной детской больнице мы поставили стратегическую цель внедрить геномную медицину во множество направлений исследований в педиатрии и здравоохранении. Быстрая диагностика моногенных заболеваний особенно критична для новорожденных, поэтому наша исходная цель – создать аналитический метод, который был бы сверхбыстрым, но без ущерба для стандартов клинической диагностики, таких как воспроизводимость и точность. Достигнув этого, мы обнаружили, что вторым преимуществом Churchill является то, что его можно адаптировать для геномного анализа на уровне популяций», – говорит доктор Уайт.

Чтобы продемонстрировать способность Черчилля выполнять анализ на популяционном уровне, доктор Уайт и его исследовательская группа получили грант от компании Amazon Web Services (AWS) в рамках программы Education Research Grants, который дал им возможность успешно проанализировать в ходе 1 фазы черновые данные, полученные в результате проекта 1000 Genomes – международного проекта, целью которого было получение обширного каталога о генетических вариантах людей, представляющих различные популяции со всего света. Используя облачные вычислительные ресурсы от AWS, Churchill смог завершить анализ 1088 полногеномных образцов за 7 дней и выявить миллионы новых генетических вариантов.

«Учитывая, что некоторые популяционные геномные исследования находятся в процессе осуществления, мы надеемся, что Churchill окажется оптимальным подходом для решения проблемы анализа данных, представленных в этих исследованиях», – рассказывает доктор Уайт.

Алгоритм Churchill прошел лицензирование в компании GenomeNext (США ), которая использовала технологию Churchill для разработки надежной и автоматизированной платформы ПО-как-услуги. Новая платформа даст возможность пользователям просто загружать необработанные полногеномные, экзомные или таргетные последовательности в систему GenomeNext и запускать анализ, который не только выявит генетические варианты, но и полностью аннотирует наборы данных, сделав возможной фильтрацию и выявление патогенных вариантов. Компания GenomeNext предлагает решения по анализу геномных данных, которые упрощают процесс управления данными, и автоматизирует анализ широкомасштабных геномных исследований. Новая система также разработана с учетом потребностей клинического и научного рынка и предлагает стандартизированные решения для выполнения регулярных задач.

По материалам Nationwide Children's Hospital

Оригинальная статья:
Benjamin J Kelly, James R Fitch, Yangqiu Hu, Donald J Corsmeier, Huachun Zhong, Amy N Wetzel, Russell D Nordquist, David L Newsom, Peter White. Churchill: an ultra-fast, deterministic, highly scalable and balanced parallelization strategy for the discovery of human genetic variation in clinical and population-scale genomics. Genome Biology, 2015; 16 (1) DOI: 10.1186/s13059-014-0577-x


Ваш комментарий:
Только зарегистрированные пользователи могут оставлять комментарии. Чтобы оставить комментарий, необходимо авторизоваться.
Вернуться к списку статей