GenomeSpace поможет биологам интерпретировать результаты геномных исследований
Множество биологов прикладывает огромные усилия для того, чтобы разобраться с потоком данных, последовавших за недавним развитием технологий геномного секвенирования. В частности, исследователи нередко сталкиваются с необходимостью использования нескольких разных инструментов для биоинформатического анализа для решения конкретной задачи. Для облегчения работы биологов исследователи из Медицинской Школы Калифорнийского Университета Сан-Диего (University of California, San Diego (UCSD) School of Medicine, США) совместно с лабораториями из Института Брода (Broad Institute of MIT and Harvard), Стэнфордского Университета (Stanford University), Университета Штата Пенсильвания (Pennsylvania State University) (все США), и Института Вайцманна (Weizmann Institute, Израиль) разработали ресурс GenomeSpace – облачную платформу, объединяющую более 20 пакетов биоинформатических программ и ресурсов для геномного анализа данных.
Команда GenomeSpace разрабатывает так называемые шаблоны – готовые наборы последовательностей действий – для предоставления возможности исследователям, не являющимся программистами, интерпретировать получаемые геномные данные. Работа описана в публикации журнала Nature Methods.
«Новые технологии секвенирования могут выдавать значительно больше данных, чем десять нет назад, что требует соответственно гораздо более мощного анализа, – говорит Джилл Мезиров (Jill Mesirov), доктор философии, заместитель ректора по вычислительным наукам о здоровье и профессор медицины Медицинской Школы UCSD и Онкологического Центра Мурс (Moores Cancer Center), – Проблема в том, что лишь небольшая доля биомедицинского исследовательского сообщества владеет необходимыми методами или наборами методов для решения научных задач и знает лучшие способы применения имеющихся способов анализа своих данных».
До GenomeSpace исследователям, особенно тем из них, кто не владеет навыками программирования, было очень сложно совместить имеющиеся инструменты для биоинформатического анализа для необходимой работы. Пользователям было необходимо уметь писать короткие компьютерные программы для того, чтобы перенести или трансформировать данные между платформами. Теперь GenomeSpace делает это без усилий с помощью удобного интерфейса, объединяющего популярные инструменты для анализа геномных данных, такие как Cytoscape, Galaxy, GenePattern и Integrative Genomics Viewer (IGV). Некоторые из этих ресурсов уже являются агрегаторами инструментов, таким образом, обращаясь к ним, GenomeSpace обеспечивает доступ к сотням методов биоинформационного анализа.
Более того, GenomeSpace не просто оставляет пользователей наедине с данными для определения наилучших инструментов для решения конкретных исследовательских задач. Этот сайт также предоставляет шаблоны – простые примеры последовательностей действий, демонстрирующих ряд инструментов, которые следует использовать для получения информации из имеющихся необработанных данных. В настоящее время GenomeSpace предоставляет 13 таких шаблонов. Разработчики платформы приглашают исследовательское сообщество сделать вклад в виде своих собственных шаблонов.
«Ни одна отдельная лаборатория не может разработать все возможные шаблоны, поэтому краудсорсинг (сбор информации от пользователей) поможет сделать GenomeSpace еще более полезной для непрограммирующих исследователей», – говорит Майкл Райх (Michael Reich) из Медицинской Школы UCSD, руководитель команды разработчиков GenomeSpace.
Как работают шаблоны GenomeSpace? Например, исследователю интересно, есть ли в стволовых лейкемических клетках набор генов, экспрессирующихся отлично от нормальных клеток-предшественниц крови. Ученому нужно точнее разобраться в биологических механизмах, лежащих в основе нарушенной экспрессии генов, но непонятно, с чего начать. С помощью GenomeSpace исследователь может просто загрузить данные об экспрессии генов и другую информацию (составляющие), касающуюся двух типов клеток, и следовать шаблону GenomeSpace, созданному специально для такого типа научных задач.
В данном случае шаблон направляет исследователя в анализе составляющих посредством двух инструментов, доступных в GenomeSpace:
1) GenePattern находит список из 50 генов, экспрессирующихся различным образом в двух типах клеток;
2) Cytoscape выявляет сетевые взаимодействия белков, ассоциированных с этими генами, таким образом, указывая на роли, которые выполняют в организме опухолеспецифичные гены или гены нормального состояния.
Информация, представленная в итоге GenomeSpace, поможет исследователям лучше понять механизмы развития лейкоза и выявить возможные мишени для новых лекарственных препаратов, считает Райх.
«Наш ресурс шаблонов был смоделирован на основе классического руководства Тома Маниатиса (Tom Maniatis) «Молекулярное клонирование: руководство для лаборатории». Мы надеемся, что сочетание наших собственных разработок и краудсорсинга позволит расширить ресурс и увеличить его охват, – говорит Мезиров, – Нашей долгосрочной целью является перевод описательных последовательностей действий в более динамичные интерактивные интерфейсы, сделав их еще проще для работы».
По материалам University of California, San Diego Health Sciences
Оригинальная статья:
Kun Qu, Sara Garamszegi, Felix Wu, Helga Thorvaldsdottir, Ted Liefeld, Marco Ocana, Diego Borges-Rivera, Nathalie Pochet, James T Robinson, Barry Demchak, Tim Hull, Gil Ben-Artzi, Daniel Blankenberg, Galt P Barber, Brian T Lee, Robert M Kuhn, Anton Nekrutenko, Eran Segal, Trey Ideker, Michael Reich, Aviv Regev, Howard Y Chang, Jill P Mesirov. Integrative genomic analysis by interoperation of bioinformatics tools in GenomeSpace. Nature Methods, 2016; DOI: 10.1038/nmeth.3732