ENCODE: что такое ген? Эволюция понятия и новое определение гена (2)

05.09.200757930

Начало статьи: История гена с 1860 года до программы ENCODE


Проблемные аспекты в современном определении гена


Дополнительные данные о нерешенных проблемах концепции гена, а также определения некоторых терминов см. в конце этого раздела.


1. Регуляция работы генов


Впервые парадигму механизма регуляции гена предложили Жакоб и Моно (Jacob & Monod 1961), изучавшие lac-оперон бактерии Escherichia coli. Согласно ей, оперон состоит из участка ДНК, включающего смежные последовательности: промоторную последовательность, связавшись с которой РНК-полимераза (фермент, синтезирующий РНК по ДНК) начинает транскрипцию, операторную последовательность, с помощью которой, собственно, и осуществляется включение или выключение экспрессии примыкающих к ней структурных (кодирующих белки) генов в зависимости от наличия или отсутствия регулирующего белка – репрессора или активатора транскрипции, и сами регулируемые структурные гены. Позже обнаружили другие последовательности, способные влиять на каждый аспект функционирования гена – от транскрипции до деградации мРНК и посттрансляционной модификации (добавления новых функциональных групп или химического изменения части аминокислот новосинтезированного белка для придания ему предназначенной функции). Такие регионы могут находиться как внутри кодирующей последовательности, так и по обе стороны от нее, и в случаях с энхансерами (усилителями транскрипции) – очень далеко от кодирующей последовательности. Регуляторные элементы, в особенности удаленные (энхансеры), ставят под сомнение концепцию гена как компактного генетического локуса.


2. Перекрывающиеся и сплайсируемые гены


Перекрывающиеся гены


Секвенирование генов, мРНК и, в конечном итоге, целых геномов высветило тот факт, что простая оперонная модель применима только к прокариотам и их фагам. Эукариоты отличаются от прокариот, кроме всего прочего, организацией генов и способом передачи генетической информации. Модель, в которой гены представляют собой не перекрывающиеся непрерывные наследственные единицы, оказалась неверной, как выяснилось при картировании кодирующих последовательностей генов (определения «адреса» гена в геноме). Выяснилось, что гены могут перекрываться – т.е. разделять одну и туже последовательность ДНК в разных рамках считывания (которое может начинаться с каждого из трех нуклеотидов в триплете, что приводит к образованию разных белков), а гены на комплементарных нитях ДНК могут обладать общим участком.


Прерывистая структура генов предполагает возможность расположения одного гена внутри интрона другого гена или перекрывания одного гена с другим на одной нити ДНК, только с разными экзонами и разными регулирующими элементами.


Сплайсинг


Явление сплайсинга – посттранскрипционного процесса удаления интронов и соединения экзонов, превращающего молекулу предшественника матричной РНК (пре-мРНК) в зрелую мРНК – открыли в 1977 году (Berget et al. 1977, Chow et al. 1977, Gelinas and Roberts 1977). В свете новых знаний под термином «ген» подразумевалась не просто единица наследственности, а серия экзонов, кодирующих дискретные домены белка, разделенные длинными некодирующими последовательностями – интронами.


При помощи альтернативного сплайсинга (при котором экзоны могут по-разному компоноваться в мРНК) один ген может кодировать несколько различных транскриптов мРНК и, соответственно, белков. Это открытие значительно усложнило концепцию гена. По определению Celera Genomics (коммерческая компания, подразделение фирмы Applera Corporation, занимающаяся секвенированием), ген – это «локус котранскрибируемых экзонов» (Venter et al. 2001). Интернет-портал Ensembl’s Gene Sweepstake определял ген как «набор связанных транскриптов», где «связанные» означало, что у всех транскриптов есть хотя бы часть общего экзона. В последующем определении подразумевалось, что группа транскриптов могла разделять набор экзонов в различных комбинациях, не обладая при этом каким-то одним общим экзоном (т.е. у части транскриптов данный экзон может присутствовать, а у других транскриптов того же гена его может не быть).


Транс-сплайсинг


Феномен транс-сплайсинга – ковалентного соединения (лигирования) двух разных молекул мРНК – еще более усугубил путаницу в понятии гена (Blumenthal 2005). Ученые обнаружили транскрипты, объединяющие до сплайсинга продукты одного гена или генов с противоположных нитей ДНК, или даже с разных хромосом. Очевидно, что классическая концепция гена как «локуса» не применима к тем генным продуктам, которые собраны из последовательностей ДНК, разбросанных по геному.


Недавно обнаружили еще один феномен, когда два последовательных гена транскрибируются в одну РНК, т.н. dubbed tandem chimerism (Akiva et al. 2006, Parra et al. 2006). Происходящая после сплайсинга трансляция таких РНК приводит к образованию нового белка (т.н. fused protein), сшитого из обоих первоначальных белков.


3. Паразитирующие и мобильные гены


Концепция эгоистичного или паразитирующего гена, согласно которой единицу эволюции представляет не организм, а ген, принадлежит Ричарду Докинсу (Dawkins 1976). Согласно ей, организмы представляют собой всего лишь орудия, которые гены используют для воспроизводства самих себя.


Термин «паразитирующий» применим к транспозонам – мобильным элементам генома, единственной функцией которых является репликация (воспроизведение) самих себя. Транспозоны перемещаются путем копирования себя, эксцизии (вырезания) и рекомбинации (обмена подобными последовательностями между двумя молекулами ДНК) или обратной транскрипции (образования двунитевой ДНК по матрице РНК). Впервые транспозоны обнаружили в 1930х у кукурузы, а позже нашли практически у всех живых существ, включая человека (McClintock 1948). Транспозоны изменили представление о гене, показав, что ген не зафиксирован на своем месте, а может перемещаться по геному.


4. Загадка «мусорной» ДНК


Концепция гена как «открытой рамки считывания», существовавшая с 1980х годов, позволила обнаружить огромное количество не-генных элементов в эукариотических геномах и в особенности в геноме человека. В отсутствие знаний о назначении этих участков предположили, что они не имеют функции, и назвали их "junk DNA" – «никчемной, мусорной ДНК» (Ohno 1972). Тот факт, что в геноме человека только 1,2% оснований ДНК входят в состав экзонов, подтвердил существование огромного количества ДНК, не входящей в состав генов (Lander et al. 2001, Venter et al. 2001). Пробные эксперименты по функциональной геномике (задачей которой является выяснение функций генов, непрерывно выявляемых в ходе геномных проектов, и определение взаимодействий между их продуктами) на 21 и 22 хромосомах показали, что значительные количества ранее считавшейся «мусорной» ДНК транскрибируются (Kapranov et al. 2002, Rinn et al. 2003). Более того, при сравнении геномов человека, собаки, мыши и других позвоночных выяснилось, что они во многом консервативны (подобны) (Waterston et al. 2002, Lindblad-Toh et al. 2005).


Таблица 1. Феномены, усложняющие концепцию гена































































Феномен Описание Проблема
Локализация гена и структура
Интронные гены Ген находится внутри интрона другого гена (Henikoff et al. 1986) Два гена в одном локусе
Гены с перекрывающимися рамками считывания Один участок ДНК может кодировать два разных белка в двух рамках считывания (Conteras et al. 1977) Нет однозначного соответствия между последовательностями ДНК и белка
Энхансеры, сайленсеры1 Отдаленные регуляторные элементы (Spilianakis et al. 2005) Участки ДНК, определяющие экспрессию гена, могут быть значительно удалены друг от друга
Структурное разнообразие
Мобильные элементы От поколения к поколению генетические элементы обнаруживают в различных участках генома (McClintock 1948) Генетический элемент может не иметь постоянной локализации
Перестановки генов 2 (реорганизация ДНК на уровне хромосом) и структурные вариации Перестановки ДНК или сплайсинг на уровне ДНК в соматических клетках приводит к образованию альтернативных продуктов гена (Early et al. 1980) Структура гена носит ненаследственный характер, т.е. структура может различаться между клетками (тканями) и у разных индивидуумов
Варианты копийности Число копий генов или регуляторных элементов может различаться между индивидуумами (Iafrate et al. 2004; Sebat et al. 2004; Tuzun et al. 2005) Генетические элементы могут различаться по количеству
Эпигенетика3 и структура хромосом
Эпигенетические модификации, импринтинг4 Наследственная информация может кодироваться не только молекулой ДНК (Dobrovic et al. 1988); экспрессия одной из двух копий гена зависит от того, от кого она унаследована – от матери или от отца (Sager and Kitchin 1975)


Фенотип определяется не только генотипом
Эффект структуры хроматина (хроматин – ДНК вкупе с РНК и белками, упаковывающими ДНК в клеточном ядре) Структура хроматина влияет на экспрессию генов, при этом она свободно связана с определенными последовательностями ДНК (Paul 1972) Экспрессия генов зависит от упаковки ДНК. Одной последовательности ДНК недостаточно для предсказания продукта гена
Посттранскрипционные события
Альтернативный сплайсинг РНК С одного транскрипта могут получиться несколько мРНК, кодирующих разные белки (Berget et al. 1977; Gelinas and Roberts 1977) Один генный локус может иметь несколько продуктов
Продукты альтернативного сплайсинга с альтернативными рамками считывания Альтернативные рамки считывания гена опухолевого супрессора INK4a кодируют разные белки (Quuelle et al. 1995) Два продукта альтернативного сплайсинга одной пре-мРНК кодируют два белка без общих последовательностей
Транс-сплайсинг РНК, гомотипичный транс-сплайсинг Удаленные последовательности ДНК могут кодировать транскрипты, по-разному соединяемые при дальнейшем сплайсинге (Borst 1986). В результате транс-сплайсинга двух идентичных транскриптов одного гена может получиться мРНК с повторами одного экзона (Takahara et al. 2000). Белок может быть синтезирован по мРНК, скомбинированной из нескольких транскриптов
Редактирование РНК РНК подвергается ферментативным модификациям (Eisen 1988) Информация, закодированная в ДНК, переносится в РНК нелинейно
Посттрансляционные события
Белковый сплайсинг, вирусные полипротеины Белки могут саморасщепляться (автопротеолиз) на несколько функциональных продуктов (Villa-Komaroff et al. 1975) Начало и конец белковой последовательности не определяется генетическим кодом
Белковый транс-сплайсинг Разные белки могут быть сплайсированы друг с другом даже в отсутствие транс-сплайсированных транскриптов (Handa et al. 1996) Начало и конец белковой последовательности не определяется генетическим кодом
Белковые модификации Зачастую, для того, чтобы белок стал функциональным, ему необходимо пройти ряд модификаций после трансляции (Wold 1981) Информация, закодированная в ДНК, переносится в белковую последовательность нелинейно
Псевдогены и ретрогены
Ретрогены Ретроген образуется путем обратной транскрипции по мРНК (синтез ДНК по РНК) с последующей вставкой ДНКового продукта в геном (Vanin et al. 1980) Поток информации «от РНК – к ДНК»
Транскрибируемые псевдогены 5 Псевдогены транскрибируются (Zheng et al.2005, 2007) Биохимическая активность предположительно «мертвых» элементов

1 Сайленсер – последовательность ДНК, при связывании с которой репрессор (белок, препятствующий посадке РНК-полимеразы на сайт начала транскрипции) предотвращает синтез РНК.


2 Перестановки генов (или участков ДНК) часто образуются в результате сайт-специфической рекомбинации – обмена нитями ДНК между ее гомологичными сегментами путем связывания специфических ферментов (сайт-специфических рекомбиназ) со своими сайтами (короткими участками ДНК), в которых они расщепляют нити ДНК, обменивают их и сшивают. Примером перестановки фрагментов генов может служить V(D)J рекомбинация, в ходе которой перетасовываются случайным образом выбранные сегменты генов, кодирующих белки иммунной системы (иммуноглобулины и Т-клеточные рецепторы). За счет этого достигается разнообразие белков иммунной системы, необходимых для узнавания чужеродных клеток и молекул, попадающих в организм.


3 Эпигенетика изучает модификации ДНК и хроматина, стабильно поддерживаемые в процессе деления клеток. Они позволяют клеткам различных тканей организма стабильно сохранять отличительные характеристики во время клеточной дифференцировки, несмотря на идентичный геномный материал.


4 Импринтинг – феномен экспрессии только одного из двух аллелей: отцовского или материнского, т.е. наблюдается моноаллельная экспрессия генов. Второй аллель, вследствие наличия на нем некого отпечатка (например, модификации), импринтирован (выключен или подавлен) и не экспрессируется.


5 Псевдогены – это нефункциональные производные известных генов, кодирующих белки или РНК, которые потеряли свою кодирующую функцию.


Перевод: Дарья Червякова,
Интернет-журнал «Коммерческая биотехнология» http://www.cbio.ru/


Продолжение: Активность генома: что открыл ENCODE


Ваш комментарий:
Только зарегистрированные пользователи могут оставлять комментарии. Чтобы оставить комментарий, необходимо авторизоваться.
Вернуться к списку статей