Единицы транскрипции (транскриптоны)

Синтез РНК молекулами РНК-полимераз in vivo начинается в определенных местах ДНК, называемых промоторами, и завершается на особых регуляторных последовательностях – терминаторах. Последовательности нуклеотидов ДНК, заключенные между промоторами и терминаторами, называют транскрипционными единицами, или транскриптонами. В пределах каждого транскриптона транскрибируется только одна цепь ДНК, которая получила название значащей или матричной. Термины "транскрипционная единица" или "транскриптон" по смыслу близки термину "ген", но они не всегда совпадают. Так, транскрипционные единицы прокариот, как правило, заключают в себе генетическую информацию нескольких генов и называются оперонами. Продуктами транскрипции оперонов являются полицистронные мРНК, в результате трансляции которых рибосомами образуется несколько белков. Белки, кодируемые полицистронными мРНК, обычно функционально связаны друг с другом и обеспечивают протекание какого-либо метаболического процесса, например биосинтеза определенной аминокислоты или утилизацию углеводов в качестве источника углерода. Организация генов в виде оперонов облегчает координированную регуляцию их экспрессии на уровне транскрипции. Согласованная регуляция транскрипции (и других этапов экспрессии) многих генов, не образующих одного оперона, чаще всего осуществляется специфическими белками-регуляторами, которые взаимодействуют с гомологичными регуляторными нуклеотидными последовательностями, маркирующими гены данной группы.

Промоторы эубактерий. В 1964 г. Ф. Жакобом, А. Уллманом и Ж. Моно была впервые сформулирована концепция промотора как особого регуляторного элемента в составе lac-оперона E. coli. Вскоре после этого были описаны промоторные мутации и высказано предположение, что промоторные участки оперона должны распознаваться молекулами РНК-полимеразы, а также заключать в себе сайт инициации транскрипции. В соответствии с генетическими критериями промотором может называться последовательность нуклеотидов, мутации в которой характеризуются следующими свойствами: 1) оказывают влияние на транскрипцию всех генов оперона; 2) действуют в цис-, но не транс-положении по отношению к генам, контролируемым мутантными промоторами; 3) локализуются вблизи одного из концов оперона, однако отличаются от мутаций в структурных частях генов тем, что не оказывают влияния на активность кодируемых этими генами ферментов. В соответствии с биохимическими критериями промотор представляет собой последовательность нуклеотидов, обеспечивающую базальный (но не максимальный) уровень транскрипции соответствующего транскриптона. Он является той минимальной последовательностью, которая специфически распознается холоферментом РНК-полимеразы среди случайных последовательностей нуклеотидов, что обнаруживается по образованию в определенных условиях стабильных комплексов фермент–ДНК.

Структура обобщенного минимального промотора для холофермента РНК-полимеразы (Es70) эубактерий схематически представлена на рис. I.4,б. Такие промоторы содержат две канонические последовательности: область ‑35, обычно расположенную между нуклеотидами в положениях –30 и –35, и область –10, локализованную между нуклеотидами –7 и –10 (знак "минус" указывает на то, что нуклеотиды находятся перед первым транскрибируемым нуклеотидом, которому соответствует положение +1). Обе эти последовательности специфически взаимодействуют с двумя участками полипептидной цепи s70, называемыми s4.2 и s2.4. Расстояние между обсуждаемыми последовательностями оказывает влияние на активность промотора. Длина отрезка в 17 п.о. является оптимальной. Среди других последовательностей, оказывающих влияние на активность промоторов, но не являющихся универсальными, следует упомянуть так называемый UP-элемент – АТ-богатую последовательность, центр которой находится в положении –52 у промотора P1 гена rrnB, кодирующего рРНК. С этим участком взаимодействует a-субъединица РНК-полимеразы. У нескольких других промоторов был обнаружен TG-элемент (центр – в положении –15 или –14), мутации в котором снижают активность этих промоторов.

Влияние мутаций в областях –10 и –35 на активность промотора, как правило, хорошо коррелирует с тем, насколько новая мутантная последовательность соответствует канонической. Однако в ряде случаев наблюдаются отклонения от этого правила, что позволило идентифицировать последовательности, важные для функционирования этих промоторов in vivo, с центрами в положениях –43 (область USR – upstream region), а также между нуклеотидами в положениях –1 и +20 (область DSR – downstream region). Эти последовательности не требуются для узнавания промотора РНК-полимеразой, однако облегчают процесс освобождения промотора после инициации транскрипции (см. ниже). Все описанные последовательности обеспечивают базальный уровень функционирования бактериальных промоторов. Однако активность промоторов может изменяться под действием многочисленных регуляторных факторов, взаимодействующих с другими регуляторными последовательностями, расположенными перед такими промоторами. Эти аспекты регуляции активности промоторов будут подробно рассмотрены в разделе 3.1.

Промоторы эукариот. Промоторы эубактерий были определены выше как минимальный набор последовательностей нуклеотидов, необходимых для их специфического распознавания холоферментом РНК-полимеразы и начала (инициации) синтеза РНК. Распространение этого определения на промоторы эукариот встречает трудности из-за невозможности в настоящее время исчерпывающе описать эукариотический функциональный аналог бактериального холофермента Es.

Промоторы РНК-полимеразы II. Промоторы, узнаваемые РНК-полимеразой II, содержат три различных семейства регуляторных последовательностей ДНК. Последовательности первого семейства включают так называемые кóровые, или базальные элементы промотора, расположенные вблизи точки инициации транскрипции (см. рис. I.4,б). В настоящее время известны два класса базальных элементов: TATA-последовательность, расположенная за 25–30 нуклеотидов до точки инициации (каноническая последовательность – TATAa/tAa/t), и так называемый инициатор (Inr), последовательность которого обогащена пиримидинами (каноническая последовательность – PyPyA+1NT/APyPy). В этих обозначениях строчные буквы соответствуют нуклеотидам, которые присутствуют не во всех последовательностях, Py – пиримидиновые нуклеотиды инициатора, N – любой нуклеотид. Подстрочная цифра указывает на то, что с данного нуклеотида начинается транскрипция (точка инициации транскрипции). Элементы TATA-последовательности и инициатор необходимы для сборки ДНК-белкового инициационного комплекса и распознаются основными факторами транскрипции. Промоторы РНК-полимеразы II содержат один или оба регуляторных элемента или же не имеют их вообще. При этом оба элемента могут функционировать независимо друг от друга или же в их действии наблюдается синергизм.

К двум другим классам цис-регуляторных промоторных элементов у эукариот относятся последовательности, расположенные вблизи промотора (от 50 до нескольких сотен пар оснований перед точкой инициации), а также дистальные элементы (энхансеры и сайленсеры), расстояние которых от промотора может превышать 60 т.п.о. Оба класса таких последовательностей содержат сайты связывания регуляторных белков, модулирующих транскрипцию.