Предположение о коллинеарности нуклеотидных и аминокислотных последовательностей было высказано в числе первых в дискуссии о природе генетического кода. Догадки такого рода возникли после того, как было показано, что многие мутации проявляются в замене одной-единственной аминокислоты в белках бактерий, растений или животных. Но гипотеза коллинеарности оставалась неподтвержденной до тех пор, пока не были проведены тщательные генетические и биохимические исследования хорошо охарактеризованных генно-белковых систем. Например, было показано, что относительное положение аминокислотных замен в а-субъединице триптофансинтетазы Е. coli согласуется с относительной локализацией на карте соответствующих мутаций в trpA-гене этого микроорганизма. Однако выделить и охарактеризовать мутантную ДНК в то время не удалось, поэтому нельзя было установить соответствие между нуклеотидными последовательностями и аминокислотными.
Теоретический анализ привел к предположению, что наиболее подходящей по размеру для генетической кодирующей единицы, или кодона, является последовательность из трех нуклеотидов. В основе этого вывода лежали три соображения. Во-первых, четыре нуклеотида, взятые по одному, могут кодировать только четыре разные аминокислоты. Сочетания из двух нуклеотидов могут кодировать только 42, или 16 аминокислот, а это меньше, чем те 20 аминокислот, которые, как было известно, присутствуют в белках. И только совокупности трех нуклеотидов дают 64 возможных кодона, т.е. число, более чем достаточное для кодирования 20 разных аминокислот. Генетические эксперименты, выполненные на мутантах с делециями или вставками длиной один, два или три нуклеотида в генах, кодирующих белки, позволили доказать, что наиболее подходящий размер для кодона - три нуклеотида. Более того, из этих исследований был сделан вывод, что нуклеотидная последовательность считывается расположенными один за другим триплетами с фиксированной точки. Все эти выводы наряду с данными о том, что полипептидные цепи синтезируются последовательно путем соединения аминогруппы одной аминокислоты с карбоксильной группой другой, послужили краеугольным камнем в расшифровке генетического кода.
б. Соответствие между аминокислотами и их кодонами
Одним из загадочных моментов кодирования было отсутствие структурной комплементарности между нуклеиновыми кислотами, с одной стороны, и аминокислотными цепочками - с другой. Выход из этого концептуального тупика-ответ на вопрос, как аминокислоты спариваются с соответствующими кодонами, - был найден, когда появилась идея о существовании адаптора. Согласно этой идее, аминокислоты сначала связываются с молекулами РНК, а затем такие гибриды выстраиваются вдоль мРНК, соединяясь с ней путем комплементарного спаривания нескольких оснований в адапторной молекуле РНК с соответствующим кодоном в мРНК. Адапторная гипотеза получила строгое экспериментальное подтверждение после того, как были обнаружены тРНК и ферменты, ответственные за связывание аминокислот и тРНК, и показано, что присоединенные к тРНК аминокислоты являются прямыми предшественниками при сборке полипептида.
Если тРНК - это адапторы, то каждая аминокислота должна присоединяться только к специфической тРНК, а каждая тРНК - спариваться только с одним, соответствующим ей кодоном. Правильность первого из этих положений была доказана с открытием особых ферментов - аминоацил-тРНК-синтетаз, каждый из которых связывает одну-единственную аминокислоту с одной или несколькими родственными тРНК. Эти ферменты и катализируемые ими реакции более детально будут рассмотрены в разд. 3.5.а. Здесь достаточно сказать, что связывание аминокислот с молекулами тРНК - это первый шаг в процессе расшифровки. Правильность второго положения адапторной гипотезы - о том, что тРНК сама определяет место своей аминокислоты в полипептидной цепи - была подтверждена с помощью простого эксперимента. Одна из аминокислот, будучи связанной с соответствующей тРНК, была химически превращена в другую. После включения этой модифицированной аминокислоты в белок in vitro была установлена ее локализация в белковой цепи. Оказалось, что после превращения цистеинил-тРНК в аланил-тPHK остаток аланина, связанный с тРНК, обнаруживается в тех сайтах белковой цепи, которые обычно занимает цистеин, а не в сайтах, где обычно находится аланин. Стало ясно, что именно тРНК с присоединенной к ней аминокислотой, а не сама аминокислота определяет, с каким кодоном должно произойти спаривание.
в. Расшифровка генетического кода
Предпосылками для расшифровки кода послужили два открытия. Во-первых, было установлено, что мРНК - это информационный посредник между генами и белками. Во-вторых, обнаружилось, что мРНК, введенная в бактериальные экстракты, транслируется с образованием соответствующих белков. Прорыв в этой области произошел, когда с помощью экстрактов из клеток Е. coli была осуществлена трансляция синтетических РНК-полиуридилата, полиаденилата и полицитидилата - с образованием полифенилаланина, полилизина и полипролина соответственно. Это привело к заключению, что триплеты, состоящие только из U, А и С, кодируют соответственно фенилаланин, лизин и пролин. Затем были проделаны эксперименты с применением смешанных полимеров с варьирующим соотношением двух и трех нуклеотидов; в результате был определен состав кодонов. Однако эти данные позволили установить лишь нуклеотидный состав кодонов, но не порядок следования нуклеотидов в них. Все кодоны были в конце концов идентифицированы при помощи следующих двух экспериментов. В экспериментах первого типа сравнивали аминокислотную последовательность полипептидов, полученных in vitro с использованием синтетических мРНК, содержащих определенные повторы из двух или трех нуклеотидов. В экспериментах другого типа определяли, какая именно из аминоацил-тРНК связывается с рибосомами в присутствии каждого из возможных тринуклеотидов. Эти эксперименты позволили составить непротиворечивый словарь, в котором 61 трехнуклеотидный кодон соответствует 20 аминокислотам, а три кодона - окончанию кодирующей последовательности. В коде заложена некая неоднозначность, которая связана с точкой начала трансляции, а не с соответствием кодон-аминокислота. Эта неоднозначность обусловлена наличием альтернативных наборов триплетов, или рамок считывания, для любой полинуклеотидной последовательности. Большинство прокариотических генов транслируется при одной непрерывной рамке считывания; при альтернативных рамках на каждые 20 нуклеотидов приходится в среднем по одному терминирующему кодону.
В экспериментах по расшифровке кода, описанных выше, синтетические полинуклеотиды транслировались в условиях, не требующих точной инициации. Однако in vivo и в соответствующих условиях in vitro инициация происходит только с правильной рамкой считывания. Однозначность прочтения белок-кодирующей последовательности обеспечивается тем, что трансляция мРНК начинается только со специфического триплета - AUG, и далее расшифровывается каждый последующий триплет в направлении от 5'-конца молекулы мРНК к 3'-концу. Позднее был разработан метод быстрого секвенирования нуклеиновых кислот и белков, который позволил проверить систему кодирования непосредственно, путем сравнения последовательностей ДНК, РНК и кодируемых ими белков. Сравнительные исследования подтвердили также и то, что кодирующие последовательности действительно читаются от 5'- к 3'-концу мРНК.
г. Избыточность генетического кода
Удивительной особенностью кода оказалось то, что все аминокислоты, кроме двух, кодируются более чем одним кодоном. Эти две составляющие исключение аминокислоты, метионин и триптофан, встречаются в белках достаточно редко. Наибольшее число кодонов имеют серин и лейцин, которыми белки изобилуют. Такие достаточно часто встречающиеся аминокислоты, как цистеин, аланин, глицин, валин, а также дикарбоновые кислоты и их амиды, кодируются двумя-четырьмя кодонами каждая. Из-за такой избыточности разные нуклеотидные последовательности могут при трансляции давать одну и ту же аминокислотную последовательность. Итак, если мы знаем нуклеотидную последовательность, то можем однозначно определить последовательность белка, обратное же проделать невозможно.
Сигналом для остановки синтеза белка служит любой из трех кодонов: UAA, UAG или UGA. Кодон AUG выполняет двойную функцию: он детерминирует аминокислоту метионин и в определенных последовательностях обозначает начало сегмента, кодирующего белок.
Избыточность кода имеет одну интересную особенность: наибольшее число вариаций в кодонах, детерминирующих данную аминокислоту, приходится на третью позицию. Например, аминокислоты глицин, валин, пролин, аланин и треонин кодируются четырьмя кодонами каждая, и в каждом случае эти четыре кодона различаются только нуклеотидами в третьей позиции. Если какая-то аминокислота кодируется двумя кодонами, то последние различаются только пуринами или пиримидинами, находящимися в третьей позиции. И только кодоны для лейцина, серина и аргинина различаются нуклеотидами, находящимися в первой, второй или обеих позициях. Поэтому мутации, приводящие к заменам нуклеотидов в третьей позиции, часто не сопровождаются изменением аминокислотной последовательности. Кроме того, код устроен так, что при замене нуклеотидов даже в первой или второй позиции некоторых кодонов в полипептид включается структурно родственная аминокислота, сводя тем самым к минимуму нарушения во вторичной структуре белка. Кодоны для гидрофобных аминокислот, например фенилаланина, лейцина, изолейцина и валина, различаются только одним нуклеотидом. Аналогичная ситуация наблюдается и для кодонов серина и треонина или аланина и глицина.
д. Универсальность генетического кода
По-видимому, все прокариоты, а также большинство эукариот пользуются одним и тем же словарем кодонов независимо от того, представлен ли их геном ДНК или РНК. В этом смысле нередко говорят, что код универсален. Тем не менее частота использования кодонов-синонимов варьирует как на уровне организмов, так и на уровне мРНК. Если действительно какие-то кодоны используются в большинстве кодирующих белки последовательностей чаще, чем другие, то это должно найти отражение в относительном содержании в клетке различных тРНК, расшифровывающих кодоны-синонимы. Так, если кодон AGA встречается в мРНК какого-либо организма сравнительно редко, то и содержание тРНК, расшифровывающей AGA, должно быть невелико. В некоторых случаях выбор кодонов для конкретной кодирующей последовательности определяется задачами, не связанными с их трансляцией. Например, определенное взаимное расположение кодонов может благоприятствовать образованию специфической вторичной структуры мРНК; таким образом, присутствие конкретных кодонов может влиять на готовность мРНК к трансляции и тем самым играть регуляторную роль. В некоторых случаях экспериментальная замена существующих кодонов их синонимами приводит к изменению стабильности мРНК при полном сохранении ее способности к правильной трансляции.
Редкие исключения в стандартном словаре кодо-нов обнаружены у инфузорий и в митохондриальных генах. Например, в митохондриях млекопитающих кодон UGA читается как триптофан и митохондриальная ДНК кодирует тРНК, чей антикодон UCA спаривается с UGA почти так же прочно, как с нормальным триптофановым кодоном UGG. В митохондриях млекопитающих кодоны AGA и AGG прочитываются как сигналы терминации. AUU, AUC, AUA и AUG служат инициирующими кодонами, a AUA кодирует метионин вместо изолейцина. В митохондриях дрожжей триплеты CUU, CUC, CUA и CUG кодируют треонин, а не лейцин.
5. Аппарат трансляции
Страницы: 1, 2, 3, 4, 5, 6, 7