Рефераты. Продукты рекомбинации: характеристика и манипулирование

. Хранение информации о первичной структуре

Для ввода и хранения данных о последовательностях и последующего поиска, проводимого исследователем вручную или с помощью специальной аналитической программы, используются стандартные процедуры редактирования. Большинство этих процедур предусматривают также возможность коррекции хранящейся информации. Ввод данных часто осуществляют путем типирования последовательности в компьютерном терминале после прочтения и регистрации данных секвенирующего геля. Однако имеются также программы для прямого ввода исходных данных. В принципе такие программы позволяют свести к минимуму ошибки, допускаемые при неправильном считывании гелей или неточной регистрации данных. Существует два подхода к такой автоматизации. В первом случае детектор автоматически сканирует радиоавтографы и передает данные непосредственно в компьютер. Во втором данные автоматически регистрируются от сенсора, управляемого вручную. При втором подходе исследователь является арбитром при любых затруднениях.

б. Структурный анализ

Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство программ позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов. Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз. В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отношении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также программы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эндонуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз.

Имеющиеся программы осуществляют также поиск характерных особенностей последовательностей, включая прямые и обратные повторы. Выявляются не только полностью совпадающие сегменты, но и сегменты с той или иной степенью несовпадения; для этого допускаются определенные отклонения параметров, заложенных в программу, от фиксированного значения. В примере перечислены все повторы длиной не менее шести пар оснований и гомологичные не менее чем на 75%. Предполагается, что максимальный размер образующихся петель равен двум основаниям.

Можно получить данные о гомологии или частичной гомологии различных последовательностей. Эти данные могут касаться структуры одного и того же гена у двух разных организмов или родственных генов одного организма. Такой сравнительный анализ широко используется при изучении эволюции на молекулярном уровне. Для сравнения двух последовательностей между собой или одной последовательности с группой других последовательностей разработаны специальные алгоритмы. Может использоваться описанный ранее вероятностный анализ. По результатам сравнения информации о последовательностях, полученной в разных лабораториях, был создан центральный банк данных, из которого всегда можно затребовать информацию о тех или иных последовательностях. К 1989 г. в банках имелась информация о последовательностях более 20 миллионов пар оснований, представляющая данные о многих генах и организмах.

Помимо этого общего применения, обнаружение сходства различных последовательностей является составной частью секвенирования очень длинных последовательностей с помощью дидезокси-метода, объединенного с клонированием в фаге М13. Используя компьютер для обнаружения перекрывающихся последовательностей, мы не только делаем работу менее утомительной, но и можем быстро решить, следует ли нам пытаться получить дополнительные данные.

Вторичная структура. Разработаны программы, позволяющие предсказать стабильную внутримолекулярную вторичную структуру одноцепочечных РНК или ДНК. Они позволяют, например, построить модель укладки цепи тРНК и рРНК, и многие из таких моделей получили экспериментальное подтверждение в опытах с использованием нуклеаз, специфичных к одноцепочечным участкам. Расчеты основаны на предположениях о вероятности образования определенных пар оснований, на термодинамических свойствах разных пар оснований и данных о стабильности спирали.

в. Биологическое значение

С помощью компьютерных программ можно перевести информацию с языка нуклеотидов на язык аминокислот в соответствии с правилами генетического кода. При этом указываются все три возможные рамки считывания и стоп-кодоны трансляции. В тех случаях, когда аминокислотная последовательность кодируемого полипептида известна, идентифицировать правильную рамку считывания не составляет труда. В противном случае правильную рамку можно выбрать, исходя из ее длины. Рамки, в которых часто встречаются стоп-кодоны, вряд ли могут считаться правильными. Показаны часть генома SV40, кодирующая участок вблизи г\ГИ2-конца малого и большого Т-антигенов, и полученные с помощью компьютера аминокислотные последовательности для всех трех рамок считывания. Правильной является третья рамка. Можно также рассчитать частоту, с которой встречается каждый кодон, и таким образом выявить предпочтительные кодоны для определенных аминокислот. Обращение этой процедуры позволяет воссоздать возможные нуклеотидные последовательности, исходя из известной аминокислотной последовательности полипептида, хотя эта задача не имеет однозначного решения вследствие вырожденности генетического кода. Центральный банк данных содержит информацию об аминокислотных последовательностях всех проанализированных полипептидов, что позволяет сравнивать последовательности изучаемого и известных белков.

С помощью компьютеров можно вести поиск специфических нуклеотидных последовательностей, например промоторов или участков связывания с рибосомами. Они позволяют также обнаружить последовательности со специфическими свойствами. Например, наличие сходных последовательностей в разных неродственных во всех других отношениях генах или вблизи них наводит на мысль об их возможной регуляторной роли. Точно так же присутствие гомологичных последовательностей в кодирующих областях различных генов может свидетельствовать об общности эволюционного происхождения этих генов. Данный вопрос детально рассмотрен в ч. III книги. Однако важно осознавать, что статистический анализ еще не является достаточным для того, чтобы делать вывод о биологической роли той или иной последовательности. Об этом можно говорить только после проведения независимого биологического исследования.

Определение положения клонированных сегментов в геномах

В идеале установление положения клонированного сегмента ДНК означает определение фланкирующих его последовательностей и того хромосомного сайта, по которому этот сегмент был включен в хромосому. Конечная цель такого картирования состоит в полном описании структуры хромосомы.

а. Молекулярная локализация

Характеристика клонированного сегмента. Прежде всего необходимо доказать, что клонированный сегмент действительно является репликой определенного геномного сегмента. Существует ли в геноме гомологичный сегмент с точно так же расположенными сайтами для рестриктирующих эндонуклеаз? Этот вопрос имеет важное значение, поскольку во время репликации в системе хозяин-вектор иногда происходит клонирование случайных последовательностей, образовавшихся в результате рекомбинаций, делеций или мутаций. Основной подход состоит в использовании клонированной ДНК в качестве зонда для анализа продуктов эндонуклеазного расщепления суммарной геномной ДНК, из которой произошел данный клонированный сегмент. Такой подход аналогичен описанному в разд.6.1. б с тем отличием, что зондом в данном случае является клонированная вставка, меченная 32Р. В эксперименте Б, клонированный зонд представлял собой субклонированный сегмент овальбуминового гена; материал, подвергнутый электрофорезу, - это coRI-гидролизат ДНК курицы. С зондом гибридизовался материал только одной полосы, представляющий собой фрагменты длиной 2,35 т.п. н. Этот эксперимент показывает, что 1) клонированная вставка в самом деле является фрагментом ДНК курицы;

2) в геноме гибридизующийся сегмент расположен между двумя EcoRI-сайтами, находящимися друг от друга на расстоянии 2,35 т.п. н.;

3) ни один из фрагментов любого другого размера не гибридизуется с зондом. Таким образом, клонированный фрагмент длиной 2,35 т.п. н., по-видимому, представляет собой истинную геномную последовательность и два аллеля в диплоиде являются идентичными, поскольку локализация этих EcoRI-сайтов совпадает.

Еще одна последовательность овальбуминового гена обнаружена в EcoRI-фрагменте длиной 1,8 т.п. н. После того как он был клонирован и использован в качестве зонда для анализа EcoRI-гидролизата ДНК курицы, были обнаружены три гибридизующихся фрагмента длиной 1,8; 1,3; 0,5 т.п. н. соответственно. Эти данные свидетельствуют о неидентичности двух аллельных овальбуминовых генов. Один из них содержит дополнительный EcoRI-сайт, разделяющий фрагмент длиной 1,8 т.п. н. на две части. Интересно, что столь простая процедура лежит в основе генетического анализа. Наследование двух или более аллелей легко прослеживается с помощью эндонуклеазного расщепления, электрофореза, ДНК-блоттинга и гибридизации между соответствующим зондом и ДНК, выделенной из разных источников. Единственным требованием является наличие полиморфных эндонуклеазных сайтов в аллелях любого гена или сегмента ДНК. Для проведения таких экспериментов достаточное количество ДНК можно получить из очень небольшого кусочка ткани или из нескольких миллилитров крови, поэтому метод может использоваться для анализа ДНК большинства видов, в том числе и человека.

Построение карты молекулы. Имея сравнительно короткие сегменты молекулы ДНК, такие, например, как ранее описанный субклонированный фрагмент длиной 2,35 т.п. н., можно построить детальную карту молекулы вплоть до установления ее нуклеотидной последовательности. Более длинные клонированные последовательности, подобные тем, которые присутствуют в Х-векторах или космидах, часто содержат несколько генов, а также другие сегменты ДНК, и могут использоваться для расширения карты. Так, субклонированный фрагмент овальбуминового гена длиной 2,35 т.п. н. служил зондом для поиска гомологичных последовательностей в космидной библиотеке, сконструированной из геномной ДНК курицы. Были отобраны две космиды с перекрывающимися последовательностями только в области зонда; вместе они составляли участок генома длиной 46 т.п. н., из которых 7,7 т.п. н. принадлежали самому гену овальбумина. Область, содержащая овальбуминовый ген, была идентифицирована благодаря образованию гетеродуплекса с овальбуминовой кДНК. Неожиданно обнаружилось, что два других участка сегмента длиной 46 т.п. н. также гибридизуются с овальбуминовой кДНК, хотя и в меньшей степени. При отжиге РНК из яйцевода курицы с космидами эти два участка гибридизовались также с двумя другими мРНК, отличными от овальбуминовой. Было высказано предположение, что в сегменте длиной 46 т.п. н. локализованы еще два гена, последовательность которых сходна с последовательностью гена овальбумина. Данное предположение получило подтверждение после проведения рестрикционного и гетеродуплексного анализа, а также после определения нуклеотидной последовательности. Эти два гена, обозначенные как X и Y, транскрибируются, как и овальбуминовый ген, в присутствии стероидных гормонов.

Методы, использующиеся при картировании овальбуминового гена и генов X и Y, лежат в основе широко распространенного подхода к построению детальных генетических карт, получившего название прогулки по хромосоме. Уникальный сегмент ДНК, примыкающий к одному из концов клонированного фрагмента, очищают и используют для зондирования библиотеки геномной ДНК. Одни гибридизующиеся клоны полностью перекрываются с исходным клонированным сегментом, другие же включают новые сегменты, в результате чего карта расширяется. При повторении этой процедуры совершается "прогулка" на большее расстояние. Данный метод не очень удобен для картирования тех геномов, которые содержат большое число рассеянных повторов, поскольку в этом случае трудно очистить уникальные последовательности, используемые в качестве зондов.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.