Скачать

Продукты рекомбинации: характеристика и манипулирование

Продукты рекомбинации: характеристика и манипулирование

После отбора клонированных рекомбинантных молекул нужно охарактеризовать содержащуюся в них вставку. Для этого необходимо ответить на несколько вопросов. Прежде всего - действительно ли рекомбинантная молекула содержит нужный сегмент ДНК? Далее - включился ли сегмент целиком или только частично? Соответствует ли он во всех деталях геномной ДНК, из которой происходит? Является ли нужная последовательность функциональной? Мы рассмотрим разные подходы к характеризации клонированных фрагментов ДНК. Прежде всего нужно очистить рекомбинантную ДНК от ДНК клеток хозяина, РНК и белков. Эта процедура довольно проста и включает экстракцию, физическое разделение компонентов и ферментативное расщепление РНК и белков. Так, плазмидную ДНК можно отделить от геномной благодаря ее малому размеру и кольцевой структуре. Фаговую ДНК можно получить в свободном от клеточной ДНК виде путем очистки фаговых частиц и последующего выделения из них ДНК.

макроструктура клонированной вставки

Для определения макроструктуры вставки сначала устанавливают ее размер и положение сайтов для рестриктирующих эндонуклеаз. Поскольку клонированные фрагменты геномной ДНК часто бывают длиннее или короче, чем интересующая нас область, необходимо также определить положение и длину нужного сегмента внутри вставки.

а. Размер вставки

Размер векторной молекулы обычно бывает известен, поэтому размер вставки можно оценить, зная полную длину рекомбинантной молекулы и предположив, что никакого делетирования во время клонирования не произошло. Размер многих рекомбинантных молекул можно определить с помощью гель-электрофореза. Чтобы получить точные данные, кольцевые рекомбинантные молекулы превращают в линейные, поскольку электрофоретическая подвижность кольцевых структур зависит от степени их сверхспиральности. Стандартные электрофоретические методы непригодны для тестирования молекул, длина которых превышает 15 т.п. н, поскольку крупные молекулы мигрируют в геле слишком медленно. Поэтому размер многих рекомбинантных молекул не поддается прямому определению с помощью электрофореза, если только не используется импульсный электрофорез. Альтернативный способ оценки размера рекомбинантных молекул состоит в измерении их длины с помощью электронной микроскопии. Здесь тоже очень важны стандартные размеры, поскольку число пар оснований в сегменте определенной длины на электронной микрофотографии может зависеть от конфигурации молекулы и способа приготовления препарата.

Другой подход к определению размера вставки состоит в обращении тех реакций, которые использовались при конструировании рекомбинантных молекул, т.е. в вырезании вставок с помощью соответствующих эндонуклеаз рестрикции. Размер линейной вставки определяют с помощью гель-электрофореза. Поскольку карта сайтов для эндонуклеаз рестрикции в векторной молекуле обычно бывает известна, идентифицировать встроенный фрагмент довольно легко. Если при лигировании произошла элиминация эндонуклеазных сайтов на концах вставки, можно использовать альтернативную процедуру: разрезать векторную молекулу по сайтам, находящимся в участках, которые фланкируют вставку; в этом случае вставка будет вырезана вместе с сегментами вектора известных размеров. Иногда ситуация осложняется тем, что сама вставка содержит сайты узнавания для используемой эндонуклеазы. В таком случае сумма размеров всех фрагментов, образующихся из вставки, даст ее общую длину. Если вставка слишком велика, то ее разрезание и суммирование могут оказаться даже необходимыми для более точного определения длины.

б. Картирование сайтов для рестриктирующих эндонуклеаз

В тех случаях, когда вектор имеет небольшие размеры и не слишком сложен, положение сайтов иногда можно определить непосредственно в самой рекомбинантной молекуле. Однако часто оказывается необходимым сначала вырезать вставку и очистить ее от векторных сегментов.

в. Субклонирование

Длинные клонированные вставки, входящие в состав Х - или космидного вектора, часто бывают весьма неудобными для манипулирования. Поэтому после построения частичной рестрикционной карты вставку можно разделить на более мелкие фрагменты путем субклонирования. В принципе субклонирование не отличается от других методов создания рекомбинантных ДНК, просто в этих случаях в качестве исходного генома используют рекомбинантный клон. Для субклонирования обычно применяют рестриктирующие эндонуклеазы, сайты узнавания которых состоят из четырех пар оснований, поскольку они способны разрезать ДНК во многих местах.

г. Определение положения интересующего нас сегмента во вставке

Для определения положения сегментов в небольших рекомбинантных геномах используются те же подходы, что и при нахождении специфических сегментов в больших геномах до клонирования. После построения рестрикционной карты вставки установить точную локализацию нужного сегмента не составляет труда. Для этого нужен только подходящий меченый зонд, аналогичный ДНК - или РНК-зонду, используемому для отбора клона в начале клонирования.

Овальбумин-это белок, состоящий из одной полипептидной цепи; он синтезируется в яйцеводе курицы после стимуляции стероидным гормоном эстрогеном и накапливается в яичном белке. У кур-несушек стимуляция гормоном происходит в естественных условиях, а у цыплят образование яйцевода и синтез овальбумина индуцируются при введении эстрогена. Гормон индуцирует транскрипцию гена овальбумина, в результате чего содержание овальбуминовой мРНК в клетке увеличивается практически от нуля до 50000 молекул через две-три недели и падает до 10 молекул на клетку после прекращения воздействия эстрогена. Яйцеводы кур-несушек представляют собой хороший источник овальбуминовой мРНК, поскольку она составляет в них около 50% суммарной мРНК. Очищенную мРНК используют затем для приготовления радиоактивного зонда, применяемого для идентификации клонированного гена овальбумина. Зондом может служить радиоактивно меченная одноцепочечная кДНК, синтезированная непосредственно на мРНК с помощью обратной транскиптазы, или клонированная дуплексная кДНК. С помощью таких зондов из популяции Х-векторов, содержащих вставки геномной ДНК курицы, полученные при ограниченном гидролизе эндонуклеазой EcoRI, были отобраны клонированные последовательности овальбуминового гена. Вставка, имела длину 6,8 т.п. н. Из нее образовались три EcoRI-фрагмента, при этом только фрагмент длиной 2,35 т.п. н. отжигался с овальбуминовым кДНК-зондом.

Положение искомой последовательности в клонированном сегменте можно определить также с помощью электронной микроскопии. Для этого зонд и рекомбинантную ДНК смешивают, денатурируют и отжигают, а затем готовят препарат для микроскопирования. Комплементарные участки зонда и исследуемой молекулы образуют дуплексы, которые на электронных микрофотографиях выглядят как относительно толстые нити, а некомплементарные участки остаются одноцепочечными и имеют вид более тонких нитей. Гетеродуплекс, образующийся между овальбуминовым рекомбинантом формируются при условиях, благоприятных для гибридизации типа РНК'ДНК, а не ДНК'ДНК. В сегменте ДНК размером 2,35 т.п. н., который гибридизовался с мРНК, в образовании двухцепочечной структуры участвовали только около 550 п. н. Таким образом, гетеродуплексный анализ гораздо более информативен, чем определение положения кодирующих последовательностей в клоне. Он показывает, что, хотя мРНК содержит около 1800 п. н., в клонированном сегменте ДНК представлено менее трети длины кодирующих последовательностей гена овальбумина. Кроме того, 550 п. н. в клонированной ДНК, комплементарные мРНК, не образуют одну непрерывную последовательность, а распределены по четырем участкам, разделенным одноцепочечными петлями, т.е. кодирующие последовательности геномной ДНК чередуются с некодирующими. Как описано в разд.8.5, такие промежуточные последовательности, или интроны, типичны для эукариотических генов.

Тонкая структура клонированной вставки: нуклеотидная последовательность

Чтобы до конца выяснить структуру, функцию и происхождение клонированного сегмента ДНК, необходимо установить его первичную структуру - нуклеотидную последовательность. Быстрые и точные методы определения последовательностей ДНК были созданы вскоре после разработки методов, используемых в работе с рекомбинантными молекулами. В принципе сейчас можно провести секвенирование молекулы ДНК любой длины. Определение последовательности сегментов ДНК протяженностью в сотни и даже тысячи нуклеотидов представляет собой рутинную процедуру, а примерно до 1975 г. это была очень трудная задача. Для этого с помощью РНК-полимеразы сначала получали РНК-копии ДНК, а затем определяли нуклеотидную последовательность кРНК. Точность и полнота процесса копирования часто были недостаточны, а секвенирование РНК занимало много времени. Сейчас секвенируют саму ДНК, а для секвенирова-ния РНК обычно вначале получают кДНК-копии.

а. Общие принципы

Методы секвенирования ДНК можно разбить на две категории. В основе одних лежат химические реакции, в которых используются непосредственно фрагменты очищенной ДНК. Во втором случае используют ДНК-копии очищенных сегментов, полученные ферментативным путем. Эти подходы имеют и некоторое сходство. Прежде всего фрагменты ДНК обычно очищают, что легко осуществить с помощью клонирования. Далее, и в том, и в другом случае за один раз секвенируется только одна цепь ДНК. Для повышения точности лучше провести секвенирование каждой цепи дуплексной молекулы и сравнить результаты. За один раз используют только одну из цепей, помеченную радиоактивным изотопом. Определяют нуклеотидную последовательность только этой цепи, и именно о ней мы будем говорить в последующих разделах. Третья общая особенность указанных методов состоит в том, что в обоих случаях образуется набор радиоактивно меченных одиночных цепей всех возможных длин - от единицы до п, где п - полная длина секвенируемой молекулы.

В обоих подходах, химическом и ферментативном, полный набор фрагментов на самом деле бывает представлен в виде четырех отдельных наборов. В идеале каждый такой набор содержит все возможные фрагменты, берущие начало на одном конце цепи и продолжающиеся до очередного местоположения определенного нуклеотида. Так, один из наборов содержит все возможные цепи, начинающиеся в одном сайте и оканчивающиеся в тех местах, где встречается дезоксиаденозин. Второй набор содержит все возможные цепи, начинающиеся в том же сайте, а заканчивающиеся на всех встречающихся поочередно дезоксицитидиновых остатках. Третий и четвертый наборы представлены фрагментами, оканчивающимися на остатках тимидина или дезоксигуанозина.

Химический и ферментативный методы отличаются друг от друга способом получения четырех наборов фрагментов. В первом случае этот набор получают путем разрезания предварительно радиоактивно меченной цепи четырьмя разными способами, а во втором четыре радиоактивно меченных набора фрагментов получают путем копирования немеченой цепи ДНК. Последним этапом в обоих методах является разделение фрагментов, составляющих каждый из наборов, по длинам с помощью электрофореза в полиакриламидном геле в денатурирующих условиях. При этом удается разделить полинуклеотидные цепи, отличающиеся друг от друга только одним нуклеотидным остатком. Поскольку фрагменты несут радиоактивную метку, их легко выявить с помощью радиоавтографии, при этом достаточно лишь небольшого количества ДНК - порядка пикомолей или даже меньше. Все четыре набора, полученные из одного фрагмента

ДНК, подвергают одновременному электрофорезу на параллельных дорожках одной пластины геля. Сканируя каждую дорожку, расшифровывают всю последовательность. Используя специальные электрофоретические методы, можно разделить цепи размером от 1 до 300 или более нуклеотидных остатков. Молекулы, длина которых превышает несколько сотен нуклеотидов, фрагментируют и затем определяют нуклеотидную последовательность каждого фрагмента.

б. Химическое секвенирование

Получение наборов фрагментов, имеющих общие концы. Химическое секвенирование основано на специфической модификации различных пуриновых и пиримидиновых оснований. Эти модифицированные основания выщепляют затем из полимерной цепи с сохранением сахарофосфатного остова. Далее гидролизуют относительно нестабильные фосфодиэфирные связи, соседствующие с сайтом, где находилось удаленное модифицированное основание, в результате чего цепь разрывается. Все эти реакции, где в качестве примера рассмотрена модификация гуаниновых остатков. Представлены две реакции, одна из которых специфична в отношении только гуанина, а другая - только цитозина, и две реакции, специфичные в отношении либо пуринов, либо пиримидинов. Каждую из четырех реакций проводят с использованием отдельного препарата ДНК, в результате чего получают четыре набора фрагментов, необходимых для точного определения последовательности. Глубина каждой реакции строго ограничена, так что в каждой молекуле ДНК данного препарата в реакцию вступает в среднем только одно из чувствительных оснований. В результате популяция идентичных молекул ДНК превращается в ходе реакций, в которых участвуют случайные реакционно способные основания, в набор цепей, начинающихся в данном сайте на одном конце цепи и заканчивающихся на одном из реакционно способных оснований. Разрезание цепи происходит только по дезоксицитидиновым остаткам.

Каждая из четырех реакционных смесей на самом деле представлена двумя наборами цепей, получающихся в результате гидролиза препарата ДНК. Один включает все фрагменты, начинающиеся на 5'-конце исходной цепи, другой - все фрагменты, начинающиеся на 3'-конце. Нужную нам информацию о последовательности можно получить, используя любой из наборов, и выбор одного из них зависит от того, как был помечен исходный фрагмент - с 3' - или 5'-конца - перед проведением химических реакций, специфичных в отношении определенного основания. Немеченый материал нельзя визуализировать с помощью радиавтографии. Если исходным материалом является дуплексная ДНК, то помечена должна быть только одна из двух цепей, в противном случае конечные продукты будут представлены двумя разными наборами меченых цепей и данные будет трудно интерпретировать.

Введение метки в 5'-конец осуществляют с помощью полинуклеотидкиназы и у-32Р. Если присутствуют 5'-концевые фосфомоноэфирные группы, то их необходимо предварительно удалить с помощью фосфомоноэстеразы. Одноцепочечные молекулы секвенируют сразу после введения метки. Дуплексную ДНК после осуществления киназной реакции разделяют на две комплементарные цепи с помощью денатурации и электрофореза. Меченый двухцепочечный фрагмент можно также разрезать на две части по определенному внутреннему эндонуклеазному сайту и образовавшиеся фрагменты разделить с помощью электрофореза. В этом случае секвенируемые молекулы на самом деле являются двухцепочечными, но одна из цепей не содержит метки и поэтому остается "невидимой".

Введение метки в 3'-концы дуплексных цепей целесообразно проводить в том случае, когда на 5'-концах имеются выступы. Удлинение более коротких 3'-концов катализируется либо ДНК-полимеразой I, либо обратной транскриптазой, использующими выступающий 5'-конец как матрицу; 32Р включается в цепь в составе соответствующего а-32Р-меченного дезоксинуклеозидтрифосфата. Мечение по З'-концу происходит в каждой из цепей двухцепочечной ДНК, а для секвенирования необходимо иметь препарат, в котором все молекулы несут метку только на одном конце. Поэтому меченые двухцепочечные фрагменты расщепляют рестриктазой и фракционируют субфрагменты с помощью гель-электрофореза или разделяют цепи ДНК. Однако, если концы дуплексного фрагмента не идентичны, часто оказывается возможным прямое получение одноцепочечного 32Р-меченного конца. Например, если один из концов тупой, то его удлинения не происходит, и при соответствующем подборе а-32Р-меченного дезоксинуклеозидтрифосфата можно пометить только один из концов.

в. Ферментативное секвенирование

Получение наборов фрагментов, имеющих общие концы. Для секвенирования ДНК с помощью ферментативного копирования необходимо иметь одноцепочечную ДНК, а также короткий полидезокси-нуклеотидный праймер, комплементарный небольшому участку ДНК. Одиночная цепь служит матрицей, а новая цепь наращивается, начиная с 3'-гидроксильной группы праймера путем присоединения дезоксирибонуклеотидтрифосфатов. При секвенировании проводят четыре типа реакций копирования, в результате чего образуются четыре набора цепей, синтез которых остановлен на остатках А, С, G или Т. Остановка синтеза происходит в результате присоединения дидезоксинуклеотида, у которого отсутствует 3'-гидроксильная группа, что препятствует дальнейшему удлинению цепи. Реакции проводят таким образом, чтобы вероятность остановки синтеза на любом другом остатке, кроме заданного, была очень мала.

ДНК-полимераза I может утилизировать 2',3'-дидезоксинуклео-зидтрифосфатные аналоги нормальных дезоксинуклеозидтрифосфатных субстратов. Как и при обычной полимеризации, соответствующий дидезоксинуклеотид присоединяется к 3'-гидроксильному концу праймерной цепи, однако образующийся при этом продукт не может служить праймером для дальнейшего роста цепи, и реакция останавливается.

Для проведения четырех разных реакций копирования комплекс "матрица-праймер" инкубируют в присутствии всех четырех обычных дезоксирибонуклеозидтрифосфатов и какого-то определенного дидезоксинуклеозидтрифосфата. Например, в одной реакции используют ddATP, dATP, dGTP, dCTP, dTTP, в другой - dATP, ddGTP, dGTP, dCTP, dTTP и т.д. Удлинение цепи с помощью матричного копирования происходит до тех пор, пока вместо очередного дезоксинуклеотида не присоединится дидезоксинуклеотид; в этот момент рост цепи прекращается. Поскольку терминация синтеза происходит в случайных сайтах, образуется набор цепей всех возможных длин, начиная с 5'-конца праймера до сайтов, соответствующих положению присоединенного дидезоксинуклеотида. Новосинтезированные цепи являются радиоактивно меченными, поскольку в реакции используется по меньшей мере один радиоактивно меченный дезоксинуклеозидтрифосфат. Часто им является а-32-Р-дезоксинуклеозидтрифосфат, но это может быть также 358--дезоксинуклеозидтрифосфат. Иногда используется радиоактивно меченный праймер. Продукты четырех реакций подвергают одновременному электрофорезу на отдельных дорожках, как при химическом секвенировании. Последовательность считывают с радиоавтографа, который выглядит так же, как и радиоавтограф, полученный при использовании химического метода секвенирования.

Получение одноцепочечной ДНК для секвенирования с помощью дидезокситерминаторов. Молекулы ДНК обычно являются двухцепочечными; исключение составляют лишь одноцепочечные ДНК некоторых бактериофагов. Как мы уже говорили, физическое разделение цепей дуплекса не всегда осуществимо. Для разделения цепей дуплекс денатурируют нагреванием или обработкой щелочью и проводят гель-электрофорез или хроматографию. Разделение двух комплементарных цепей происходит, по-видимому, благодаря различиям их конформаций, обусловленным различиями во вторичной структуре. Если разделения не произошло, применяют другие методы получения одиночных цепей. Наиболее эффективный из них состоит в клонировании фрагмента ДНК в векторе, сконструированном на основе бактериофага М13. Любая клонируемая вставка всегда будет фланкирована одними и теми же последовательностями векторной ДНК, что позволяет использовать стандартные праймеры. Их синтезируют химическими методами, и всегда можно выбрать удобный праймер. Кроме того, не составляет труда получить отдельные клоны, каждый из которых содержит одну из двух комплементарных цепей ДНК, благодаря чему легко осуществить секвенирование обеих цепей.

Комбинируя клонирование в М13 и секвенирование с помощью дидезокситерминатора, мы можем получить эффективный способ определения последовательностей молекул ДНК, длина которых достигает нескольких тысяч пар нуклеотидов. Для секвенирования длинных дуплексных молекул их разрезают механически на фрагменты и затем проводят клонирование. Каждая образующаяся бляшка содержит определенные фрагменты или цепи. Случайно отбирая клоны, определяют последовательность вставок. Поскольку вставки образуются в результате разрыва исходной молекулы ДНК в случайных местах, некоторые фрагменты содержат перекрывающиеся последовательности. С помощью компьютера сравнивают последовательность каждого фрагмента с последовательностями других фрагментов, выявляют перекрывающиеся области и располагают отдельные фрагменты в определенном порядке. Таким способом были определены последовательности митохондриальной ДНК человека и ДНК Х-фага.

Другое применение методов секвенирования. Секвенирование с помощью дидезокситерминаторов может применяться для прямого определения последовательностей РНК или ДНК, причем даже в том случае, если в смеси помимо секвенируемой цепи присутствуют неродственные молекулы. Важным элементом при этом является праймер, комплементарный небольшому интересующему нас участку и лишь с малой вероятностью ассоциирующий с другими молекулами, присутствующими в смеси. Подобной специфичностью обычно обладает праймер длиной 20 оснований с уникальной последовательностью. При таких условиях с помощью обратной транскриптазы синтезируют кДНК. Этот метод применим только в том случае, если мы уже достаточно много знаем об интересующих нас РНК или ДНК, но круг таких систем все время расширяется.

Метод химического секвенирования может применяться для анализа специфических последовательностей ДНК, присутствующих в смеси наряду с большим числом разных молекул ДНК, в том числе даже если речь идет об одном гене в суммарной геномной ДНК млекопитающих. Прежде всего ДНК разрезают с помощью рестриктирующей эндонуклеазы, так что интересующий нас сегмент оказывается во фрагменте длиной в несколько сотен пар оснований. Затем проводят химические реакции, специфичные к определенным основаниям, в результате чего образуются четыре набора фрагментов. Такие наборы включают все возможные по длине фрагменты с интересующей нас областью, начинающиеся в сайте рестрикции, по которому была разрезана ДНК. Здесь же присутствует множество других фрагментов из остальной части генома. Фрагменты разделяют путем электрофореза в секвенирующем геле, затем переносят на нейлоновый фильтр и отжигают с 32Р-меченным зондом, который комплементарен последовательности-мишени, находящейся вблизи одного из сайтов разрезания. Зонд ассоциирует со всеми фрагментами, образовавшимися начиная с одного конца последовательности-мишени, в результате чего на радиоавтограмме образуется типичная "секвенирующая лестница". Таким методом можно определить, например, нуклеотидную последовательность мутантных форм ранее клонированного гена. Он может использоваться также для определения характера метилирования специфической, уже клонированной области генома, поскольку гидразин реагирует с 5'-метилцитозиновыми остатками менее эффективно, чем с цитозиновыми и тиминовыми. О наличии 5'-метилцитозина в геле можно судить по отсутствию цитозинового остатка, представленного в соответствующем фрагменте ДНК, выделенном после клонирования и репликации в клетках Е. coli.

Компьютерный анализ нуклеотидных последовательностей ДНК

Простота разделения сегментов ДНК путем клонирования и их последующий анализ позволили определить нуклеотидную последовательность многих ДНК. Но хотя стремление биологов к получению точных в химическом отношении данных продолжало стимулировать эти исследования, информация оказывалась бесполезной, если не были выявлены какие-то особенности этих последовательностей. На первый взгляд длинные ряды оснований кажутся совершенно загадочными и не поддающимися расшифровке. К счастью, проблему расшифровки можно решить с помощью высокоэффективных компьютерных программ и для рутинного использования имеются программы на нескольких стандартных компьютерных языках. Возможности различных программ в значительной степени перекрываются. Их можно использовать при работе как на больших компьютерах, так и на мини - и микрокомпьютерах. Вообще говоря, эти программы пригодны для поиска как структурных, так и биологических особенностей последовательностей.

а. Хранение информации о первичной структуре

Для ввода и хранения данных о последовательностях и последующего поиска, проводимого исследователем вручную или с помощью специальной аналитической программы, используются стандартные процедуры редактирования. Большинство этих процедур предусматривают также возможность коррекции хранящейся информации. Ввод данных часто осуществляют путем типирования последовательности в компьютерном терминале после прочтения и регистрации данных секвенирующего геля. Однако имеются также программы для прямого ввода исходных данных. В принципе такие программы позволяют свести к минимуму ошибки, допускаемые при неправильном считывании гелей или неточной регистрации данных. Существует два подхода к такой автоматизации. В первом случае детектор автоматически сканирует радиоавтографы и передает данные непосредственно в компьютер. Во втором данные автоматически регистрируются от сенсора, управляемого вручную. При втором подходе исследователь является арбитром при любых затруднениях.

б. Структурный анализ

Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство программ позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов. Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз. В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отношении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также программы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эндонуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз.

Имеющиеся программы осуществляют также поиск характерных особенностей последовательностей, включая прямые и обратные повторы. Выявляются не только полностью совпадающие сегменты, но и сегменты с той или иной степенью несовпадения; для этого допускаются определенные отклонения параметров, заложенных в программу, от фиксированного значения. В примере перечислены все повторы длиной не менее шести пар оснований и гомологичные не менее чем на 75%. Предполагается, что максимальный размер образующихся петель равен двум основаниям.

Можно получить данные о гомологии или частичной гомологии различных последовательностей. Эти данные могут касаться структуры одного и того же гена у двух разных организмов или родственных генов одного организма. Такой сравнительный анализ широко используется при изучении эволюции на молекулярном уровне. Для сравнения двух последовательностей между собой или одной последовательности с группой других последовательностей разработаны специальные алгоритмы. Может использоваться описанный ранее вероятностный анализ. По результатам сравнения информации о последовательностях, полученной в разных лабораториях, был создан центральный банк данных, из которого всегда можно затребовать информацию о тех или иных последовательностях. К 1989 г. в банках имелась информация о последовательностях более 20 миллионов пар оснований, представляющая данные о многих генах и организмах.

Помимо этого общего применения, обнаружение сходства различных последовательностей является составной частью секвенирования очень длинных последовательностей с помощью дидезокси-метода, объединенного с клонированием в фаге М13. Используя компьютер для обнаружения перекрывающихся последовательностей, мы не только делаем работу менее утомительной, но и можем быстро решить, следует ли нам пытаться получить дополнительные данные.

Вторичная структура. Разработаны программы, позволяющие предсказать стабильную внутримолекулярную вторичную структуру одноцепочечных РНК или ДНК. Они позволяют, например, построить модель укладки цепи тРНК и рРНК, и многие из таких моделей получили экспериментальное подтверждение в опытах с использованием нуклеаз, специфичных к одноцепочечным участкам. Расчеты основаны на предположениях о вероятности образования определенных пар оснований, на термодинамических свойствах разных пар оснований и данных о стабильности спирали.

в. Биологическое значение

С помощью компьютерных программ можно перевести информацию с языка нуклеотидов на язык аминокислот в соответствии с правилами генетического кода. При этом указываются все три возможные рамки считывания и стоп-кодоны трансляции. В тех случаях, когда аминокислотная последовательность кодируемого полипептида известна, идентифицировать правильную рамку считывания не составляет труда. В противном случае правильную рамку можно выбрать, исходя из ее длины. Рамки, в которых часто встречаются стоп-кодоны, вряд ли могут считаться правильными. Показаны часть генома SV40, кодирующая участок вблизи г\ГИ2-конца малого и большого Т-антигенов, и полученные с помощью компьютера аминокислотные последовательности для всех трех рамок считывания. Правильной является третья рамка. Можно также рассчитать частоту, с которой встречается каждый кодон, и таким образом выявить предпочтительные кодоны для определенных аминокислот. Обращение этой процедуры позволяет воссоздать возможные нуклеотидные последовательности, исходя из известной аминокислотной последовательности полипептида, хотя эта задача не имеет однозначного решения вследствие вырожденности генетического кода. Центральный банк данных содержит информацию об аминокислотных последовательностях всех проанализированных полипептидов, что позволяет сравнивать последовательности изучаемого и известных белков.

С помощью компьютеров можно вести поиск специфических нуклеотидных последовательностей, например промоторов или участков связывания с рибосомами. Они позволяют также обнаружить последовательности со специфическими свойствами. Например, наличие сходных последовательностей в разных неродственных во всех других отношениях генах или вблизи них наводит на мысль об их возможной регуляторной роли. Точно так же присутствие гомологичных последовательностей в кодирующих областях различных генов может свидетельствовать об общности эволюционного происхождения этих генов. Данный вопрос детально рассмотрен в ч. III книги. Однако важно осознавать, что статистический анализ еще не является достаточным для того, чтобы делать вывод о биологической роли той или иной последовательности. Об этом можно говорить только после проведения независимого биологического исследования.

Определение положения клонированных сегментов в геномах

В идеале установление положения клонированного сегмента ДНК означает определение фланкирующих его последовательностей и того хромосомного сайта, по которому этот сегмент был включен в хромосому. Конечная цель такого картирования состоит в полном описании структуры хромосомы.

а. Молекулярная локализация

Характеристика клонированного сегмента. Прежде всего необходимо доказать, что клонированный сегмент действительно является репликой определенного геномного сегмента. Существует ли в геноме гомологичный сегмент с точно так же расположенными сайтами для рестриктирующих эндонуклеаз? Этот вопрос имеет важное значение, поскольку во время репликации в системе хозяин-вектор иногда происходит клонирование случайных последовательностей, образовавшихся в результате рекомбинаций, делеций или мутаций. Основной подход состоит в использовании клонированной ДНК в качестве зонда для анализа продуктов эндонуклеазного расщепления суммарной геномной ДНК, из которой произошел данный клонированный сегмент. Такой подход аналогичен описанному в разд.6.1. б с тем отличием, что зондом в данном случае является клонированная вставка, меченная 32Р. В эксперименте Б, клонированный зонд представлял собой субклонированный сегмент овальбуминового гена; материал, подвергнутый электрофорезу, - это coRI-гидролизат ДНК курицы. С зондом гибридизовался материал только одной полосы, представляющий собой фрагменты длиной 2,35 т.п. н. Этот эксперимент показывает, что 1) клонированная вставка в самом деле является фрагментом ДНК курицы;

2) в геноме гибридизующийся сегмент расположен между двумя EcoRI-сайтами, находящимися друг от друга на расстоянии 2,35 т.п. н.;

3) ни один из фрагментов любого другого размера не гибридизуется с зондом. Таким образом, клонированный фрагмент длиной 2,35 т.п. н., по-видимому, представляет собой истинную геномную последовательность и два аллеля в диплоиде являются идентичными, поскольку локализация этих EcoRI-сайтов совпадает.

Еще одна последовательность овальбуминового гена обнаружена в EcoRI-фрагменте длиной 1,8 т.п. н. После того как он был клонирован и использован в качестве зонда для анализа EcoRI-гидролизата ДНК курицы, были обнаружены три гибридизующихся фрагмента длиной 1,8; 1,3; 0,5 т.п. н. соответственно. Эти данные свидетельствуют о неидентичности двух аллельных овальбуминовых генов. Один из них содержит дополнительный EcoRI-сайт, разделяющий фрагмент длиной 1,8 т.п. н. на две части. Интересно, что столь простая процедура лежит в основе генетического анализа. Наследование двух или более аллелей легко прослеживается с помощью эндонуклеазного расщепления, электрофореза, ДНК-блоттинга и гибридизации между соответствующим зондом и ДНК, выделенной из разных источников. Единственным требованием является наличие полиморфных эндонуклеазных сайтов в аллелях любого гена или сегмента ДНК. Для проведения таких экспериментов достаточное количество ДНК можно получить из очень небольшого кусочка ткани или из нескольких миллилитров крови, поэтому метод может использоваться для анализа ДНК большинства видов, в том числе и человека.

Построение карты молекулы. Имея сравнительно короткие сегменты молекулы ДНК, такие, например, как ранее описанный субклонированный фрагмент длиной 2,35 т.п. н., можно построить детальную карту молекулы вплоть до установления ее нуклеотидной последовательности. Более длинные клонированные последовательности, подобные тем, которые присутствуют в Х-векторах или космидах, часто содержат несколько генов, а также другие сегменты ДНК, и могут использоваться для расширения карты. Так, субклонированный фрагмент овальбуминового гена длиной 2,35 т.п. н. служил зондом для поиска гомологичных последовательностей в космидной библиотеке, сконструированной из геномной ДНК курицы. Были отобраны две космиды с перекрывающимися последовательностями только в области зонда; вместе они составляли участок генома длиной 46 т.п. н., из которых 7,7 т.п. н. принадлежали самому гену овальбумина. Об