НАУКА: Ваш код! Кто и когда выведет на рынок расшифровку персонального генома?
НАУКА: Ваш код! Кто и когда выведет на рынок расшифровку персонального генома?
Автор: Леонид Левкович-Маслюк
Проект «Геном человека» продолжался 13 лет (с 1 января 1990 года до начала 2003-го) и обошелся только американскому правительству в 2,7 млрд. долларов образца 1991 года. Сегодня премия от X Prize в 10 млн. долларов ждет частную компанию, которая сумеет за десять дней проделать то же самое с геномами ста человек, затратив не более 10 тысяч долларов на каждый. Тем самым дан старт битве компаний за долю возникающего гигантского рынка совершенно новых иследований, лекарств и медицинских услуг.
Хромосомный драйв
В Штатах в этом году неожиданно набрал огромную популярность новый НФ-телесериал «Герои» («Heroes»). Зрители, прилипшие к экранам, заметили то и дело мелькающий в сценах таинственный знак, похожий на стилизованную f. Вскоре стало ясно, что это обломок спирали ДНК, символ «квантового скачка эволюции», превратившего заурядных персонажей в чудовищ и волшебников, породненных молекулярными узами более прочными, чем узы крови… Так описывает электронная версия «San-Francisco Chronicles» очередной приступ массовой одержимости населения кодами — на сей раз не да Винчи, а ДНК. Автор статьи Джефф Янг (Jeff Yang) считает бесспорным, что ключ к ударному успеху сериала — именно в грамотном использовании «самой хипповой (hippest) сегодня стилистики: хромосомной». Понятие ДНК, заключает он, занимает привилегированное положение уже не только в поп-культуре, а в самом духе времени (zeitgeist) Америки наших дней.
Этот ДНК-драйв создает одновременно и прекрасный фон, и мощный стимул для развития проекта, цель которого — сделать личную генетическую информацию полностью доступной каждому. Фундамент для решения этой задачи был заложен знаменитым проектом «Геном человека» (Human Genome Project, HGP) , выполненным в международном масштабе, но в значительной степени на деньги американского правительства. Теперь речь идет о выстраивании на этом фундаменте частной инициативы, которая обеспечит массам доступ к новым чудесам науки, а бизнесу — отличный новый рынок.
Рынок персонального секвенирования
В начале 2006 года стоимость секвенирования (цитирую условия конкурса X Prize) «диплоидных геномов из 6 млрд. пар нуклеотидов ДНК человека» (не «человека вообще», как было в HGP, а конкретного индивидуума, и не «генов вообще», а каждого гена в паре — они могут заметно различаться по свойствам) составляла 20 млн. долларов и требовала шести месяцев работы. В этой области, оказывается, есть свой «закон Мура» — стоимость секвенирования до сих пор уменьшалась вдвое каждые два года. Уточним, что миллиарды, затраченные на HGP, включали расходы на массу вещей: разработку новых медико-биологических технологий, исследования наследственных болезней, работу с лабораторными животными, создание компьютерных методов анализа результатов. Более того, от трех до пяти процентов госбюджета проекта (то есть миллионы, а позже десятки миллионов) каждый год уходило на изучение этических, юридических и социальных аспектов этой работы. Затраты на секвенирование как таковое составляли лишь сравнительно небольшую часть всего финансирования. Но они до сих пор в тысячи раз выше $1000 за геном — суммы, которая сделает это исследование широко доступным.
Объем рынка, связанного с массовым секвенированием, будет огромным. Даже просто умножив заветную «тысячу за геном» на сколь-нибудь заметный процент от трехсотмиллионного населения только одних США, получим десятки миллиардов долларов как грубую оценку минимального объема денег, которые будут вовлечены в эту экономику. Учтем, что развитие персонального секвенирования приведет к возникновению новых индустрий, в первую очередь — конструирования и производства лекарств, адаптированных к индивидуальным генетическим параметрам. Не говоря уж о тех индустриях, которые придется создать для того, чтобы быстрое и дешевое секвенирование стало возможным. Ну а интерпретация результатов секвенирования (см. комментарий Александра Чубенко), без которой все эти усилия теряют смысл, потребует развития не только биологических наук о функциях и взаимосвязях генов и белков, но и серьезных биоинформационных достижений. Но даже сегодня, когда этих индустрий еще не существует, рынок секвенирующих машин и химикатов для них оценивается почти в миллиард долларов в год, при этом прогнозируется ежегодный рост в 4-5%.
Кто и как будет ускорять
Параллельно с частными компаниями серьезные средства в ускоренное секвенирование вкладывает госсектор. Одновременно с объявлением конкурса X Prize американский Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI) сообщил о результатах очередного конкурса на получение грантов общей суммой 13 млн. долларов для работы над этой проблемой. В этом году гранты получили девять ученых, работающих над снижением стоимости исследования до тысячи долларов — в далекой перспективе, и двое, стремящихся довести ее до ста тысяч, но гораздо раньше. Сто тысяч за геном — та сумма, которая позволит использовать полное секвенирование сотен индивидуальных геномов в изучении генетически обусловленных заболеваний.
Как считает Джордж Черч (George Church), стотысячный рубеж будет пройден не позже 2009 года, а очень вероятно, что и раньше. Тысячный рубеж, по планам NHGRI, намечен ориентировочно на 2014 год, но по мнению Черча, в этом вопросе ясности гораздо меньше. Неясно даже, нужно ли доводить стоимость именно до тысячи долларов, а главное — нужно ли определять последовательность нуклеотидов полностью, ведь интересен лишь один процент из них. Выяснить, какие именно участки генома составляют этот процент — вполне реалистичная задача с точки зрения Черча, и если сконцентрироваться на ней, можно достичь желаемого результата (массового секвенирования) раньше.
Об этом Черч говорил в сентябре на конференции Emerging Technologies 2006 в МТИ (см. о ней колонку Левона Амдиляна в «КТ» #659). Однако похоже, что индустрия в целом сконцентрирована на проблеме ускорения/удешевления как таковой — точно так же, как разработчики суперкомпьютеров соревнуются по количеству терафлопсов, а не по новым методам решения задач. В сообщениях о платформах следующего поколения для секвенирования чаще всего мелькают названия компаний Applied Biosystems, Solexa, 454 Life Sciences. Здесь мы не будем вдаваться в описание достоинств и проблем различных технологий (см., например, материал Сергея Борисова в «КТ» #603, а также подборку популярных материалов на www.cbio.ru). Отметим лишь одну новую и очень наглядную идею, которая обещает рекордную производительность: метод нанопор. Молекула ДНК протаскивается через отверстие нанометровых размеров в мембране (см. рис.). Каждый нуклеотид, попадая в отверстие, изменяет электропроводность мембраны, причем на разную величину в зависимости от типа нуклеотида — что и позволяет (в принципе) конвертировать изменения чудовищно слабого электрического сигнала прямо в «буквы» кода. При этом не надо, как в других методах, дробить молекулу ДНК на маленькие фрагменты, а потом многократно дублировать и сопоставлять результаты их обработки. Если удастся преодолеть многочисленные проблемы и добиться расшифровки генома таким методом со скоростью 10 тысяч нуклеотидов в секунду, то небольшой твердотельный массив нанопор обеспечит секвенирование генома человека за 20 часов — по крайней мере, так обещает группа Джина Головченко (Jene Golovchenko), физика из Гарварда, реализующая один из вариантов этой идеи (любопытно, что среди многочисленных авторов других вариантов есть и сам Джордж Черч, уже сотрудничающий на этой почве с мощной компанией из мира полупроводниковых технологий Agilent Technologies, которая, не мелочась, оценивает потенциальную скорость такого секвенирования в миллион пар нуклеотидов в секунду — примерно по геному в час).
Это только начало
Задача получить за 1000 долларов полную информацию о последовательности нуклеотидов в человеческом геноме выглядит вполне реальной. Немного смущает срок в 5-10 лет (X Prize взяла его не с потолка, а со слов самых авторитетных разработчиков быстрых методов секвенирования, но их оптимизм может оказаться немного преувеличенным). Однако рубеж в тысячу у. е. — это только промежуточный финиш. Самое интересное начнется после: полученную информацию надо будет интерпретировать.
Для начала текст можно сразу сократить на порядок, вычеркнув накопившуюся за миллиарды лет явно бессмысленную информацию. Внутри генов можно исключить из рассмотрения интроны — участки, которые вырезаются после синтеза матричной РНК. Зато придется учесть, что некоторые гены разбросаны по хромосомам, другие кодируют сразу несколько белков и т. д. — в общем, до начала анализа надо будет свести объем информации к осмысленным «словам». Большинство из этих примерно 30000 генов (вернее, пар генов) придется исключить из рассмотрения: идентифицировать функции каждого из закодированных в генах белков — задача куда более сложная, чем разработать метод дешевого секвенирования генома, а протеомика — очень молодая наука.
Выявление фенотипических проявлений генного полиморфизма (вариантов структуры генов, существенных для функций их белков) — следующий этап на пути к практическому применению информации об индивидуальном геноме. Обратите внимание: для анализа персонального генома надо исследовать не одну, а обе хромосомы в каждой из 23 пар — поэтому в условиях конкурса и указаны не три, а шесть миллиардов пар нуклеотидов. Даже такие простые признаки, как цвет кожи или глаз, определяются несколькими парами генов.
Организм состоит из сотен типов клеток, и в каждом из них активна только часть генов — и активна по-разному, в зависимости от множества внешних и внутренних факторов. Вспомните школьный учебник биологии с рисунками двух овечек одной породы (у той, которая выросла в холодном климате, шерсть заметно гуще и длиннее) и представьте, сколько сотен разных белков у них функционируют по-разному.
Белки регулируют активность друг друга (а также — своих и чужих генов) множеством прямых и обратных связей, а метаболомика, которая изучает эти связи и их механизмы, — еще более молодая наука, чем протеомика. Только между мужчинами и женщинами в одном из недавних исследований выявили около двух тысяч различий в функциях одних и тех же белков! И это между «мужчинами вообще» и «женщинами в целом».
Уже сейчас достаточно точно известна роль тысяч генов, определяющих неизбежные наследственные болезни или повышение вероятности многих наследственно обусловленных заболеваний (а к ним, по осторожным оценкам, относится не меньше половины человеческих болячек). А главное — в общих чертах известно, что, где и как искать. Фармакогеномика сейчас делает самые первые шаги — не столько из-за неполноты знаний, сколько из-за высокой стоимости анализа индивидуальных и даже расовых различий в работе ферментов. Когда расшифровка генома станет процедурой, доступной рядовым гражданам не слишком бедных стран, по такому анализу можно будет получить прогноз индивидуальной предрасположенности к заболеваниям — а кто предупрежден, тот вооружен. И для лечения болезней можно будет назначать наиболее подходящие конкретному больному препараты в оптимальной дозировке.
Тысяча долларов — это не просто круглая цифра. Давно подсчитано, что производство лекарств и оказание медицинских услуг становятся рентабельными, если они доступны хотя бы каждому третьему из нуждающихся в них. Реальная стоимость «генетического паспорта» будет больше — ведь полученные данные необходимо проанализировать и разработать на их основе индивидуальные рекомендации. Но ожидаемая польза для здоровья сто,ит и намного большей суммы. А для человечества в целом затраты на разработку методов быстрого и дешевого секвенирования генома несомненно окупятся.
Александр Чубенко,
главный редактор интернет-журнала "Коммерческая биотехнология"
Сопутствующая фантастика
Что же, собственно, получит пациент после того, как его геном будет, наконец, прочитан? Ответы на этот вопрос, которые сегодня дают серьезные специалисты, звучат сдержанно. Вот что пишет, например, Джордж Черч в журнале Edge о том, как это происходит сейчас: «По результатам анализа вашего генома компании либо дадут вам генеалогическую информацию о вас и ваших предках, либо медицинскую — если окажется, что у вас одна из небольшого количества генетических болезней, которые поняты настолько хорошо, что в этом случае можно что-то предпринять. Но другой информации они вам, как правило, не дадут — не скажут о тех вещах, которые нельзя вылечить или предупредить. Вам просто пришлют отчет, где простыми словами будет сказано, к какому врачу обратиться, какие анализы сделать и т. п.».
Черч называет эту не слишком вдохновляющую перспективу «аналитическим уровнем» проблемы персонального генома. Разумеется, создание персонализованных лекарств и методов лечения не отменяется. Однако в качестве концептуальной альтернативы — синтетического подхода к персональной геномике — Черч выдвигает нечто откровенно фантастическое: перестройку и конструирование живых систем. Впрочем, фантастика здесь смешана с уже предпринятыми практическими шагами: возглавляемая Черчем BioFab Group вовсю работает над переносом принципов конструирования электронных схем в область биологических систем. Бактерии в экспериментах уже выстраиваются по команде в слова «Hello, world» — но даже краткое обсуждение этой работы слишком далеко уведет нас от заданной темы.
Отметим лишь, что выстраивание дальних и именно фантастических (то есть знакомых с детства по научной фантастике) перспектив давно стало одним из важнейших механизмов продвижения крупных научных и технологических проектов.
Несравненно более скромный, чем у Черча, но тоже яркий, а главное, немедленно реализуемый вариант НФ-сопровождения своих проектов разрабатывает уже упоминавшаяся 454 Life Sciences (название часто сокращают до 454). Речь о нашумевшем плане секвенирования генома неандертальца. Работа идет в сотрудничестве с генетиком из Института Макса Планка Сванте Пэбо (Svante Pa..a..bo), известным своими исследованиями митохондриальной ДНК, выделенной из окаменевших костей неандертальца. Пэбо, изобретатель технологий анализа древних ДНК, давно хотел заняться полным секвенированием неандертальского генома, но никак не мог найти подходящую техническую базу — и тут ему как раз позвонил основатель 454 Джонатан Ротберг (излагаю историю по интервью, данному вице-президентом 454 Майклом Эгхольмом [Michael Egholm] журналу Technology Review). Главная сложность задачи — в плохом качестве генетического материала, извлеченного из костей, пролежавших в какой-то хорватской пещере 38000 лет, и компенсировать это можно обработкой примерно в 20 раз большего количества нуклеотидов, чем обычно. Отличный случай протестировать новую ускоренную технологию, разработанную 454! Для разминки уже проделаны тестовые «сканы» участков длиной в миллион пар нуклеотидов — прежний рекорд для неандертальцев составлял несколько сотен. Но главная НФ-задача впереди: попытаться выяснить, какие гены отвечают за то, что мы все-таки стали людьми. Недавно было проведено секвенирование генома шимпанзе. Различие с нами — в 35 млн. пар. В 454 исходят из того, что шимпанзе и мы разошлись в эволюционном развитии 5 млн. лет назад, а неандертальцы и мы — только 500 тысяч лет назад. План такой: взять эти 35 млн. пар и посмотреть, что в этих местах записано в геноме неандертальца — то, что у нас, или то, что у шимпанзе. На тех нескольких миллионах пар, которые уже просеквенированы, ДНК неандертальцев лишь в четырех процентах случаев совпадает с ДНК шимпанзе, в остальном они ближе к людям. «Эти-то четыре процента — самые интересные! — говорит Эгхольм. — Мы надеемся, что там могут быть гены, ответственные за высшие поведенческие функции. Было бы потрясающим успехом найти гены, ответственные за речь, познавательные способности, развитие мозга. Можно представить себе, что когда будут возникать гипотезы о том, какие гены у человека отвечают за высокоуровневое восприятие, мы сможем сравнить их с геномом неандертальцев и посмотреть, есть ли различия».
По поводу проектов персонального секвенирования генома
Когда можно ожидать решения задачи быстрого и дешевого секвенирования индивидуального генома?
— Не знаю. Знал бы — сильно бы разбогател!
Могут ли методы, создаваемые для этой задачи, дать возможность не только выявлять наследственные болезни и индивидуально подбирать лекарства, но и прогнозировать (определять) черты характера, особенности психики, поведения?
Можно ли генетическим анализом собирать информацию о таких чертах личности человека? В какой мере они определяются генетическими данными?
— Теоретически, наверное, да — но это уже и сейчас возможно, скорость секвенирования тут ни при чем. Практически — самые грубые вещи, типа слабоумия, или несколько более тонкие (общий уровень гормонального фона, уровень тех или иных нейромедиаторов) определяются генетически и в какой-то мере определяют характер человека. Но вот совсем тонкие особенности личности тоже, конечно, определяются во многом генетически, но не одним геном, а взаимодействием очень многих генов и их регуляцией. И тут уже играют важную роль всякие случайности при развитии. В сущности, это ключевой вопрос всей генетики, быстрым ответом тут не обойдешься, и точек зрения очень много.
Компания 454 Life Sciences, работающая над ускорением секвенирования, открыла большой проект сравнительного исследования генома неандертальцев, современного человека и высших обезьян — в попытке найти генетическую информацию, определяющую способность к планированию, абстрактному мышлению и т. п. (сравнивая те участки, что совпадают у неандертальцев и шимпанзе, но отличаются у нас). Ваше мнение о перспективах такого подхода?
— Уже во многих исследованиях показано, что есть гены, которые быстро эволюционируют у приматов и особенно у человека; многие из них действительно работают в мозге, регулируя количество нейронов, их развитие, миграцию, прорастание отростков, взаимодействие. Мутации в этих генах вызывают микроцефалию, слабоумие и т. п. То есть некоторые гены, отвечающие за интеллект, известны. Но это пока знания на очень грубом уровне, в духе таких аналогий: если электричество отключить, компьютер работать не будет; если перерезать провод к монитору, то работать будет, а показывать — нет.
Дальше все упирается не в генетиков, а в нейрофизиологов и нейропсихологов. Если бы было известно, какие структуры мозга отвечают за перечисленное вами, то можно было бы искать гены, от которых зависит развитие этих структур (если есть тонкий глюк в процессоре, то чтобы его изучать, надо сначала узнать, что среди этих разноцветных штучек с проводками где-то есть процессор, обнаружить его и примерно понять, как он работает). И скорее всего, такие тонкие вещи зависят от структуры мозга в целом, а значит, от взаимодействия большого числа генов. А на «простом уровне» один ген может отвечать только за очень грубые дефекты. К тому же скорее всего тут дело даже не в генах, а в регуляторных механизмах, определяющих, когда и как гены работают. Впрочем, это все не более чем educated guesses (догадки осведомленного человека. — Л..Л.-М.).
Занимаются ли наши компании и/или ученые задачами ускорения секвенирования?
— У нас простого-то секвенирования толком нет (один из академических научных центров уже который год секвенирует бактерию), про ускорение речь вообще не идет. Вот проанализировать чужие данные, это да, это мы умеем, — биоинформатика в России вполне конкурентоспособна.
Михаил Гельфанд,
доктор биологических наук, специалист по биоинформатике