`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Микроскопия как информационная технология

Статья опубликована в №26 (692) от 21 июля

+55
голосов

Если вы считаете, что нынешняя ситуация, когда массовый потребитель голосует своим кошельком за маломощные нетбуки и игровые приставки Wii с относительно простыми графическими картами, а корпоративные заказчики оттягивают обновление компьютерных парков до последнего, свидетельствует о приближении уровня вычислительной вооруженности человечества к точке перенасыщения, то заблуждаетесь. Всегда найдутся приложения, для которых понятие «чрезмерно мощный компьютер» лишено всякого смысла.

Одними из наиболее требовательных к вычислительным ресурсам сферами являются задачи в области изучения фундаментальных научных проблем, исследователи которых предъявляют к компьютерам поистине безграничные запросы. Для ученых каждый цикл закона Мура – это очередной шаг на пути познания. Живым подтверждением такой, возможно, несколько высокопарной фразы станет одна из самых актуальных задач в молекулярной биологии. Собственно говоря, данную статью следовало бы озаглавить «реконструкция строения эукариотической рибосомы методом криоэлектронной микроскопии для "чайников"», но такое название гарантированно отпугнуло бы большую часть читателей, что было бы весьма прискорбно. Поскольку наша тема является редким сочетанием двух качеств: она легко переложима на язык научно-популярной литературы и связана с остроумными вычислительными методами, способными доставить глубокое интеллектуальное наслаждение всем, кто проявляет интерес к сфере ИТ.

Объект исследований

Микроскопия как информационная технология
Современные представления биологов о структуре рибосомы

Жизнь, как известно, есть способ существования белковых тел. Человеческий организм состоит из сотен тысяч различных белков, каждый из которых представляет собой цепочку, выстроенную из сотен либо из десятков тысяч простых звеньев 20 типов, чередующихся в строго определенной последовательности. Этими звеньями служат аминокислоты.

Как белковые молекулы появляются на свет? Сборкой растворенных в цитоплазме аминокислот в белковые цепочки ведает органиод (т. е. внутриклеточный орган), называемый рибосомой. «Программы», определяющие требуемую последовательность аминокислот в собираемом белке, черпаются рибосомой из длинных одномерных информационных молекул (матричных РНК), играющих для нее ту же роль, какую для станка с ЧПУ играют перфоленты, задающие последовательность его операций. Быстродействием рибосома подобна автомату Калашникова: выдавая «очередь» со скоростью 5–30 аминокислот в секунду, она собирает около одной молекулы гемоглобина в минуту. Вообще говоря, частота исполнения рабочего цикла механизма находится в прямой зависимости от его линейных размеров и в обратной – от его сложности. Так что мы можем быть уверены: рибосома сложнее автомата на много порядков.

Эукариотическая рибосома (в отличие от более простой – прокариотической) относится к организмам, чьи клетки имеют ядра. Она состоит из трех молекул РНК и нескольких десятков белков, а общая численность атомов в ней достигает сотен тысяч. Неправильная округлая форма рибосомы имеет в поперечнике около 220 Å (1 Å равен 10-10 м, что примерно соответствует десяти диаметрам атома водорода).

Для адептов нанотехнологий рибосома – наноробот естественного происхождения и залог осуществимости «нанотехнологической программы-максимум», нацеленной на создание механизмов, способных собирать сложные структуры из простых молекул или атомов, а также самовоспроизводиться (см. ko-online.com.ua/33149). В настоящее время ученые имеют весьма смутное представление об устройстве и функционировании рибосом. Но био- и нанотехнологи убеждены: тот, кому удастся разобраться в том, как работает рибосома, будет править миром. Очевидно, необходимой предпосылкой для такого понимания является установление объемной структуры рибосомы с атомарной точностью, т. е. с субангстремным разрешением.

Для определения объемной структуры объектов своих исследований молекулярная биология выработала ряд методов, наиболее результативными из которых являются: рентгеноструктурная кристаллография, ядерно-магнитный резонанс и криоэлектронная микроскопия, которую для краткости мы впредь будем называть «крио-ЭМ». Вопрос о том, в каких аспектах они конкурируют, а в каких – дополняют друг друга, завел бы нас в дебри молекулярной биологии слишком далеко, поэтому ограничимся следующим замечанием: размеры и сложность эукариотической рибосомы в настоящее время позволяют исследовать ее напрямую только последним из названных методов. На нем мы и сосредоточимся.

Программно-аппаратный исследовательский комплекс

Базовые принципы крио-ЭМ, являющейся одной из разновидностей аналитической микроскопии, изложены чуть более 30 лет назад Иоахимом Франком (Joahim Frank) и Марином ван Хилом (Marin van Heel). Тогда же ими были созданы первые в своем роде программные пакеты для ЭМ-реконструкции – SPIDER (System for Processing of Image Data in Electron Microscopy and Related Fields) и IMAGIC.

Сегодня они продолжают развиваться в окружении ряда конкурентов, самым значимым из которых считается EMAN). Несмотря на сходство базовых принципов названных пакетов (каждый из них получает на вход множество микрофотографий и выдает на-гора 3D-модель с более или менее высоким разрешением), выявление лучшего из них проблематично, поскольку приверженность той или иной крио-ЭМ-лаборатории определенному пакету формирует в ней субкультуру с многолетними традициями, сказывающимися на всех аспектах ее работы вплоть до техники подготовки образцов для фотографирования. Основным же инструментом крио-ЭМ служит просвечивающий электронный микроскоп (ПЭМ). В нем, в отличие от оптического, вместо лампы используется электронная пушка. Соответственно роль предметного стекла отводится графитовой пластинке, прозрачной для потока электронов в той же мере, в какой стекло прозрачно для обычного света.

Микроскопия как информационная технология
Titan3 FEI (fei.com) – один из наиболее совершенных в настоящее время просвечивающих электронных микроскопов. Его высота – около 3 м, масса – порядка 3,5 т, цена – около 5 млн. евро. Благодаря наличию компьютеризованной системы установки и позиционирования образцов он способен работать сутками без вмешательства оператора, генерируя поток данных объемом около 1 ГБ/с

Разрешающая способность всякого микроскопа определяется длиной волн, облучающих образец (длинные волны «не замечают» мелких препятствий, вследствие чего наблюдение за ними не позволяет извлечь об этих препятствиях никакой полезной информации). Волновая длина электрона обратно пропорциональна его скорости, так что в электронной микроскопии высоко ценится величина ускоряющего напряжения. В современных ПЭМ она исчисляется сотнями киловольт, и потому во избежание пробоя между электронной пушкой и анодом приходится поддерживать сверхглубокий вакуум (около 10–8 Па).

Отсутствие существенных усовершенствований в конструкции электронных микроскопов со времени их изобретения в 1930-х гг. не говорит о застое в данной области. Проводя параллель между эволюциями технических и биологических систем, заметим, что сходным образом и оптическое устройство глаза остается неизменным со времен появления первых амфибий. Лягушки обладают столь же совершенными глазами, что и мы, однако они плохо ориентируются, проявляют интерес только к движущимся объектам и вообще кажутся подслеповатыми. Основные преимущества зрительной системы человека, выработанные за сотни миллионов лет, отделяющих нас в эволюционном смысле от лягушек, обусловлены мощной «нейронно-вычислительной обвязкой», позволяющей улучшать и интерпретировать визуальные сигналы, а не только регистрировать их.

Растущий с каждым поколением электронных микроскопов уровень их информатизации – тема отдельной статьи. Контуры с обратной связью, управляющие многополярными магнитными линзами для уменьшения аберраций и других дефектов изображения, программируемые узлы позиционирования образцов, а также производительные интерфейсы для связи с компьютерами и системами хранения данных – все это лишь вершина задействованного в современных ПЭМ айсберга цифровой электроники.

Съемка

В вакуумную камеру ПЭМ рибосомы попадают вмерзшими в тончайшую пленку льда, образуемую на поверхности графитовой пластинки после того, как последнюю обмакнут в водный раствор рибосом, а затем – в жидкий этан. Мгновенное замораживание до 100К позволяет получить так называемый аморфный лед, не имеющий кристаллической структуры и потому свободно проницаемый для электронов. Длительность экспонирования образца с рибосомами составляет 0,2–4 с. При 50 000-кратном увеличении за это время изображение иногда ощутимо смещается и размазывается вдоль направления движения (это может происходить, в частности, из-за ничтожных температурных неравномерностей в образце и системе его крепления). Поэтому микроскописты активно исследуют применимость различных принципов цифровой и оптической стабилизации, в том числе и аналогичных тем, что прижились в конструкциях современных фотоаппаратов.

До недавнего времени результаты работы ПЭМ фиксировались исключительно с помощью высокочувствительных фотопленок (которые приходилось проявлять и сканировать для дальнейшей компьютерной обработки). Сегодня все больше исследований ведется с использованием CCD-матриц, ключевые преимущества которых – оперативность и удобство. Плата за комфорт велика: стоимость ПЭМ-совместимых 64-мегапиксельных CCD-фотоэлементов исчисляется сотнями тысяч долларов. Кроме того, по разрешающей способности, чувствительности и широте динамического диапазона пленки пока продолжают оставаться вне конкуренции.

Распознавание частиц

Микроскопия как информационная технология
Одна из множества рибосом, сфотографированные с 50 000-кратным увеличением

Образец дает исследователям 100–400 фотографий, на каждой из которых во всевозможных ракурсах изображено 500–3000 проекций рибосом (или иных изучаемых объектов, которые на профессиональном жаргоне микроскопистов называются частицами). Следовательно, в типичном случае база проекций, участвующих в реконструкции рибосомы, исчисляется десятками и сотнями тысяч изображений.

Как можно почувствовать, взглянув на иллюстрацию с изображением микрофотографии, идентификация рибосом – задача куда более сложная, чем OCR. Его нечеткость вызвана зашумленностью, обусловленной малым уровнем полезного сигнала (желая уберечь образец от разрушения, его стараются облучать как можно меньше, так что на 1Å2 его поверхности приходится всего 10–20 электронов). Дело осложняется тем, что в рамках описываемого метода контрастность изображения и его резкость являются взаимоисключающими. Происходит это потому, что прохождение через образец, отличающийся очень малой плотностью, воздействует только на фазу электронов. Фотопленки же и CCD-матрицы, доступные исследователям, позволяют судить исключительно об амплитуде. Поэтому попытка снять фотографию точно в фокальной плоскости привела бы к получению равномерно засвеченного серого изображения, не несущего полезной информации. Проблема решается путем намеренного нарушения фокусировки – ценой ухудшения резкости, оно вызывает интерференцию электронов, проходящих через смежные участки образца. Получаемое при этом изображение возникает вследствие перераспределения энергии излучения, при котором противофазные электроны ослабляются, а синфазные – усиливаются, и напоминает результат применения известного пользователям Photoshop фильтра Find Edges.

В течение всего времени существования технологии крио-ЭМ микроскописты бились над автоматизацией распознавания частиц, пытаясь приспособить к решению этой задачи едва ли не каждый из методов, известных в теории обработки и сегментации изображений – от клеточных автоматов до нейронных сетей. До недавнего времени их усилия оставались тщетными, и ученые были вынуждены указывать положение частиц на фотографиях вручную, посвящая этой на редкость монотонной работе астрономическое количество человеко-часов (напрашивающемуся внедрению технологии crowdsourсing препятствует отсутствие достаточного числа исполнителей, знакомых с азами молекулярной биологии). Сегодня рабский труд стал пережитком прошлого: ведущим лабораториям мира, конкурирующим за лидерство в области крио-ЭМ, удалось автоматизовать отбор частиц с помощью различных «фирменных» алгоритмов эвристического характера, а также повышения устойчивости последующих вычислительных этапов к ошибкам распознавания. Впрочем, у ученых нет иного выхода, кроме автоматизации: возросшая мощность компьютеров привела к появлению крио-ЭМ-проектов, вовлекающих миллионы проекций, и ручной отбор такого количества частиц стал невозможным по вполне объективным причинам.

От 2D к 3D

Теоретической базой восстановления трехмерных структур объектов по их двухмерным проекциям служит интегральная геометрия, начало которой положено работой австрийского математика Иоганна Радона (Johann Radon), в 1917 г. изобретшего так называемый метод обратной проекции, в наши дни входящий в широкий обиход по мере распространения медицинской томографии. Опустив некоторые технические детали, задачу восстановления 3D-структуры по множеству N ее проекций можно разбить на четыре пункта:

  1. Вычисление быстрого 2D-преобразования Фурье для каждого из исходных изображений.
  2. Суперпозиция полученных результатов методом обратной проекции в объеме воксельного куба. Этот этап, почти не требующий вычислительных ресурсов, позволяет избавиться от шумов в исходных данных за счет их усреднения.
  3. Вычисление быстрого обратного 3D-преобразования Фурье от полученного результата.
  4. Визуализация содержимого воксельного куба. Бесплатный пакет Chimera, а также его аналоги позволяют выполнять эту операцию в интерактивном режиме (читателям, желающим углубить свои представления о теме статьи, стоит начать с посещения страницы cgl.ucsf.edu/chimera/).

В типичном для современной крио-ЭМ-практики случае множество N состоит из 20 тыс. изображений в градациях серого с 16-битовой цветовой глубиной и разрешением 512×512, а ребро куба составляет 512 вокселей. На обычном офисном ПК с обработкой такого объема данных можно управиться за пару часов. Почему же крио-ЭМ-лаборатории, оснащенные собственными суперкомпьютерами, постоянно страдают от дефицита вычислительной мощности? Дело в «мелочи»: расчет обратной проекции предполагает знание углов проецирования, т. е. обладание изначально недоступной информацией о положении, в котором мгновенное охлаждение застигло каждую из частиц, прервав ее хаотичное броуновское движение. Восстановление этой информации с помощью предложенного Франком и ван Хилом итеративного процесса – самая сложная из задач крио-ЭМ. Объем вычислений, поглощаемых ею в рамках типичного современного проекта, связанного с исследованием рибосом, исчисляется петафлопами.

Микроскопия как информационная технология
Рибосома собаки, реконструированная с разрешением 8,7 Å

Рассмотрим этот процесс (опять-таки, опуская технические детали). Он начинается с заполнения воксельного куба так называемыми референсными данными, представляющими рибосому в огрубленном виде. Очередная итерация – вычисления нескольких сот изображений, представляющих собой проекции текущего содержимого воксельного куба в различных направлениях. Это множество синтезированных проекций обозначим M. Оценка ориентации частицы, показанной на исходной проекции n, осуществляется путем подбора наиболее похожего на нее изображения m из группы M. В ходе сопоставления всевозможных пар (m, n) для каждого изображения n вычисляется тройка значений (∆x, ∆y, ?), указывающих относительные смещения и угол поворота, позволяющих достичь его наилучшего совпадения с изображением m. Эта операция, называемая выравниванием (alignment), выполняется крио-ЭМ-программами очень часто и поглощает около 90% используемого ими процессорного времени. Для микроскопических объектов вроде вирусов, обладающих осевой и другими видами симметрии, выработаны эффективные методы ускорения выравнивания, однако рибосома к таким объектам не относится.

Исходные проекции, оказавшиеся непохожими ни на одну из синтезированных, отбраковываются (поскольку на них, по всей видимости, изображены посторонние объекты, отобранные по ошибке). Остальные исходные проекции используются для вычисления уточненной 3D-структуры (см. 2-й и 3-й этапы в описании метода обратной проекции). После этого процесс начинается снова и повторяется десятки или сотни раз – до тех пор, пока выравнивание не перестанет улучшать качество 3D-структуры (косвенным признаком этого можно считать стабилизацию суммарной меры сходства между исходными и синтезированными проекциями).

За первой серией итераций обычно следуют другие, каждая из которых отличается от предшествующей более высокими 2D- и 3D-разрешениями, а также более тонкими настройками, используемыми при выравнивании. В настоящее время лучшие из достигнутых крио-ЭМ-реконструкций эукариотической рибосомы имеют разрешение около 6,5 A, тогда как теоретический предел данного метода оценивается десятыми долями ангстрема.

Перспективы

Из приведенного описания нетрудно заметить, что основной итеративный цикл предоставляет массу возможностей для применения компьютеров с параллельной архитектурой. Основной трудностью при этом является организация эффективного параллельного доступа к значительным объемам данных. Недавно крио-ЭМ пополнила перечень задач, считающихся перспективными для решения с помощью технологии CUDA, открывающей доступ к вычислительным ресурсам графических ускорителей.

Важным направлением развития крио-ЭМ является также адаптация метода для обработки гетерогенных образцов, содержащих разнородные частицы. Примером могут служить рибосомы, остановленные замораживанием на различных стадиях рабочего цикла. В этом случае в реконструируемую модель вводится дополнительное измерение – время, а результаты каждого очередного обратного проецирования могут быть основой не для одной, а для нескольких итераций, задействующих разнесенные по времени подмножества N. Результаты обратных проекций образуют древовидную структуру, листья которой выстраиваются в анимационную последовательность. Такие проекты очень ресурсоемки даже по принятым в крио-ЭМ высоким меркам: общее количество итераций исчисляется в них тысячами, а количество исходных проекций – миллионами.

Добро пожаловать в «Матрицу»?

Научные и популярные публикации обычно пестрят бликующими и переливающимися всеми цветами радуги изображениями рибосом и вирусов, реконструированных с помощью крио-ЭМ или других методов. Рассматривая такие картинки, зрелищность которых заставляет вспомнить о голливудских спецэффектах, легко забыть, что в действительности показанные на них объекты не имеют никакого отношения ни к бликам, ни к цветам. Вспомним упомянутый выше блокбастер, повествующий о погружении всего человечества в марево виртуальной реальности. Не следует ли признать, что его сюжет довольно близок к реальности? Ведь современные представления человечества о фундаментальных принципах мироздания базируются на образах, высчитанных и визуализованных посредством сложнейших алгоритмов (в основе которых, в свою очередь, лежат абстрактные и зачастую спорные теоретические посылки). И потому стоит ли удивляться, если несколько циклов Мура спустя почерпнутые вами из этой статьи представления об облике рибосом существенно изменятся.

+55
голосов

Напечатать Отправить другу

Читайте также

На середине статьи понимаешь, что называется все же
"Реконструкция строения эукариотической рибосомы методом криоэлектронной микроскопии" - но поздно, дочитать интересней.

Хотел немного добавить теории о микроскопии:
Микроскопия - метод исследования микромира (энциклопедия)
Но похоже технологии умчались на нынешнее время так далеко, что нужно подписать комментарий: "История развития микроскопии"

Спасибо за информативное дополнение.

А правильную подпись действительно придумать непросто. В этой связи можно еще пофилософствовать об уместности греческого корня "скопео" ("смотрю") применительно к современным методам микроскопии. Эти методы ведь как правило уже не позволяют "смотреть" непосредственно на объект исследований. Вернее было бы сказать, что они позволяют оценивать истинность наших представлений о том, как этот объект устроен...

Спасибо за столь интересную статью. Надеюсь, у вас ещё есть в запасе несколько тем по НРС-вычислениям ;)

достаточно интересно

...обусловленной малым уровнем полезного сигнала (желая уберечь образец от разрушения, его стараются облучать как можно меньше, так что на 1 м2 его поверхности приходится всего 10–20 электронов).

Тезис неразрушающего контроля мне понятен, но единицы измерения кажутся смехотворными ~10/(1 m2).

Какова разрешающая способность такого исследовательского метода? Примитивная оценка говорит что 10-20 электронов на 1 кв.м не могут дать разрешениене принципиально лучше чем 1/4 метра вне зависимости от уникальности научного прибора и природы объекта исследования.

Давайте сделаем оценку на «кончике пера»: характерный период решетки в твердом теле около 2-5 Å [1 ангстрем = 10-10m], т.е. (2÷5)*10-10m. Это автоматически означает, что на квадратный метр поверхности приходится ~4000000000000000000 (!) атомов. Безусловно биологические молекулы очень больше и на одном квадратном метре их будет меньше чем 4*1018. Но всего 10-20 электронов пусть на 1014 ÷ 1018 атомов...

Какого же размера был исследуемый образец?

PS. Для кристаллического кремния с его относительно сложной 'алмазной' решеткой элементарная ячейка имеет размер 5,4307 Å.

Вы совершенно правы в своих подозрениях! В текст вкралась досадная опечатка: вместо 1м2 следует читать 1A2.

ещё лучше чем "квадратный ампер" может быть только «кубический кулон»

или это ангстрем квадратный (Å2)? если это ангстрем, то впервые встечаю такую единицу измерения - допустима, но на практике не применяется

Опять-таки вы совершенно правы, 1Å2
Вот картинка на случай каких-нибудь проблем со шрифтами

Что же тут может препятствовать применимости?

Абсолютно ничего не препятствует, просто на практике не встречается.

за 10 лет моей работы в научно исследовательском центре электронно-зондового микроанализа единицу измерения "квадратный ангстрем" не встретил ни разу... ;-)

Скажем, квадратный вершок допустим как единица измерения, но фиг ты его встретишь :)

Яндекс в ответ на "квадратный вершок" находит 337 страниц!:)

ага! и аж ни разу в научном контексте ;-)

увы, журнал Nature (это настоящий бренд научной литературы) такое не опубликует ;-(

PS.
'кубических вершков' Яндекс просто не жалеет - более 500, но "кубическая верста" ему не по зубам ))))))))))))

Происходит это потому, что прохождение через образец, отличающийся очень малой плотностью, воздействует только на фазу электронов.

«прохождение ... воздействует»?

далее еще есть "конфузы", но это не ухудшает моего впечатления от прочитанного :)
+1

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT