3D-дисплеи: обзор технологий по состоянию на 2001 г.

19 октябрь, 2008 - 04:00Павел Молодчик

Основательная и сохраняющая актуальность статья Сергея Митилино из "Компьютерного Обозрения" от 12 сентября 2001 г. может послужить дополнением ко вскоре планируемой публикации на схожую тему (в блог она попала потому, что мне пришлось ее распознавать: семь лет назад в электронном виде размещалась лишь малая часть наших публикаций).

Трехмерные дисплеи: обзор технологий

В области средств визуализации есть одно интересное направление — так называемые трехмерные дисплеи. До сих пор подобные продукты многими воспринимаются как некий изыск. Однако на самом деле возможности этих устройств уже сейчас позволяют разглядеть в них очертания мониторов будущего. Да и сегодня на эти продукты возложено выполнение вовсе не второстепенных функций в многочисленных промышленных и конструкторских приложениях.

На протяжении последних лет было сделано несколько попыток внедрить устройства, дающие нам визуальные ощущения реальной объемности. Сначала появились «сверхпопулярные» шлемы от компании VHX, затем обрели широкое распространение очки с жидкокристаллическими затворами. Если же припомнить раннее детство средств визуализации трехмерных образов, то первенство принадлежит, конечно, изображениям-стереопарам с разделением по цвету и очкам с цветными светофильтрами. Однако уровень всех вышеперечисленных технологий невысок. Мало того, что ношение подобных устройств причиняет серьезный дискомфорт и может приводить к временным нарушениям зрения и вестибулярного аппарата, но и эффекта присутствия с их помощью, честно говоря, достичь сложно. Да и в промышленности и коммерции продукция новоявленных «королей трехмерных пространств» своего места не нашла, даже внедрение на рынок развлечений не вполне удалось. Частично неудачу можно объяснить несвоевременностью анонса: еще несколько лет назад разрешение изображений было невелико, а трехмерные игры в своей основной массе использовали спрайты. Тем не менее серьезные научно-исследовательские коллективы продолжали упорно продвигаться к намеченной цели и создали немало оригинальных решений. Краткий обзор разрабатываемых сегодня технологий мы и предлагаем вашему вниманию.

Основная проблема

Особенность бинокулярного механизма человеческого зрения заключается в его способности адаптироваться к различным ситуациям реального мира. Разработчикам приходится прикладывать массу усилий, чтобы «обезвредить» хотя бы основные проявления этих «приспособленческих» функций. Чем более изощренные способы использует природа для реализации наших чувств, тем более сложным оказывается моделирование псевдоестественной среды.

Человек оценивает расстояние до объекта и его габариты по расстоянию между проекциями его изображения на сетчатках правого и левого глаза. Выделить изучаемый объект из разнородного окружения позволяет фокусирование по глубине — аккомодация, изменение формы хрусталика глаза. Операция сравнения расположения проекций возможна лишь до тех пор, пока дистанция между ними находится в определенных пределах. Расширить диапазон различаемых расстояний удается с помощью функции конвергенции, поворачивающей глазные яблоки на необходимый угол. Аккомодация и конвергенция напрямую связаны между собой, что становится причиной появления чувства дискомфорта, напряжения и неестественности у пользователей большинства современных трехмерных дисплеев. Чтобы воссоздать реальную глубину и объем, придется изготовить устройство, сопоставимое по размерам с отображаемыми объектами, что, конечно же, нереально. Поэтому сейчас разработчики активно ищут способ «обмануть» глаза и эмулировать необходимые для комфортного просмотра характеристики изображения.

Стереоскопические технологии

Этот класс методик наиболее прост как для разработки, так и для понимания. В их основе лежит принцип: «Каждому глазу свое изображение». Широкое распространение получил анаглиф, или разделение по цветам с помощью очков, в которых вместо стекол установлены цветные светофильтры. Используя для одного из изображений красный цвет, а для другого — синий и зеленый, удается получать объемные монохромные картинки. Цветные светофильтры отсекают лишнюю информацию, и каждый глаз видит только адресованное ему изображение. Многие баловались такими вещами еще в раннем детстве. Впрочем, это относится и к пристальному разглядыванию ассоциативных трехмерных картинок, состоящих из множества, на первый взгляд, беспорядочно разбросанных точек. Правда, изучение анаглифических стереопар представляет собой сомнительное удовольствие.

Более комфортной для зрения является методика с разделением по поляризации: два дисплея или проектора снабжаются поляризационными фильтрами с перпендикулярными направлениями векторов поляризации. Изображения объединяются с помощью полупрозрачного зеркала, а пользователь должен надеть очки с поляризационными фильтрами. Если применяется видеопроектор, то очень многое зависит от экрана: он должен сохранять оригинальную ориентацию вектора поляризации падающего света. Например, приемлемыми являются отражающие экраны, выполненные из алюминия с направленно-рассеянной характеристикой отражения, и матовые экраны из листового стекла, работающие на просвет.

Относительно недавно появились ЖК-дисплеи, которые сблокированы с матричными фильтрами. Пикселы, предназначенные для правого и левого глаза, располагаются за участками фильтра, придающими свету различную поляризацию. При этом наблюдателю, конечно же, необходимы специальные очки. К сожалению, до 60% света поглощается фильтрами, соответственно, требуется повышенная яркость экрана.

Следующая технология с разделением по времени стала по-настоящему популярна лишь в последние годы, изделия на ее основе лежат буквально в каждой третьей коробке, украшенной логотипом «ЗD-ускоритель». Очки с жидкокристаллическими затворами -это неплохой способ без особых затрат получить иллюзию трехмерности. Человеческий глаз не замечает событий, сменяющихся быстрее, чем за 50 мс, и наивно объединяет два изображения, показанных каждому глазу в отдельности, в объемную картину. Вертикальная развертка монитора (видеокарты) должна быть синхронизирована с выводом соответствующих частей изображения и, естественно, переключением LCD-ячеек, играющих роль шторок, заслоняющих по очереди левый и правый глаз пользователя. Изготовители таких систем часто прибегают к различным уловкам — к примеру, левый и правый кадр выводятся во время обновления четных и нечетных строк при чересстрочной развертке.

Наиболее удобную возможность для реализации стереоскопии с разделением во времени предоставляют видеоадаптеры с поддержкой двойной буферизации. Впервые этот трюк был выполнен на базе рабочей станции Silicon Graphics, u reперь методика доступна любому состоятельному игроману. Изначально двойной буфер предназначался для повышения качества изображения: в то время пока ускоритель прорисовывает очередной кадр во втором буфере -зритель наблюдает предыдущий из первого. Возможность быстрого переключения между буферами — ключ к успешной демонстрации стереопар.

Разделение во времени обеспечивает отличную передачу цветов, однако результирующая яркость значительно снижена, также проявляется сильное взаимовлияние между кадрами стереопары. Причина заключается в долгом послесвечении зеленого фосфора в трубках CRT-мониторов, являющихся основным элементом в этой технологии. Стандартная разновидность фосфора с зеленым свечением дает перекрестную наводку до 20%, а использование веществ с более коротким периодом послесвечения приводит к существенному снижению яркости — до 50%. Частично дилемму удалось разрешить специалистам Tektronix, предложившим объединить жидкокристаллические затворы с монитором. Во-первых, облегчается «участь» зрителя, который получает более легкие и дешевые очки с пассивными поляризационными фильтрами. Фактор стоимости начинает играть значительную роль в случае многопользовательских систем. Во-вторых, благодаря разделению затвора на несколько независимых частей становится возможным показывать каждому глазу только ту часть изображения, которая предназначена именно ему. Для пятисегментного затвора взаимовлияние между стереопарами снижается до 3,6% даже в случае использования стандартного фосфора.

Теперь мы подошли к описанию наиболее простого, на первый взгляд, способа генерации трехмерных изображений: дисплеи с пространственным разделением стереопары. Именно к этой категории относятся столь известные на нашем рынке изделия компаний VHX и iGlasses. Чтобы быть абсолютно точным, необходимо заметить, что «шлемы и очки виртуальной реальности» представляют лишь одну разновидность технологий пространственного разделения crepeoпap, a именно Head Mounted Display (HMD). Каждый глаз благодаря системе линз видит свой собственный миниатюрный монитор, вмонтированный в массивную оправу или шлем. Возможны два варианта: изолированный, когда человек не может видеть ничего, кроме изображения, и открытый, с полупрозрачным экраном, когда пользователь не теряет визуального контакта с окружающим миром. Обычно HMD-устройства содержат и датчики положения, позволяющие отслеживать движения головы пользователя. Именно в механизме контроля движений заключены все преимущества и недостатки подхода. Являясь недостаточно точным, он часто вызывает неадекватную реакцию системы, однако отсутствие механизма обратной связи приводит к нежелательному мышечному напряжению в результате неестественного положения головы пользователя. Кроме того, вследствие ограничений по массе и размерам носимые решения в основном страдают от низкого разрешения. Этого недостатка лишены дисплеи BOOM (Binocular Omni-Orientation Monitor): массивные устройства высокого разрешения закрепляются на подвижном манипуляторе с шестью степенями свободы. Человек контролирует положение дисплея руками примерно так, как обычно наводят на цель бинокль или пляжный телескоп.
В обеих вышеописанных реализациях в полной мере дает о себе знать отсутствие связи между аккомодацией и конвергенцией: глубина всех точек изображения зафиксирована в одной плоскости, которую можно с помощью оптики искусственно разместить на любом удалении. В японской лаборатории ATR Labs создали новый вариант HMD с дополнительными «передаточными линзами» (relay lenses), контролируя которые система в состоянии динамически подстраивать воображаемую дистанцию до изображения (рис. 1). В сочетании с отслеживанием положения зрачков (gaze tracker) становится возможным «предлагать» глазу то расстояние до предмета, которое соответствует конвергенции.

3D-дисплеи обзор технологий по состоянию на 2001 г.


Автостереоскопические методики

Автостереоскопия подразумевает отсутствие специальных вспомогательных устройств — «костылей», которые позволяют свершиться обману. Следовательно, здесь все оборудование, необходимое для разделения стереоскопических пар изображений, сконцентрировано вокруг дисплея.

Наиболее хорошо изученный способ воспроизведения объемного пространства — голография. Но если голографическое слайд-шоу еще можно реализовать на основе базовых принципов этой технологии, то движущиеся и, тем более, не существующие в природе объекты отобразить уже не удастся. Дальше всех продвинулись в демонстрации голографического видео две группы исследователей: в одну из них входят лучшие специалисты ряда японских институтов, в другую — ученые из всемирно известного Массачусетского технологического. Японцы пытаются воспроизводить голограммы с помощью жидкокристаллических экранов. Недостаточно высокое разрешение LCD-панелей заставило их использовать множественные конфигурации и устройства сведения для объединения различных частей голограммы. Поток данных, требуемый для воссоздания полноценного образа, достигает ~1 Tbps. Как хранить и тем более передавать такое невероятное количество информации, не знает никто. Монохроматическая голограмма с площадью проекции 1 см2 — это пока максимум, чего удалось добиться исследователям.
Американцы решили подойти к задаче с другого конца: они пытаются научиться выводить сгенерированные компьютером изображения. Голограмма формируется с помощью акустооптического модулятора: луч лазера модулируется акустическими колебаниями, воздействующими на кристалл, который расположен перед фокусирующей линзой (рис. 2). Прорисовка изображения выполняется двумя подвижными зеркалами (вертикальной и горизонтальной развертки). Для монохромной картинки размером 15 х 15 х 20 см требуется поток данных около 2 гигапикселов в секунду. Ученые планируют увеличить объем изображения за счет объединения нескольких подобных подсистем.
3D-дисплеи обзор технологий по состоянию на 2001 г.


Голограмма — самый совершенный, но отнюдь не самый простой способ получения автостереоскопического изображения. Необходимость применения лазеров для съемки и воспроизведения привносит дополнительное неудобство. Однако уже давно существует автостереоскопическая технология, о которой можно с полной уверенностью сказать: «дешево и сердито». Она основана на применении экранов особой формы и называется «объемной» (volumetric displays). Чтобы нарисовать объемную картину, необходимо распределить наносимые точки в пространстве не только по осям X и Y, но и по глубине. Когда мы говорим о проекции, то подразумеваем обозначение пикселов на экране с помощью луча света. Следовательно, требуется непрозрачный объемный экран. Вроде бы нонсенс, но инженеры «опять выкрутились», изготовив поверхность в виде спирали или винта Архимеда. Когда она очень быстро вращается (около 10 об/с), создается иллюзия объема, на котором можно рисовать изображение. В ходе экспериментов были созданы экраны диаметром 91 см и высотой 46 см. Количество цветных пикселов в одном кадре достигало 40 тыс.

Следующая технология вновь эксплуатирует обычную катодную трубку. С ее помощью последовательно демонстрируются кадры, соответствующие различной глубине. Пользователь наблюдает трехмерную картину посредством сферического зеркала с динамическим фокусом, которое синхронно со сменой кадров меняет свою форму. Эволюции повторяются с частотой 30 Hz. Обычно зеркало представляет собой металлизированную мембрану, колеблющуюся под воздействием акустических волн. Любые изменения его оптических параметров в процессе колебаний компенсируются трансформацией изображения на мониторе. Разрешение по глубине существенно ограничено упомянутой ранее проблемой послесвечения фосфора. Кроме того, пикселы, визуально находящиеся «ближе» к наблюдателю, не в состоянии «заслонить» собой пикселы более «далеких» планов, и, как следствие, изображение получается полупрозрачным. Таким образом, область применения данной техники не простирается дальше воспроизведения каркасных моделей.

Существуют и менее традиционные подходы к автостереоскопии, например с использованием флуоресцентного газа, свечение которого возбуждается двумя инфракрасным лазерными лучами. В лабораториях проектируют и более экзотические устройства на основе вращающихся или линейно движущихся LCD-панелей.

Помимо методики разделения во времени широкую известность получила группа технологий пространственного разделения стереопар. В данном случае правило «очевидность — следовательно, простота» не действует. Несмотря на это, с примитивными примерами реализации пространственного разделения в автостереоскопии большинство из нас познакомились еще в детстве. Во всяком случае, с рефракционным. Но сначала о принципе, который называется дифракционным оптическим. На дисплей накладывают матрицу из миниатюрных дифракционных решеток, отклоняющих свет, исходящий от соседних пикселов, в разные стороны (рис. 3).

3D-дисплеи обзор технологий по состоянию на 2001 г.


Куда более сложен для понимания метод голографических оптических элементов (НОЕ). Сначала изготовляется голограмма рассеивающей поверхности в двух положениях. Между экспозициями поверхность горизонтально сдвигается на расстояние своей длины. Плоскость будущей голограммы разделяется на вертикальные полосы, которые частично заслоняются: в первый раз четные, затем нечетные. Полученную голограмму накладывают поверх LCD-панели, на которую перемежающимися полосами выводятся изображения, составляющие стереопару. Лучи света, испускаемые пикселами дисплея, дифрагируют на голограмме и отклоняются в необходимую сторону. Общей особенностью двух вышеописанных технологий является ограниченность поля зрения — пользователь, оказавшийся за границами нормального восприятия, увидит обыкновенное двухмерное изображение.

Сторонники рефракционной методики попытались преодолеть этот недостаток механическим путем. Например, линзово-растровый дисплей (lenticular imaging) подобен голографическому и состоит из множества вертикальных линз. Изображения, предназначенные для правого и левого глаза, также чередуются полосами (рис. 4).

3D-дисплеи обзор технологий по состоянию на 2001 г.

Для правильного воспроизведения цветов требуется соответствующее расположение полос цветных светофильтров. К тому же, если смещения головы пользователя в горизонтальном направлении еще как-то учитываются системой, то малейшие вертикальные движения способны разрушить иллюзию. Линзово-растровые дисплеи обычно снабжаются механизмом контроля положения головы зрителя. Пластина с линзами механическим образом движется, компенсируя смещение точки зрения (только фронтальные и горизонтальные). Согласно другому способу компенсации за каждой вертикальной линзой размещается множество пикселов, отвечающих за формирование правой и левой составляющей стереопары. Был предложен и программный способ управления линзово-растровым дисплеем, согласно которому различные перспективные виды отображаются последовательно во времени, при этом жидкокристаллическая шторка заслоняет неиспользуемые в данный момент полосы экрана.

Еще одна «вариация на тему» — двойной линзово-растровый дисплей. Он приспособлен для оснащения стерео-проекционных систем. В случае задней проекции две пластины с вертикальными линзами прецизионно выставляются строго друг напротив друга так, чтобы лучи света от правого проектора, пройдя через них, попадали только в правый глаз, а от левого — только в левый. Чтобы обеспечить работу нескольких пользователей, устанавливают большое количество стереопроекторов (до 40). Поскольку каждый луч света проходит через несколько соседних линз, то формируется сразу несколько смежных зон просмотра (рис. 5).

3D-дисплеи обзор технологий по состоянию на 2001 г.


В системах с полевыми линзами (field-lens display) два проекционных LCD-экрана подсвечиваются через полевые линзы. Линзы коллимируют пучок света, придавая более высокую четкость результирующему изображению. Экраны расположены перпендикулярно друг к другу (рис. 6), между ними находится устройство сведения лучей (диагональное полупрозрачное зеркало). Оригинальный дисплей на основе полевой линзы разработан в институте Генpиxa-Херца (Heinrich-Hertz-Institute) в Берлине. Стереопроектор фокусирует изображение прямо в воздухе за линзой, и фокус проектора изменяется в соответствии с отслеживаемыми движениями зрачков (рис. 7). Таким образом, поддерживается естественная связь между аккомодацией и конвергенцией. Естественная глубина фокусирования глаза эмулируется также с помощью динамической фильтрации изображения.

3D-дисплеи обзор технологий по состоянию на 2001 г.

3D-дисплеи обзор технологий по состоянию на 2001 г.


Решение фирмы Xenotech обеспечивает довольно широкое поле зрения для традиционной проекционной технологии. Отклоняющееся вдоль вертикальной оси полупрозрачное зеркало сопряжено со стереопроектором и закреплено на двигающейся по горизонтали платформе (рис. 8). Поток света, испускаемый проектором, сначала дважды отражается от стационарных зеркал, затем попадает на подвижное полупрозрачное зеркало и, отразившись от ретрорефлективного экрана (retro-reflective screen), проходит сквозь полупрозрачное зеркало в направлении зрителя. Для управления зеркалом и платформой применяются системы отслеживания положения головы.

3D-дисплеи обзор технологий по состоянию на 2001 г.


Целая группа методик основана на принципе окклюзии. Идея очевидна: вовремя закрывать или постоянно заслонять изображение для левого глаза от правого и наоборот. Их преимущество в относительной дешевизне производства и простоте реализации полностью электронного управления. Например, перед жидкокристаллическим дисплеем размещают панель, в которой есть множество миниатюрных вертикальных заслонок такого размера, что они разделяют ряды пикселов, представляющих правый и левый кадры изображения (рис. 9). Единственная проблема связана с полем зрения — образуется целый набор прилегающих друг к другу зон трехмерного видения, однако лишь в половине из них правый и левый кадры попадают в соответствующие глаза. Стоит пользователю переместиться в соседнюю зону, и он получает «инвертированную» трехмерную картину. Поэтому подобные системы всегда снабжают устройством отслеживания положения головы, по сигналу которого происходит смена порядка следования кадров.

3D-дисплеи обзор технологий по состоянию на 2001 г.


Dimension Technologies принадлежит практически противоположная идея — в дисплее с параллаксным освещением (parallax-illumination displays) для paздeления правого и левого изображения, которые чередуются вертикальными полосами, используется множество тончайших линейных источников света (рис. 10). Формирование освещения — задача пластины с множеством вертикальных «полосок» линз. Относительное расположение источников выбрано таким образом, чтобы каждый глаз мог видеть только четные или нечетные полосы. Естественно, что на экране с разрешением 1024 х 768 стереопара будет иметь размеры 512 х 768.

3D-дисплеи обзор технологий по состоянию на 2001 г.


Согласно другому варианту — два набора аналогичных мигающих источников света дают две раздельные зоны отображения. При их быстром переключении создается иллюзия изображения в полном разрешении. Более простую схему с единственным продольным источником света реализуют, наложив поверх обычной ЭЛТ жидкокристаллический затвор, на котором программным образом прорисовывается пробегающая по экрану с частотой 60 Hz прозрачная «прорезь» (рис. 11). Каждое смещение прозрачной области на затворе соответствует демонстрации одного из изображений, входящих в несколько стереопар. Полноценная картина формируется с помощью набора линз. При этом зона видения каждой из них строго ограничена. В Кембриджском университете создали прототип, который способен отображать до 16 отдельных видов, соответственно частота развертки CRT-монитора составила около 800 Hz (16 х 50 Hz). Пользователь подобной системы может свободно перемещаться перед экраном, открывая для себя тем самым новые стереопары и новые перспективы. Наиболее существенный недостаток технологии виртуальной щели заключается в повышенных требованиях к характеристикам электронно-лучевой трубки монитора. В университете Нагоя (University of Nagoya) разработали особую конструкцию ЭЛТ с несколькими электронными пушками, каждая из которых обслуживает свою полосу на общем экране. А немецкие исследователи сконструировали Holotron без использования линз. Они отображают непосредственно за щелью смесь перемежающихся колонок, принадлежащих всем генерируемым видам. Горизонтальное отклонение электронных лучей ограничено генерируемой в данный момент частью изображения. Для повышения быстродействия был создан вариант с несколькими электронными пушками и несколькими движущимися щелями.

3D-дисплеи обзор технологий по состоянию на 2001 г.


«Что же из этого следует?...»

Невероятное количество непохожих друг на друга технологий эмуляции трехмерных изображений говорит об отсутствии безусловного лидера при очевидном желании исследователей найти решение проблемы. Ситуация на рынке еще хуже и запущеннее, чем дела лабораторные. Компании приобретают за невероятные деньги абсолютно экзотические разработки, которым иногда и года не исполнилось. И это при том, что далеко не всегда очевидна выгода от их
применения (как зачастую происходило с покупкой шлемов VFX — эффект присутствия ощущался не сразу и не всеми). Пока технологии воспроизведения объемных изображений смахивают на «заклятия колдунов»: кто-то верит, чувствует, и ему «помогает», другие не могут взять в толк — что они здесь нашли?

Конечная цель этих исследований понятна, ведь преимущество трехмерного изображения над плоским аналогично преимуществу объемного звука над одиночным источником, и заключается оно в возможности донести до человека больший объем информации в краткие сроки, не рискуя перегрузить его органы чувств или мозг. Мы привыкли оперировать в трехмерном пространстве и получаем в обыденной жизни существенно больший поток информации, нежели нам позволяет увидеть монитор нашего ПК. Возможности своего мозга человек использует только на 4%, и то же пока относится к нашим органам чувств.