В исторической перспективе нынешние средства компьютерной обработки изображений займут свое место в одном ряду с фото, живописью и иными методами отображения действительности, изобретенными человечеством. Вероятно, в будущем досадные дефекты компрессии JPG/MPEG станут такой же характерной особенностью для начала XXI века, как лубочные картинки -- для начала века XIX.
Доводы разума убеждают нас, что до 1917 г. розы были не менее красными, чем теперь,
а небо -- не менее голубым. И все же, тогдашняя действительность упрямо предстает
перед нашим внутренним взором в виде мельтешащих кадров черно-белой кинохроники.
Поэтому посетителям
виртуальной
галереи цветного фото времен российской империи приходится искусственно подстегивать
собственное воображение, чтобы убедить себя в истинной документальности экспонатов.
|
Между лубочной живописью и алгоритмами
компрессии больше общего, чем может показаться на первый взгляд! Обратите внимание
на грубые погрешности в слое цветовой информации
|
Хронология прогресса в области визуальных технологий заставляет нас связывать
течение времени с набором стереотипных зрительных образов: зашумленные записи
на "осыпающихся" видеокассетах возвращают нас к событиям десятилетней
давности; выцветшие цвета киноленты -- на четверть века назад; им предшествует
суровый черно-белый век. Долюмьеровская эпоха видится нам в серо-коричневых дагеротипах,
в трещинах фресок и портретов, написанных маслом. Смутные тени коллективной памяти
человечества угадываются в образах наскальной живописи... Более ранние события
прошлого тонут во тьме доисторического безвременья: мы не можем себе представить
того, чего не видели, и наше воображение утрачивает опору.
Сегодняшние технологии визуализации вплотную приблизились к революционному рубежу,
за которым человечество рискует столкнуться с безвременьем иного рода: наша память
перестает устаревать. Запечатленная на "вечных" цифровых носителях,
лишенная артефактов квантизации и компрессии хроника не только становится неподвластной
времени, она перестает отражать его течение. Так сбывается зловещее пророчество
средневековых схоластов о конце света: "время было, время есть, но времени
не будет". К примеру, в 2075 г. вряд ли найдется эксперт, способный отличить
видео, повествующее о младенческих годах его прадедушки, от аналогичного фильма
о себе самом: ведь оба сюжета, вероятно, будут сняты в бескомпромиссно высококачественном
разрешении телевидения высокой четкости (ТВЧ) 1920 x 1080 с прогрессивной разверткой.
Сегодня камеры для таких съемок могут позволить себе лишь кинопродюсеры-мультимиллионеры
вроде Лукаса, однако лет через десять неумолимые законы Мура обязательно превратят
их в товар широкого потребления. Уже нынешнее поколение "полупрофессиональных"
цифровых камер, нередко оснащаемых мегапиксельными CCD-матрицами (пока они используются
лишь для работы в режиме фотоаппарата) и поддерживающих прогрессивную развертку,
заметно перерастает исходные спецификации DV-формата. Здесь уместно вспомнить
также о новейшем комплексе мультимедийных технологий Windows Media 9 Series, ранее
известном как Corona, разработанном Microsoft для внедрения ТВЧ-разрешения при
минимальных модификациях существующих
DVD-технологий.
Распространение бета-версии Windows Media 9 Series запланировано на сентябрь текущего
года.
Демократизация телевидения высокой четкости -- дело не очень далекого, но все же будущего. Забота сегодняшнего дня -- наиболее полная реализация потенциала, предоставляемого доступными в настоящее время технологиями. Итак...
Какому кодеку довериться?
|
Результаты конверсии DVD->CD-R
полнометражного фильма "Микрокосмос" (Galatee Films, 1996) с помощью
новейших видеокодеков: DivX v.5.02, RealVideo v.9, Sorenson v.3.1, Bink v.1.5J
(сверху -- исходное изображение, а снизу -- отдельные кадры скомпрессированного
фильма). Отметим, что темпоральные артефакты компрессии столь же важны для субъективно
воспринимаемого качества изображения, как пространственные. К сожалению, статичные
кадры не дают возможности о них судить
|
Выбор пути должен определяться преследуемыми
целями. Алгоритмы компрессии могут быть направлены на локальную архивацию видеоинформации
или на распространение ее среди пользователей различных платформ, на организацию
вещания в Internet, на использование в играх и мультимедийных приложениях, на
применение в телеконференциях и т. д. Они могут также занимать промежуточное положение,
претендуя на большую или меньшую универсальность. При этом в каждой конкурентной
нише ведется ожесточенная борьба многих принципиально различных технологий, обобщенное
сопоставление которых выходит за рамки данной статьи. К счастью, на практике решение
проблемы оптимального выбора часто упрощается за счет применения простого принципа
популярности: выбирая кодек, следует ставить на лидера. Принцип этот диктуется
не стадным инстинктом, а здравым расчетом: малораспространенный, но чуть более
качественный формат
X завтра может остаться без поддержки, и видеоролик,
закодированный в нем, рискует превратиться в анахронизм. Тем временем чуть менее
качественный, но более распространенный формат
Y позволил бы ролику успешно
перекочевать на новые платформы и даже предстать перед пользователями в ином,
улучшенном качестве. Например, при наличии достаточных процессорных ресурсов последние
версии проигрывателей Real Networks допускают синтез промежуточных кадров, что
обеспечивает более естественную передачу движения даже в сравнении с исходным
материалом.
Какие же кодеки, помимо общеизвестных индустриальных видеостандартов MPEG-1/2/4 и DV/MJPEG, находятся сегодня на переднем фронте войны за лидерство?
DivX v.5.02
|
DivX v.5.02
|
Этот излюбленный видеопиратами кодек от
компании
Divxnetworks претендует
в мире цифрового видео на место, занимаемое MP3 в мире цифрового аудио. Между
прочим, данная аналогия не исчерпывается популярностью сравниваемых форматов:
как и MP3, последняя версия DivX использует для определения информационной избыточности
алгоритмы моделирования психофизиологии восприятия. Достоинством DivX является
широкий набор настраиваемых фильтров, служащих при воспроизведении для устранения
артефактов ДКП-компрессии, а также для придания кадру "кинематографичного
вида". Разумеется, подобная нетривиальная пост-обработка в режиме реального
времени требует большой процессорной мощности.
Недавно компания
Sigma
Designs выпустила недорогой аппаратный декодер DivX-формата, оформленный в
виде PCI-карты, а в ближайшей перспективе следует ждать появления бытовых DivX-проигрывателей.
Еще одним красноречивым свидетельством признания формата DivX может служить его
использование для кодирования анимационных вставок в новейшей сверхпопулярной
Starcraft III от Blizzard Entertainment вместо стандартного для игровой индустрии
видеокомпрессора Bink (подробнее о последнем будет сказано чуть ниже).
RealVideo v.9
|
RealVideo v.9
|
В 1995 г. проигрыватель RealPlayer v.1
от компании Real
Networks заложил
фундамент индустрии сетевого аудиовещания. Версия 4, вышедшая спустя два года,
впервые стала поддерживать видеоконтент. С тех пор, несмотря на энергичное давление
со стороны Apple и Microsoft, продвигающих собственные вещательные стандарты,
Real Networks продолжает удерживать значительную долю рынка и сохранять техническое
превосходство в нескольких ключевых областях. Например, SureStream признается
лучшей из существующих ныне технологий, позволяющих вещательному серверу динамически
адаптироваться к пропускной способности канала (.rm-файл может содержать до 8
видеопотоков, просчитанных с разной степенью сжатия). Другая фирменная технология
-- TurboPlay -- реализует преимущества высокоскоростных вещательных каналов за
счет оптимальной буферизации данных. До недавнего времени формат RealVideo был
преимущественно ориентирован на специфические нужды сетевого телевещания. Вплоть
до версии 9, появившейся весной этого года, в нем отсутствовала технология двухпроходного
кодирования, давно являющаяся стандартной среди кодеков, предназначенных для архивации
видео на локальных носителях. При двухпроходном кодировании первый проход используется
для сбора статистических данных о визуальной насыщенности кадров; впоследствии
эта информация позволит оптимальным образом варьировать коэффициент компрессии
в пределах, определяемых емкостью носителя. Файлы RealVideo, закодированные двухпроходным
способом, получают расширение .rmvb.
Sorenson v.3.1
|
Sorenson v.3.1
|
Это представитель последнего поколения
кодеков, поставляемых с системой QuickTime. Выпускает его компания
Sorenson
Media. В нем реализована поддержка видеокомпоузинга в реальном времени, высоко
ценимая разработчиками мультимедийных приложений. Так, для эффективного (и эффектного)
кодирования часового сюжета о музейной экскурсии в качестве фона может быть использована
последовательность из нескольких десятков статичных изображений музейного интерьера,
оцифрованных в высоком разрешении и с минимальной потерей качества. Передний же
план ролика, предназначенный для наложения поверх фонового через маскирующий альфа-канал,
может представлять собой сильно компрессированное изображение движущегося экскурсовода
(снятого в меньшем разрешении на фоне синего экрана). Ролик сопоставимого качества,
подготовленный без этих ухищрений, занял бы на один-два порядка больший объем.
Свободно распространяемая версия кодека Sorenson v.3.1 имеет ряд существенных
ограничений, запрещающих не только компоузинг, но и, к примеру, использование
B-фреймов, что ощутимо снижает отношение визуального качества кодируемых файлов
к их объему.
Bink v.1.5J
|
Bink v.1.5J
|
Данный кодек от компании
RAD
Game Tools буквально монополизовал игровую индустрию, так как он использован
в нескольких сотнях игр, включая знаменитые Carmageddon, Final Fantasy и Pool
of Radiance. Bink-технологией поддерживаются не только всевозможные версии Mac
и PC, но и все современные игровые приставки. Утверждается, что файлы .bik сжимаются
эффективнее, чем MPEG-2, требуя при этом в три раза меньше вычислительных ресурсов
на воспроизведение (которое оказывается под силу даже Pentium 166 MHz). Если в
основе алгоритмов компрессии, задействованных тремя вышеописанными кодеками, лежит
дискретно-косинусное преобразование (ДКП), то Bink поддерживает целых 16 разнообразных
алгоритмов сжатия (различные разновидности wavelet-преобразований, векторной квантизации
и др.), выбор между которыми определяется характером компрессируемого изображения.
Такой подход обеспечивает действительно высокую эффективность сжатия, но вместе
с тем делает кодирование крайне медленным: конвертация получасового фильма в разрешении
640 x 480 x 25 fps на компьютере класса Pentium 4 1,5 GHz занимает около суток!
Впрочем, для разработчика игры время кодирования является гораздо менее критичным
результатом, чем качество воспроизведения. Принципиальным ограничением файлов
.bik является невозможность их последующей обработки в редакторах нелинейного
монтажа.
Отметим, что эффективность работы всех описанных кодеков во многом определяется
характеристиками компрессируемого изображения.
Для подготовки иллюстраций был использован
профессиональный видеоконвертер Canopus ProCoder, любезно предоставленный в
распоряжение автора компанией "КомТел" ([email protected]).
Як RPA-платформа допомогла SkyUр автоматизувати оплату рахунків