`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Что для вас является метрикой простоя серверной инфраструктуры?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

XML — новый HTML или нечто большее?

0 
 

В последнее время в нашу жизнь стремительно ворвалась новая аббревиатура — XML. Ее можно встретить практически каждую неделю среди заголовков Internet-новостей. Некоторые авторитеты в мире Сети называют XML следующей революцией в Web. Итак, попробуем разобраться, чем привлекает мировую общественность этот новый стандарт и почему вокруг него так много шума.

XML (extensible Markup Language — расширяемый язык разметки) — сравнительно новая разработка, впервые анонсированная в ноябре 1996 г., которая предназначена для публикации документов в Web, Intranet- и extranet-сетях. Чем же не устроил Web-издателей старый добрый НTML, что возникла необходимость еще в одном языке? Ответ таков: HTML, с одной стороны, слишком прост, а с другой — не является расширяемым.

Изначально HTML разрабатывался как достаточно тривиальный язык, позволяющий осуществлять базовые операции по форматированию текста, вставке таблиц и графики, размещению элементов на странице и, конечно же, по установлению гипертекстовых перекрестных ссылок между документами. Все функции интерактивности были возложены на сервер — данные, введенные в формы, обрабатывались серверным CGI-скриптом, возможно, при этом «на лету» автоматически генерировались страницы. Тогда язык был на самом деле кросс-платфор-менным. и документы, выполненные, к примеру, на PC, выглядели практически одинаково и в Unix, и на Macintosh, и на других системах. Эта ситуация вполне устраивала ученых, для которых, собственно, и разрабатывался Web (люди должны были быстро и эффективно знакомить коллег с результатами своих исследований, а не ломать голову, как смакети-ровать страницу). Затем пришли коммерсанты, для которых форма подачи документа часто превалировала над его содержанием. Web стал машиной, приносящей деньги, и это немедленно сказалось на развитии сетевых стандартов Каждый год сулил что-то новое: фреймы, Java, JavaScript, Active Server Pages, Cascaded Style Sheets, динамический HTML. World Wide Web Consortium (W3C), независимый стандартизирующий орган в Internet, не успевал рассматривать и принимать новые версии языка. Главная проблема заключалась в том, что все эти нововведения в основном были направлены на улучшение внешнего вида документов, никак не затрагивая их содержания. О каком-либо структурировании данных в Web не было и речи. Вместе с тем объемы информации росли в геометрической прогрессии. В конце концов пользователи столкнулись с ситуацией, когда при попытке, к примеру, найти необходимую информацию на поисковом сервере последний выдавал список из нескольких тысяч (а то и десятков тысяч) ссылок на страницы, выбрать из которых действительно нужную было очень проблематично. если не невозможно.

Как было отмечено выше, HTML не является расширяемым языком. Список его дескрипторов (команд форматирования элементов документа в программе просмотра) ограничен. В идеале, мог усовершенствовать язык только W3C, да и разработчики броузеров Netscape и Microsoft, чтобы добиться успеха в кон-курентной гонке, дополняли свои программы поддержкой еще не принятых в качестве стандарта элементов языка Нововведения Microsoft работали только в ее броузерах, это же касается и Netscape, а одобренные W3C и принятые обеими конкурирующими сторонами усовершенствования языка разработчики все равно должны были использовать с опаской -багаж старого ПО. которое не поддерживает эти нововведения, всегда был, есть и будет очень велик. Простые же пользователи не могли собственноручно «подгонять» язык под свои требования.

XML — новый HTML или нечто большее?

Уже более 20 лет в информатике живет и здравствует SGML (Standard Generalized Markup Language) — язык описания любых электронных документов, а также других подобных языков (так называемый метаязык). К примеру, SGML позволяет полностью описать HTML, и часто в популярной прессе первый называют «родителем» второго. Язык или документ, описанный с помощью SGML, является расширяемым, т.е. автор может дополнить его любыми понятиями или определениями по своему усмотрению. Чтобы создать множество документов с помощью SGML, определяется DTD (Document Type Definition) — последовательность правил, которым должны соответствовать все документы в этой группе. Изменяя впоследствии DTD, можно расширять или сужать круг документов, входящих в множество. Однако SGML не нашел широкого применения. Это достаточно сложный язык, понять и освоить который под силу, как правило, только людям с хорошо сформированным математическим подходом. Реализация его очень усложнена и требует больших вычислительных ресурсов, что в свое время и предопределило использование его, в основном, теоретиками. Применительно же к Web-технологиям, вопрос состоял в том, чтобы получить язык столь же простой, как HTML (залог массовой поддержки) и вместе с тем достаточно мощный и расширяемый, как SGML, что обеспечило бы приверженность квалифицированных разработчиков с высокими требованиями к его возможностям. Одним словом, нужно оыло изобрести нечто промежуточное между HTML и SGML, не теряя существующих в первом наработок в области дизайна страниц и гибкости второго.

XML смог решить обе эти проблемы. Если HTML — это всего лишь один тип документов SGML (один DTD), то XML — это просто урезанная версия SGML. XML — не просто язык разметки документов, это, как и SGML, — метаязык, позволяющий ему определять себе подобных. Если с помощью HTML можно только задать внешний вид страниц в программе просмотра, то XML дает возможность описать в целом язык разметки документов.

В отличие от HTML, главной задачей которого является определение того, как страница будет отображаться в программе просмотра, XML описывает данные, которые должны быть размещены на ней. Для задания внешнего вида используется CSS-подобный язык XSL (extensible Stylesheet Language). С его помощью можно будет создать различные стили для представления данных на странице: один — для отображения информации на мониторе компьютера, второй — для всевозможных сверхпортативных коммуникаторов с миниатюрным экраном, третий — для печати документов на принтере.

Особенно хороши в XML средства поддержки гиперссылок. В HTML ссылки «однонаправленные» и статические, в XML же можно организовать многонаправленные (когда известно не только то, куда указывает ссылка, но и с каких других мест в сети делаются ссылки на эту страницу) и динамические.

Разработчики страниц смогут использовать любые дескрипторы, к примеру , задающий автора страницы, или для обозначения соответственно главы и раздела.

XML — новый HTML или нечто большее?

В общем случае документ XML состоит из двух частей. Первая — собственно описание документа — похожа на HTML-документ с некоторыми новыми дескрипторами. Вторая — это DTD, где определяется, что означают те или иные дескрипторы и каким образом их должен интерпретировать броузер. Есть два типа документов XML — valid и well-formed. Документы типа valid содержат в своем теле DTD, well-formed же его могут и не включать, однако все равно последние должны соответствовать требованиям XML. Подобное разделение было использовано с той целью, чтобы избежать необходимости каждый раз определять DTD -это может быть весьма трудоемким занятием.

World Wide Web consortium в феврале утвердил XML в качестве индустриального стандарта выпустив рекомендации XML 1.0 Сам факт, что стандарт появился до того, как язык «пошел в массы», ценен для разработчиков, так как очень вероятно, что все будут придерживаться этого стандарта и не возникнет путаницы, как это было например, с реализациями CSS и Dynamic HTML Костяк обычного HTML разрабатывался некоммерческими структурами, которые могли быстро договориться между собой, а «киты» типа Microsoft и Netscape пришли на рынок, когда в основном стандарт был сформирован.

XML может породить быстрый рост количества приложений. работающих с данными в этом формате, причем как серверных, так и клиентских — программ просмотра и комплектов разработчика.

Для того чтобы эта технология получила развитие, в первую очередь необходимо, чтобы на рынке появилось большое количество простых в применении редакторов, которые дадут толчок освоению XML широкими массами, а также чтобы пользователи перешли на новые версии броузеров Explorer 5.0 и Navigator 5.0, которые будут полноценно поддерживать этот язык.

Microsoft постаралась стать лидером в данной области, а это сулит немалые барыши, поскольку, похоже, ХМ L будет использоваться везде, где есть кросс-платформенный обмен данными, т. е. в электронной торговле корпоративных сетях и т.д. В Редмонде раньше других почувствовали скорую популярность XML. использовав его пускай и ограниченно, в своих пакетах Internet Explorer 4.0 и Office. И в дальнейшем в области приложений, так или иначе касающихся Internet, софтверный гигант обещает всесторонне поддерживать этот стандарт, в частности встроить полную поддержку XML в новый релиз Office.

Технология ЗD-рендеринга Chrome, которую компания разрабатывает в настоящее время на основе XML. предоставит возможность разработчикам использовать специальные дескрипторы этого языка для доступа к низкоуровневым драйверам Direct3D. Очевидно, что этот механизм будет доступен только в системах, работающих под управлением Windows и использующих в качестве броузера Internet Explorer.

Netscape в настоящее время прикладывает немалые усилия для разработки формата Resource Description Format (RDF), который создается с использованием XML. Проект этот (его кодовое название Aurora) должен унифицировать такие функции, как отображение списка Internet-адресов (bookmarks) и карт сайтов, а также поиск в Web Поддержка RDF будет встроена в Communicator 5 0. Этот формат представлен в W3C на утверждение в качестве индустриального стандарта.

XML — новый HTML или нечто большее?

В настоящее время готовится новая версия языка Perl, который активно используется при разработке Web-скриптов, исполняемых на сервере. Язык будет снабжен новыми средствами, дающими возможность разработчику использовать существующие данные в различных форматах для публикации их на XML-страницах. Также новый продукт можно будет применять для трансляции существующих страниц HTML в формат XML. Perl, возможно, станет для XML тем же. чем в настоящее время для XML является JavaScript. XML-модули, основанные на Perl, можно будет использовать для генерации страниц «на лету» (аналог — нынешние CGI-скрипты) и для автоматического обновления содержимого сайтов с информационным наполнением из баз данных.

Компания webMethods анонсировала XML-сервер, который служит для интеграции Web-приложений с уже существующими приложениями и данными. Сервер позволяет, используя XML в качестве «промежуточного звена», осуществлять перенос данных из одного приложения в другое и выкладывать информацию на Web-страницы. На базе XML компания разработала язык WIDL (Web Interface Definition Language), с помощью которого описываются не только сами данные, но и правила доступа и разделения Компания передала WIDL на рассмотрение в W3C с надеждой, что ее разработка станет стандартом в Internet. Аналогичный продукт под названием Web-Broker разрабатывает компания DataChannel.

Главное преимущество XML заключается в том, что фирмы, организации или научные учреждения, работающие в какой-либо предметной области, могут объединенными усилиями разработать собственные DTD для представления однородной информации по единым правилам. В каждой предметной области может появиться свой язык разметки гипертекстовых документов, и уже есть конкретные примеры — Mathematical Markup Language (MML) и Chemical Markup Language (CML).

XML как кросс-платформенный язык может стать хорошим инструментом для доступа к информации из источников различных типов, а также для разделения данных между разными приложениями и платформами. Возможно, первыми на публикацию данных в формате XML перейдут компании в сетях intranet и extranet. По крайней мере, многие крупные американские корпорации уже начали разрабатывать или модернизировать свои информационные системы в соответствии со стандартом XML. Язык также может послужить хорошим катализатором электронной коммерции в Web.

Также использование XML должно облегчить структурирование документов и поможет поисковым машинам при обработке информации, которую они собирают с Web-серверов. В настоящее время поисковые машины делают полнотекстовый анализ Web-страниц, и при отборе необходимых документов для опреде-ления наиболее важных из них учитывают тривиальное количество повторений слова в документе и в списке метадескриптора <МЕТА Keywords>. Очевидно, что при таком подходе поисковый сервер будет выдавать много лишней информации. Если XML-страни-цы, предлагающие структурированные данные, проиндексировать, то этих проблем станет меньше. Поисковые роботы при обработке пользовательского запроса будут учитывать структуру документа, расположение интересующих понятий в его теле и отношения между ними При этом возможны запросы любой сложности, такие же, как к данным, хранящимся на SQL-сервере.

Что касается применения этой технологии в офисных приложениях, то можно будет осуществлять просмотр данных в разных вариантах: к примеру, отсортировать их по нужному критерию или выводить на экран только необходимую информацию, скрывая при этом второстепенную.

Спецификации XML также включают возможность сбора информации с других Web-сайтов. Представим себе такой сервер, виртуальная авиакомпания, которая собирает всю информацию о стоимости авиабилетов из разных мест и предлагает наиболее выгодный маршрут. При этом пользователю не нужно обращаться к серверам других компаний. И таких примеров можно придумать множество.

РАЗРАБОТКИ НА БАЗЕ XML

  • CDF (Channel Definition Format) — язык, базирующийся на XML. При использовании push-каналов Microsoft Internet Explorer 4.0 информация передается в этом формате.

  • MCF (Meta Content Format) был изначально предложен Apple и потом переиздан как Meta Content Framework. Служит для хранения метаданных — информации об информации.

  • MML (Mathematical Markup Language) был разработан, чтобы решить проблему невозможности публикации на Web-страницах математических формул и выражений.

  • OSD (Open Software Distribution) — результат совместных усилий компаний Marimba и Microsoft в области автоматизированного распространения ПО через Internet.

  • OFX (Open Financial Exchange) — формат обмена финансовыми данными, используемый в программах Intuit Quicken, Microsoft Money и CheckFree.

  • WIDL (Web Interface Definition Language) — предложенный компанией webMethods, служит для определения правил доступа к данным и их разделения.

  • ICE (Information Content and Exchange) — стандарт обмена деловой информацией в Internet.

 

0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT