Microsoft Search Server 2008: корпоративный поиск – в каждый офис

4 февраль, 2008 - 12:16Игорь Дериев

Поиск информации является одной из наиболее характерных задач, стоящих перед современным «интеллектуальным» работником. Однако если в Интернете она принципиально решена благодаря усилиям (едва ли не бескорыстным) Google, Microsoft, Yahoo! и иже с ними, то внутри отдельных организаций нередко напоминает теорему Ферма: почти наверняка известно, что искомое где-то есть, но «докопаться» до него не удается. Не в последнюю очередь это связано с тем, что корпоративные поисковые продукты, как правило, достаточно дороги и обычно требуют внедрения, ведь чаще всего приходится обслуживать разнородные источники информации.

Microsoft Search Server 2008 корпоративный поиск – в каждый офис
Новый мастер инсталляции самостоятельно загрузит и установит все необходимые компоненты, так что развернуть MSS можно чрезвычайно быстро

До недавнего времени фактически не существовало бесплатного полнофункционального ПО данного класса (изредка предлагались лишь специальные урезанные и ограниченные версии, преследующие в основном ознакомительные цели), пока за дело не взялся известный разрушитель подобных стереотипов – корпорация Microsoft. В конце прошлого года она представила очередное семейство продуктов, объединенных незамысловатым названием Search Server, причем младший его представитель – редакция Express – будет распространяться абсолютно бесплатно (сегодня для тестирования доступен Release Candidate).

Ситуация особенно интересна тем, что отличия Microsoft Search Server 2008 Express (MSSE) от старшей редакции (MSS) – если верить информации на официальном сайте – заключаются лишь в отсутствии поддержки распределенных конфигураций для обеспечения высокой доступности и балансировки нагрузки. При этом не налагаются какие-либо ограничения на количество обслуживаемых документов или подключаемых клиентов, а также сохранены все наиболее востребованные и интересные возможности, о которых мы поговорим ниже.

Microsoft Search Server 2008 корпоративный поиск – в каждый офис
MSS основан на технологиях SharePoint и, следовательно, допускает расширение своей функциональности – к примеру, за счет различных инструментов для уточнения поиска

От большинства корпоративных продуктов MSSE отличается чрезвычайно простым развертыванием. Благодаря тому что всю предварительную работу (загрузку и доустановку необходимых компонентов, активизацию соответствующей роли сервера и пр.) автоматически выполнит инсталляционный мастер, вся процедура занимает от силы час – с первичной настройкой, что называется, «под ключ». Не требуется для его работы и какой-то специфической аппаратной конфигурации – к примеру, хотя в минимальных требованиях указан объем RAM в 2 ГБ, MSSE можно установить и опробовать (конечно, о реальной нагрузке при этом говорить не приходится) даже в виртуальной машине с 512 МБ RAM. Вдобавок к этому использование в качестве платформы Windows Server 2003 Web позволяет строить очень экономичные решения.

Microsoft не приводит каких-либо оценок производительности MSSE, однако независимые эксперты предполагают, что типичная конфигурация (процессор на 3 ГГц, 4 ГБ RAM) сможет обслуживать до полумиллиона документов (причем с SQL Express, с использованием внешнего SQL Server, вероятно, гораздо больше). Это ставит такое решение в один ряд, скажем, с Google Search Appliance ценой порядка 30 тыс долл. Очевидно, что у компаний, работающих на данном рынке, появился серьезный повод для беспокойства.

При этом MSSE основывается на достаточно известных и хорошо себя зарекомендовавших технологиях, в первую очередь SharePoint. Этот факт обеспечивает сразу два преимущества. Во-первых, организация сайта MSSE и инструменты управления окажутся привычными для многих администраторов, имеющих опыт работы с другими продуктами семейства SharePoint. Во-вторых, традиционно для SharePoint пользовательcкий интерфейс представляет собой, по сути, крупноблочный конструктор и априори предполагает адаптацию и расширение с помощью SharePoint Designer или Visual Studio.

Насколько это важно, легко понять на простом примере. В первых обзорах MSSE многие сетовали на слишком простой интерфейс поискового сайта, не предоставляющий никаких средств уточнения и фильтрации результатов (кстати, в MSSE применяется та же система ранжирования, что и в Windows Live Search) и т. п. Однако совсем скоро – напомним, что работы над релизом даже сегодня еще не завершены – стал доступен инструментарий для организации так называемого «фасетного» поиска. Несложно предположить, что в перспективе появятся и другие интересные расширения.

Впрочем, универсальность, как всегда, имеет и оборотную сторону. Скажем, человек, не слишком знакомый с SharePoint, поначалу может испытывать затруднения с нахождением каких-то конкретных настроек, поскольку они организованы в несколько уровней (для базовой структуры, для сервиса) и размещение некоторых (к примеру, для указания максимального размера данных, загружаемых с внешнего источника) далеко не очевидно.

Microsoft Search Server 2008 корпоративный поиск – в каждый офис
Управление MSS производится из единой административной консоли, обеспечивающей доступ ко всем встроенным инструментам

Другой аспект преемственности MSSE – использование стандартных фильтров (iFilter), одинаковых для всех поисковых продуктов Microsoft, как персональных, так и серверных. За последние годы их накопилось предостаточно, так что можно найти, пожалуй, для любого типа файлов – правда, не все они предлагаются бесплатно. С MSSE, естественно, поставляется минимальный набор, охватывающий лишь документы Microsoft Office, простые текстовые файлы и некоторые другие типы. Наверняка одним из первых дополнений будет iFilter для Adobe PDF – его новейшая (32-разрядная) версия распространяется вместе с Adobe Reader 8, однако подключение к MSSE требует определенных вспомогательных действий.

Изначально MSSE умеет индексировать веб-узлы, ресурсы локальной сети, сайты SharePoint и публичные папки Exchange – некий разумный минимум, очевидно, недостаточный для крупных организаций, использующих различные корпоративные системы. Документация на сайте также упоминает о стандартной поддержке хранилищ Lotus Domino, однако пока она, видимо, не реализована. Аналогична ситуация с коннекторами (т. е. подключаемыми модулями, позволяющими напрямую работать с соответствующими хранилищами) для EMC Documentum и IBM FileNet, выпуск которых, судя по всему, будет приурочен к релизу MSS 2008.

Microsoft Search Server 2008 корпоративный поиск – в каждый офис
Дополнительные фильтры и различные типы коннекторов позволят осуществлять поиск практически в любых источниках, будь то файлы специфического формата на сетевом ресурсе или внутреннее хранилище корпоративной системы

Понятно, однако, что обеспечить качественную поддержку для множества сторонних продуктов не по силам даже Microsoft. Поэтому взаимодействие с ними будет осуществляться в рамках «федеративных» отношений на основе протокола OpenSearch. То есть поиск будет производится «родными» средствами, а MSS/MSSE выступит, по сути, в роли клиента и станет предоставлять своим пользователям результаты параллельно из нескольких источников. Для демонстрации этой возможности MSSE изначально взаимодействует с Live.com, а на официальном сайте имеется ряд других примеров и солидный список партнеров, уже поддержавших данную инициативу. Учитывая, что OpenSearch базируется на Atom, уже сейчас в качестве «федеративного» источника информации могут выступать любые сайты, использующие Atom и RSS (достаточно лишь сформировать для них специальный файл-описание и импортировать его в MSSE), а в перспективе, видимо, поддержка OpenSearch станет привычным явлением для корпоративных систем.

В остальном MSSE обеспечивает достаточную функциональность, позволяющую настроить продукт для конкретного применения. Администратор может определять поисковые области (формируя их из отдельных сайтов, предопределенных источников или очерчивая посредством метаданных) и гибко управлять доступом к ним. Поддерживаются несколько типов аутентификации пользователей, в том числе NTLM и Kerberos, а для файлов, индексируемых на локальных сетевых ресурсах, автоматически учитываются ACL. Более того, один сервер может поддерживать несколько визуальных представлений, индивидуально настроенных и предназначенных для различных групп пользователей. Естественно, MSSE также располагает встроенным планировщиком индексации (полной или инкрементной), средствами построения отчетов, а также рядом более тонких инструментов, к примеру для управления метаданными, формирования списков синонимов и пр.

Конечно, сама Microsoft в качестве истинно корпоративного продукта позиционирует MSS, в то время как MSSE воспринимается как решение начального уровня (несмотря на фактическое функциональное равенство двух редакций). Но если MSSE сегодня является уникальным предложением, то MSS придется конкурировать с довольно сильными противниками, которым также есть что предложить клиентам. Во всяком случае в MSS пока что не хватает некоторых достаточно очевидных возможностей, вроде непосредственного доступа к базам данным (например, через ODBC). Однако в серьезности намерений Microsoft сомневаться не приходится, что подтверждает и недавнее официальное сообщение о готовности приобрести норвежскую компанию Fast Search & Transfer, одного из лидеров рынка корпоративного поиска. Учитывая, что данная сделка имеет большие шансы на успех, в перспективе можно ожидать расширения линейки MSS за счет специализированных и высокоуровневых решений.