Поиск информации является одной из наиболее характерных задач, стоящих перед современным «интеллектуальным» работником. Однако если в Интернете она принципиально решена благодаря усилиям (едва ли не бескорыстным) Google, Microsoft, Yahoo! и иже с ними, то внутри отдельных организаций нередко напоминает теорему Ферма: почти наверняка известно, что искомое где-то есть, но «докопаться» до него не удается. Не в последнюю очередь это связано с тем, что корпоративные поисковые продукты, как правило, достаточно дороги и обычно требуют внедрения, ведь чаще всего приходится обслуживать разнородные источники информации.
Новый мастер инсталляции самостоятельно загрузит и установит все необходимые компоненты, так что развернуть MSS можно чрезвычайно быстро |
До недавнего времени фактически не существовало бесплатного полнофункционального ПО данного класса (изредка предлагались лишь специальные урезанные и ограниченные версии, преследующие в основном ознакомительные цели), пока за дело не взялся известный разрушитель подобных стереотипов – корпорация Microsoft. В конце прошлого года она представила очередное семейство продуктов, объединенных незамысловатым названием Search Server, причем младший его представитель – редакция Express – будет распространяться абсолютно бесплатно (сегодня для тестирования доступен Release Candidate).
Ситуация особенно интересна тем, что отличия Microsoft Search Server 2008 Express (MSSE) от старшей редакции (MSS) – если верить информации на официальном сайте – заключаются лишь в отсутствии поддержки распределенных конфигураций для обеспечения высокой доступности и балансировки нагрузки. При этом не налагаются какие-либо ограничения на количество обслуживаемых документов или подключаемых клиентов, а также сохранены все наиболее востребованные и интересные возможности, о которых мы поговорим ниже.
MSS основан на технологиях SharePoint и, следовательно, допускает расширение своей функциональности – к примеру, за счет различных инструментов для уточнения поиска |
От большинства корпоративных продуктов MSSE отличается чрезвычайно простым развертыванием. Благодаря тому что всю предварительную работу (загрузку и доустановку необходимых компонентов, активизацию соответствующей роли сервера и пр.) автоматически выполнит инсталляционный мастер, вся процедура занимает от силы час – с первичной настройкой, что называется, «под ключ». Не требуется для его работы и какой-то специфической аппаратной конфигурации – к примеру, хотя в минимальных требованиях указан объем RAM в 2 ГБ, MSSE можно установить и опробовать (конечно, о реальной нагрузке при этом говорить не приходится) даже в виртуальной машине с 512 МБ RAM. Вдобавок к этому использование в качестве платформы Windows Server 2003 Web позволяет строить очень экономичные решения.
Microsoft не приводит каких-либо оценок производительности MSSE, однако независимые эксперты предполагают, что типичная конфигурация (процессор на 3 ГГц, 4 ГБ RAM) сможет обслуживать до полумиллиона документов (причем с SQL Express, с использованием внешнего SQL Server, вероятно, гораздо больше). Это ставит такое решение в один ряд, скажем, с Google Search Appliance ценой порядка 30 тыс долл. Очевидно, что у компаний, работающих на данном рынке, появился серьезный повод для беспокойства.
При этом MSSE основывается на достаточно известных и хорошо себя зарекомендовавших технологиях, в первую очередь SharePoint. Этот факт обеспечивает сразу два преимущества. Во-первых, организация сайта MSSE и инструменты управления окажутся привычными для многих администраторов, имеющих опыт работы с другими продуктами семейства SharePoint. Во-вторых, традиционно для SharePoint пользовательcкий интерфейс представляет собой, по сути, крупноблочный конструктор и априори предполагает адаптацию и расширение с помощью SharePoint Designer или Visual Studio.
Насколько это важно, легко понять на простом примере. В первых обзорах MSSE многие сетовали на слишком простой интерфейс поискового сайта, не предоставляющий никаких средств уточнения и фильтрации результатов (кстати, в MSSE применяется та же система ранжирования, что и в Windows Live Search) и т. п. Однако совсем скоро – напомним, что работы над релизом даже сегодня еще не завершены – стал доступен инструментарий для организации так называемого «фасетного» поиска. Несложно предположить, что в перспективе появятся и другие интересные расширения.
Впрочем, универсальность, как всегда, имеет и оборотную сторону. Скажем, человек, не слишком знакомый с SharePoint, поначалу может испытывать затруднения с нахождением каких-то конкретных настроек, поскольку они организованы в несколько уровней (для базовой структуры, для сервиса) и размещение некоторых (к примеру, для указания максимального размера данных, загружаемых с внешнего источника) далеко не очевидно.
Управление MSS производится из единой административной консоли, обеспечивающей доступ ко всем встроенным инструментам |
Другой аспект преемственности MSSE – использование стандартных фильтров (iFilter), одинаковых для всех поисковых продуктов Microsoft, как персональных, так и серверных. За последние годы их накопилось предостаточно, так что можно найти, пожалуй, для любого типа файлов – правда, не все они предлагаются бесплатно. С MSSE, естественно, поставляется минимальный набор, охватывающий лишь документы Microsoft Office, простые текстовые файлы и некоторые другие типы. Наверняка одним из первых дополнений будет iFilter для Adobe PDF – его новейшая (32-разрядная) версия распространяется вместе с Adobe Reader 8, однако подключение к MSSE требует определенных вспомогательных действий.
Изначально MSSE умеет индексировать веб-узлы, ресурсы локальной сети, сайты SharePoint и публичные папки Exchange – некий разумный минимум, очевидно, недостаточный для крупных организаций, использующих различные корпоративные системы. Документация на сайте также упоминает о стандартной поддержке хранилищ Lotus Domino, однако пока она, видимо, не реализована. Аналогична ситуация с коннекторами (т. е. подключаемыми модулями, позволяющими напрямую работать с соответствующими хранилищами) для EMC Documentum и IBM FileNet, выпуск которых, судя по всему, будет приурочен к релизу MSS 2008.
Понятно, однако, что обеспечить качественную поддержку для множества сторонних продуктов не по силам даже Microsoft. Поэтому взаимодействие с ними будет осуществляться в рамках «федеративных» отношений на основе протокола OpenSearch. То есть поиск будет производится «родными» средствами, а MSS/MSSE выступит, по сути, в роли клиента и станет предоставлять своим пользователям результаты параллельно из нескольких источников. Для демонстрации этой возможности MSSE изначально взаимодействует с Live.com, а на официальном сайте имеется ряд других примеров и солидный список партнеров, уже поддержавших данную инициативу. Учитывая, что OpenSearch базируется на Atom, уже сейчас в качестве «федеративного» источника информации могут выступать любые сайты, использующие Atom и RSS (достаточно лишь сформировать для них специальный файл-описание и импортировать его в MSSE), а в перспективе, видимо, поддержка OpenSearch станет привычным явлением для корпоративных систем.
В остальном MSSE обеспечивает достаточную функциональность, позволяющую настроить продукт для конкретного применения. Администратор может определять поисковые области (формируя их из отдельных сайтов, предопределенных источников или очерчивая посредством метаданных) и гибко управлять доступом к ним. Поддерживаются несколько типов аутентификации пользователей, в том числе NTLM и Kerberos, а для файлов, индексируемых на локальных сетевых ресурсах, автоматически учитываются ACL. Более того, один сервер может поддерживать несколько визуальных представлений, индивидуально настроенных и предназначенных для различных групп пользователей. Естественно, MSSE также располагает встроенным планировщиком индексации (полной или инкрементной), средствами построения отчетов, а также рядом более тонких инструментов, к примеру для управления метаданными, формирования списков синонимов и пр.
Конечно, сама Microsoft в качестве истинно корпоративного продукта позиционирует MSS, в то время как MSSE воспринимается как решение начального уровня (несмотря на фактическое функциональное равенство двух редакций). Но если MSSE сегодня является уникальным предложением, то MSS придется конкурировать с довольно сильными противниками, которым также есть что предложить клиентам. Во всяком случае в MSS пока что не хватает некоторых достаточно очевидных возможностей, вроде непосредственного доступа к базам данным (например, через ODBC). Однако в серьезности намерений Microsoft сомневаться не приходится, что подтверждает и недавнее официальное сообщение о готовности приобрести норвежскую компанию Fast Search & Transfer, одного из лидеров рынка корпоративного поиска. Учитывая, что данная сделка имеет большие шансы на успех, в перспективе можно ожидать расширения линейки MSS за счет специализированных и высокоуровневых решений.