Desktop Search: теперь от Microsoft

10 январь, 2005 - 00:00Игорь Дериев Нынешний повышенный интерес к персональным поисковым программам объяснить довольно непросто. Очевидно, что объемы электронной информации растут лавинообразно, но ведь проблема возникла далеко не сегодня, да и готовых решений (вполне пристойных) на рынке предостаточно. Однако интерес к данному сегменту таких традиционных интернет-компаний, как Google (desktop.google.com), Ask Jeeves (sp.ask.com/docs/desktop) и Yahoo! (все еще не представившей своего продукта), вполне возможно объяснить (во всяком случае, в значительной мере) тем, что они так или иначе "привязывают" локальные программы к собственным онлайновым сервисам. Теперь к этой когорте присоединилась и Microsoft (beta.toolbar.msn.com), буквально на днях интегрировавшая поисковую функциональность в очередную версию своей MSN-панели.

Desktop Search теперь от Microsoft
Новый подход -- рубрикация информации по категориям и использование специфических атрибутов
Desktop Search теперь от Microsoft
Контроль за процессом индексации реализован гораздо удобнее, чем в Indexing Services и многих других аналогичных продуктах
Desktop Search теперь от Microsoft
MSN Desktop Search может индексировать и сетевые ресурсы, но только при их отображении на локальные устройства
Мотивы, естественно, примерно те же -- продвижение обновленной службы MSN Search, которую небезосновательно считают главным конкурентом Google. Потому, видимо, не случайно именно сейчас появился и отчет Gartner, однозначно не рекомендующий применение Google Desktop Search в бизнес-среде -- как из-за проблем со сбором персональной информации, так и из-за недостаточной функциональности. И хотя Gartner нередко обвиняют в избытке симпатий к Microsoft, последний аргумент аналитиков действительно имеет под собой кое-какие основания -- во всяком случае, предварительная версия MSN Desktop Search нам также показалась более удачной, в том числе и на концептуальном уровне.

Впрочем, ничего удивительного в этом нет, тем более что формально Microsoft уже очень давно занимается поисковыми технологиями, включая и локальные -- Indexing Services стандартно присутствует и в Windows 2000, и в Windows XP. Безусловно, данному компоненту не помешала бы оболочка подружественнее и поудобнее, и, как показали сторонние разработчики (в том числе и наши соотечественники из компании MT, см. itc.ua/18503), подобные решения могут быть довольно интересными. Тем не менее Microsoft и сама собиралась значительно усовершенствовать средства поиска в Longhorn, но, видимо, жизнь диктует свои законы. Во всяком случае, ряд обещанных новшеств реализован именно в MSN Desktop Search.

Однако изобретать в очередной раз велосипед в Microsoft не стали. Хотя MSN Desktop Search является совершенно самодостаточным продуктом, многие его модули и архитектурные решения, несомненно, перекочевали из Indexing Services -- об этом свидетельствуют и одинаковые имена файлов, и, к примеру, реализация поддержки PDF все тем же стандартным фильтром от Adobe. Хотя преимущества подобной преемственности очевидны, она имеет и негативные последствия. В частности, программа по-прежнему не желает извлекать произвольные фрагменты документа, предлагая лишь выдержку из самого его начала, которая может не содержать ни единого слова из вашего запроса. Откровенно говоря, это совершенно неудобно, и остается лишь надеяться на то, что разработчики просто не успели уделить данному вопросу должного внимания.

Зато Microsoft сделала действительно серьезный шаг в сторону унификации поиска разнородной информации. И дело вовсе не в том, что MSN Desktop Search индексирует офисные документы (DOC, XLS, RTF, PDF и некоторые другие), электронные сообщения (Outlook Express, Outlook) и различную вспомогательную информацию из музыкальных и графических файлов (если таковая предусмотрена) -- подобные фильтры имелись и раньше. Во-первых, результаты поиска сразу раскладываются по основным категориям, а плюс к тому их можно дополнительно отбирать по косвенным признакам. Скажем, можно получить не просто документы, соответствующие запросу, а только те из них, что присоединены к электронным письмам (хотя их индексация отключена по умолчанию). Во-вторых, для различных категорий определены списки атрибутов (иногда достачно обширные). Например, для e-mail это тема письма, автор, поле CC:, наличие вложений и пр.; для контакных данных -- адреса, телефоны, должность и вообще практически все реквизиты, встречающиеся в адресных книгах; для фотографий -- модель камеры и разрешение; для музыкальных композиций -- жанр, исполнитель, битрейт.

Все эти атрибуты могут указываться непосредственно в запросе, с использованием предопределенных слов-индикаторов, хотя, чтобы найти подходящее, придется проштудировать справочную систему. Скажем, так можно отобрать все фотографии, сделанные камерой Olympus C4000Z:

cameramodel:C4000Z

a так

has:attachment subject:статья

все письма с присоединенными файлами, в теме которых содержится слово "статья". Естественно, запросы могут быть гораздо сложнее, в них допускается комбинировать атрибуты, обычные слова, логические операторы. Однако запомнить нужные "заклинания" не так-то просто, потому может пригодиться техника вторичных запросов. Пока она доступна только для e-mail -- получив результаты и обнаружив похожее письмо, вы можете оперативно отыскать все сообщения этого же адресата или с такой же датой (достаточно воспользоваться контекстным меню).

Что касается реализации, то MSN Desktop Search интегрируется с Outlook, Internet Explorer и операционной системой -- в частности, появляется новая инструментальная панель MSN Deskbar, осуществляющая поиск "на лету" по мере ввода запроса. Довольно удачно также организовано управление процессом индексации -- обычно он выполняется в фоновом режиме и приостанавливается буквально при любой активности со стороны пользователя или открытых приложений, однако его можно запустить в "непрерывном" режиме (особенно удобно при первичном создании индекса) либо сделать паузу длительностью от 15 с до суток. Несколько странным выглядит лишь то, что для индексации электронной почты обязательно должна выполняться соответствующая клиентская программа, и взаимодействие с ней быстрым назвать нельзя.

Наиболее же острый вопрос -- языковая поддержка. MSN Desktop Search, как и Indexing Services, базируется на Unicode, т. е. в определенном смысле является языконезависимым приложением. Это значит, что поиск будет вполне корректно осуществляться либо по точному слову, либо по подстроке при использовании символа "*". В остальном же все зависит от качества фильтров. Так, о проблемах с PDF мы уже говорили неоднократно. Не исключено также, что морфологическую поддержку и другие дополнительные возможности со временем предложат сторонние разработчики.