Teoma: новое слово в мире поиска?

16 апрель, 2002 - 23:00Александр Москалюк

Подобные заявления руководства компании заставляют отнестись к упомянутому продукту с некоторой долей скептицизма. Ведь действительно, как часто приходится слышать громкие заверения очередного стартапа о том, что небольшая фирмочка вот-вот станет следующей Microsoft или General Motors. И все же то, что предлагает Teoma, заслуживает внимания со стороны пользователей, для которых наиболее важным показателем успеха поисковика является релевантность ссылок.

Компания Teoma, чей персонал, по последним данным, насчитывает всего 9 человек, стартовала в Rutgers University, расположенном в штате Нью-Джерси. Как зачастую бывает с американскими стартапами, первоначальное финансирование было связано с федеральным проектом, в котором были задействованы ученые Rutgers. Сегодня профессор Апостолос Герасоулис (Apostolos Gerasoulis), возглавлявший группу, работавшую по этому гранту, является вице-президентом компании по исследованиям и разработкам.

В сентябре 2001 г. Teoma стала частью компании Ask.com, которой принадлежит поисковик Ask Jeeves, известный, в основном, благодаря своей поддержке естественного языка запросов. В январском пресс-релизе за этот год Teoma указывает на тот факт, что интеграция ее технологий в результаты поиска на Ask.com позволила повысить успех запросов на Ask Jeeves на 25%.

Как признают сами создатели, технология, используемая в Teoma, своими корнями уходит в алгоритм Page Rank, взятый за основу Google. Однако если Google на каждый поисковый запрос пытается выдать страницу, на которую в Сети насчитывается больше всего ссылок с заданными ключевыми словами, то Teoma из всех страниц-реферреров выбирает только те, что имеют сходную тематику. Побочный эффект такого поиска -- кроме списка ссылок, вы получаете и тематическую коллекцию "папок" (в Teoma их называют community), по которым можно пройтись отдельно.

Наличие релевантных папок наверняка вызовет эффект дежа-вю у тех, кто пользовался системой Northern Light. Там подобная технология называется Custom Search Folders, а список семантически близких тем появляется слева от результатов поиска. К примеру, в Northern Light введение поискового термина "Ukraine" вызвало появление следующих папок -- "External debt", "Russia", "Investing", "NATO", "International economy". В Teoma аналогичный поиск выдает четыре папки по правую сторону от результатов -- "Personal Ad", "Weather Underground", "Reisen Nach" и "Lviv, Service". Назвать такую тематическую подборку релевантной язык не поворачивается, хотя результаты поиска без учета тематических папок в целом весьма неплохие.

Что касается русскоязычного поиска, то тут забег "Teoma против существующих поисковиков" придется отменить -- она просто не поддерживает поиск по русским и украинским страницам. Хотя и отсутствие этого свойства здесь какое-то странное -- ключевые слова, введенные в кириллице, система понимает и даже пытается выдать ряд ссылок, редко имеющих какое-нибудь отношение к запросу.

Нет в Teoma и такого понятия, как расширенные запросы. Подобными запросами, а также настройкой поискового интерфейса занимаются далеко не все пользователи, однако именно возможность персонализации результатов без потери качества поиска и дает право поисковику называть себя "мощным". План войны с Google кажется обреченным на неудачу и при сравнении поддерживаемых форматов -- Teoma пока что ищет странички в старом добром HTML. В то время как количество поддерживаемых форматов еще не определяет качество поисковика, многие узкоспециализированные академические документы лежат на университетских и корпоративных серверах в формате PDF, и именно возможность поиска по таким файлам и привлекает к Google множество студентов и работников вузов.

При наличии таких аргументов стоит еще вспомнить о многочисленных специализированных поисковых сервисах, которыми сегодня могут похвалиться более "взрослые" серверы. Несмотря на то что самой популярной областью применения поисковиков является поиск именно в Web, возможность найти нужную новость, музыкальную композицию или картинку ценится и приветствуется многомиллионной армией пользователей Internet.

Здесь стоит сделать оговорку и учесть, что и Google не день строился. Богатая функциональность стала неотъемлемой чертой популярного поисковика только после нескольких лет работы создателей над своим детищем. Тем не менее попытки Teoma, да и некоторых наблюдателей, назвать себя кандидатом на трон Google пока что не вызывают ничего, кроме удивления с большой долей скепсиса.

Но новичка все же можно похвалить. Во-первых, за широкие возможности представления результатов поиска (на заглавной странице механизма), которые имеет смысл разделить на три части -- Web-ссылки, смысловые папки и ссылки из частных коллекций, где энтузиасты Сети хранят свои закладки и подбирают тематические ссылки собственноручно. Во-вторых, страница результатов и интерфейс поисковика в целом не перегружены рекламой. Две ссылки, возглавляющие список результатов, -- это платные ссылки с поисковика Overture. Этим Teoma ограничивается -- никакой перегрузки баннерами или текстовыми ссылками коммерческого характера.