`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Ищем новости: обзор специализированных поисковиков

0 
 

Для таких целей и существуют специальные поисковые системы новостей, которые после ввода в форму поиска ключевого слова дают возможность пробежаться по ссылкам на другие издания. Технологии поиска наиболее актуальных и свежих материалов постоянно совершенствуются и обретают новую функциональность. В этом материале мы постараемся дать краткую характеристику наиболее интересным проектам из этого сегмента.


Англоязычные системы

AllTheWeb News

Разработчики норвежской компании FAST, постоянно расширяющие функциональность своего главного поисковика, расположенного по адресу www.alltheweb.com (лицензированного компании Lycos), также создали интерфейс для поиска новостей. AllTheWeb News везде рекламируется как наиболее быстрый: действительно, если ввести в поисковую форму некое популярное словосочетание, вам представят результаты, которые попали в базу всего одну минуту назад. Однако при столь высоких скоростных показателях ресурс разочаровывает своей неразборчивостью в плане отсеивания ненужных данных. Если, скажем, история о какой-то компании была опубликована агентством Reuters и после этого попала в полсотни американских газет, то AllTheWeb услужливо предложит полсотни ссылок на один и тот же материал, опубликованный в различных изданиях. В последнее время данное неудобство проявляется не так часто, как раньше, однако релевантность ссылок AllTheWeb, безусловно, требует доработки.


Moreover.com

Компания Moreover уже долгое время считается бесспорным лидером в области поставки тематических новостей пользователям Internet и своим коммерческим клиентам. Поскольку новостные ленты являются основным ее бизнесом, то и неудивительно, что упор делается на коммерческие предложения от Moreover, которыми уже воспользовались такие структуры, как PeopleSoft, Wells Fargo и British Telecom. Кроме оперативного поиска по огромной базе англоязычных новостных ресурсов (всего же, как утверждает компания, она охватывает до 3000 сайтов), робот Moreover отсеивает заголовки по тематическим категориям. Последние из отобранных заголовков доступны на бесплатном сайте компании, кроме того, по новостям всегда можно пробежаться с помощью поисковой формы. Найденные результаты автоматически сортируются по дате публикации, так что наиболее свежая информация оказывается в верхней части списка. Механизм от Moreover используется для новостного поисковика компании AltaVista.


Google News Search Beta


Удобным сервисом в рассматриваемом направлении порадовал и Google, бета-версия его поиска новостей предлагает услуги, аналогичные описанному AllTheWeb News. Однако здесь полученные результаты можно сортировать и по дате появления, что полезно в тех случаях, когда интересны наиболее свежие, а не наиболее релевантные материалы по теме. В процессе использования AllTheWeb и Google создается впечатление, что по объему баз данных поисковики находятся примерно на одном и том же уровне. Так, в поиске новостей о компании Microsoft AllTheWeb выдал 808 заголовков, в то время как Google News Search показал 760 ссылок, однако ссылкой номер один в AllTheWeb был немецкий сайт поддержки пользователей Microsoft, что трудно рассматривать как новостной ресурс.


RocketNews

Небольшая компания из Оттавы создала весьма удобный ресурс, который индексирует заголовки и тексты статей крупнейших изданий в течение последних пяти дней. Результаты выдаются в хронологическом порядке, так что наверху всегда окажутся наиболее свежие заголовки, при этом никаких дополнительных настроек интерфейса не предусмотрено. Компания собирается зарабатывать деньги на продаже собственных технологий корпоративным клиентам и с этой целью предлагает различные продукты, связанные с поиском новостей. RocketNews также проделала определенную работу в области категоризации ссылок и так же, как и Moreover, предлагает новостной портал, где заголовки разбиты на тематические разделы.


Search.com News

Неплохой поисковик по материалам прессы создала и поддерживает в актуальном состоянии компания CNET Networks. Область поиска разбита на категории, среди которых "Последние новости", "Газеты", "Деловые новости" и т. д. При желании настроить поле поиска можно самостоятельно, однако выбирать придется из изданий, предложенных CNET. Поиск по категориям по умолчанию выдает результаты, основанные на релевантности. Если документы нужно отсортировать в обратном хронологическом порядке, то это можно сделать, приложив дополнительные усилия.


NewsFind

Сайт NewsFind является подразделением компании WorldNews Network, которая задалась целью собрать ссылки на огромное количество ежедневно публикуемого контента в рамках одного поисковика. Из всех поисковых средств NewsFind обладает наиболее обширной базой ссылок, причем лидерство в данной категории бесспорное. Так, на запрос о новостях, касающихся Microsoft (новости и статьи о компании появляются в прессе весьма регулярно), он ответил более 24 тысячами заголовков. Даже после сужения области поиска до статей на английском языке показатель превысил 21 тысячу. Поисковик на момент написания материала поддерживал 18 языков, хотя русского и украинского в их числе не было.


Northern Light


Проект Northern Light, который еще недавно весьма высоко котировался в качестве инструмента для поиска сайтов, в целях увеличения финансовых потоков начал специализироваться на поиске документов и обзавелся весьма неплохим новостным роботом. Работу с новостными ресурсами можно ограничить по тематическим категориям, а что касается хронологических настроек, то здесь Northern Light предлагает весьма узкий выбор опций "За две недели", "За сегодня" и "За последние два часа". Отличительной особенностью ресурса является создание тематических "папок". В случае, если запрос был слишком объемным, пользователь может выбрать интересующую его тематику.


Русскоязычные поисковики

Яndex Новости

В числе ресурсов, которые ежедневно проверяются российским Яndex на предмет свежих новостей, есть и украинские сайты -- поисковик предпочитает ограничивать свое поле действий не политическими, а языковыми границами, т. е. попасть в число индексируемых имеют шанс ресурсы, интересные русскоязычному читателю. Результаты работы системы автоматически сортируются в обратном хронологическом порядке, а в опциях расширенного поиска можно настроить источники, по которым хотелось бы провести поиск. Одна из наиболее удобных функций -- это возможность подписаться на новости, содержащие определенное ключевое слово. Заголовки в виде ежедневного дайджеста будут поступать в ваш почтовый ящик.


Сми.ру

Еще один весьма удобный ресурс для поиска новостей в русскоязычных изданиях. На Сми.ру собираются заголовки и первые абзацы статей из крупнейших печатных и онлайновых изданий. Поисковик принимает запросы на материалы, опубликованные в течение последнего года, однако если есть желание проследить хронологию публикаций в определенном разделе, то ссылка "предыдущие 25" выведет на список статей, размещенных ранее. У проекта существуют и украинские "филиалы", однако здесь непосвященный пользователь может запутаться. По адресу www.smi. ru/ukraine/ расположены ссылки на материалы об Украине, опубликованные в российских изданиях, в то время как на http://ukr.smi.ru/ -- список заголовков "избранных" украинских изданий. Поиск поддерживается на всех вышеуказанных сайтах, однако списки заголовков в определенных случаях представляют продукты не первой свежести -- это, пожалуй, один из главных недостатков.


Rambler


Удобный механизм для обнаружения русскоязычных новостей работает и на портале Rambler. Форма поиска новостей находится на заглавной странице Rambler, а по адресу news.rambler.ru расположился собственный информационный проект компании, и поиск там ведется по заголовкам Rambler Media. По умолчанию Rambler ранжирует документы по серверу, на котором они находятся, однако в опциях настройки присутствуют и варианты сортировки по релевантности страницы, а также дате публикации материала. Судя по набору получаемых ссылок, индексируются только российские издания. Что касается информационной насыщенности поисковой базы Rambler, то тут преимущество Яndex трудно оспорить -- на горячую тему "выборы Украина" Rambler выдал всего 5 документов (4 из них -- с российского сервера Lenta.ru), в то время как Яndex порадовал 53 ссылками. Аналогичный поиск на сайте Сми.ру без временного ограничения публикации материала представил свыше 14 тысяч документов, а поиск на ukr.smi.ru сообщил об обнаружении более чем 7 тысяч статей (была выбрана опция "Все слова", так как по умолчанию Сми.ру ищет "Любое из слов").


Meta

С недавних пор возможность поиска по украинским Internet-изданиям предоставляет и Meta. На соответствующей странице пользователь может задать как ранжирование документов, так и желаемые источники. На момент написания материала поисковик индексировал новости 23 информационных сайтов украинского сектора Internet. Как сообщили разработчики, страницы с анонсами новостей соответствующих ресурсов сканируются каждые 15 минут, а в случае обнаружения нового документа новость загружается роботом, после чего может быть доступна по ссылке "Текст документа на Мете". В ближайшее время число сайтов-источников планируется довести до 35.


Сравнение англоязычных поисковиков

Сравнение англоязычных поисковиков

Назвать данные эксперименты тестированием, наверное, будет не совсем корректно. Во-первых, объективно оценить можно только количественную составляющую, так как о качестве предложенных новостей каждый должен судить сам. Во-вторых, и число новостей -- критерий изменчивый, и поиск, совершенный днем позже, будет отличаться от предыдущего и количеством, и качеством ссылок. Поэтому лучший поисковик новостей каждый для себя должен выбрать сам, мы же постарались дать примерную картину состояния дел в данной области сквозь призму нескольких запросов.

Для оценки объема баз данных поисковиков первые два запроса были довольно общими, так как требовалось гарантированное количество ссылок для сравнения возможностей поиска. Search.com на странице результатов поиска разбивает их по категориям, и поэтому сравнивать ресурсную базу поисковика от CNET с конкурентами весьма трудно. Moreover.com аналогично предлагает пять наиболее актуальных заголовков, приглашая зарегистрироваться для увеличения количества результатов, однако на странице поиска новостей от AltaVista движок Moreover не накладывает в этом плане никаких ограничений.

Третий запрос представляет собой имя американского сенатора, который недавно предложил на рассмотрение Конгресса США весьма спорный законопроект в области высоких технологий. Его имя неоднократно появлялось в изданиях, в основном, технологической и юридической направленности. Четвертый запрос позволяет делать выводы о том, в каком поисковике лучше всего искать новости географического характера.

В пятом -- фигурирует имя китайского руководителя правительства, так как именно он присутствовал при запуске беспилотного космического модуля в день написания этого материала. Результаты данного поиска дают возможность судить и об оперативности новостных поисковиков. Имя президента КНР, безусловно, появлялось в прессе и по другим поводам, и поэтому количество результатов здесь не так важно, как их качество. "Космическую новость" не указал в списке результатов только поисковый механизм AltaVista-Moreover, а в Google ссылка на соответствующие материалы возглавила список.

Как можно видеть, по количеству результатов NewsFind оставляет далеко позади всех своих соперников, причем о конкуренции в данном случае говорить не приходится. Вместе с тем по умолчанию NewsFind обрабатывает весьма обширную коллекцию изданий, язык которых необязательно знаком пользователю. Движок Moreover на сайте AltaVista хорош, когда требуется найти новость общего характера, однако если речь идет о конкретном событии и конкретных личностях, то эффективность Moreover стремительно падает. Аналогичная ситуация характерна и для AllTheWeb и Google. Качественные результаты в процессе поиска показывает и Northern Light, использование которого дает еще одно небольшое преимущество -- многие новости хранятся поисковиком непосредственно на сайте, что иногда ускоряет время загрузки.


Сравнение русскоязычных поисковиков

Сравнение русскоязычных поисковиков

Проверочный поиск на русскоязычных поисковиках был начат с ключевых слов весьма общего характера. Ввиду своей российской направленности Rambler оказался крайне неудачным источником для поиска новостей, имеющих отношение к Украине. Здесь наибольшее количество результатов выдали Meta и Сми.ру. Относительный успех проектов Сми.ру в данной сфере вызван специализацией изданий, а также тем фактом, что в Сми.ру первоначальный поиск выдает результаты за все время. При попытке уравнять Яndex и Сми.ру и заставить поисковики "отчитаться" за последнюю неделю количественная разница была незначительной, для того чтобы говорить о преимуществе одного из них. Украинский поисковик Meta вырывался в лидеры в случаях, когда речь шла об информации, имеющей непосредственное отношение к Украине.

Фильм "Игры разума" (A Beautiful Mind) стал обладателем "Оскара" за лучшую кинокартину 2001 года, однако только Яndex сумел найти достаточное количество новостей для поклонников культуры. Компания IBM в течение недели привлекала внимание новыми технологиями, что вызвало неоднократное упоминание имени корпорации в прессе. Здесь Яndex оказался на голову выше конкурентов, и о противостоянии новостных поисковиков Rambler и Яndex говорить не приходится. В Сми.ру, напомним, поисковик выдал результаты за все время индексации заголовков.

AllTheWeb также поддерживает поиск новостей на русском языке, и для сравнительного анализа все запросы в данном тесте были сделаны с ограничением языка документа.


Что не вошло в обзор

В данном материале мы попытались сравнить инструменты для поиска новостей. Из обзора пришлось исключить новостные ресурсы как таковые, хотя в последнее время некоторые онлайн-сервисы трудно отнести к определенной группе. Скажем, популярный сайт Yahoo! News (news.yahoo.com) также дает возможность пользователю осуществить поиск по заголовкам и текстам статей десятков изданий, однако все эти издания должны размещать свой контент на Yahoo! News. Другими словами, поисковик, который вполне можно квалифицировать как новостной, на самом деле является локальным по сайту news.yahoo.com и поэтому в данный обзор включен не был. Есть еще несколько подобных примеров.

В целом, новостные поисковики в последнее время получили импульс к развитию. В некоторых случаях -- оставаясь дополнительным сервисом при больших проектах, а в других -- обретая собственную нишу на корпоративном рынке.

0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT