SAS представила решение для систематизации неструктурированного контента

17 февраль, 2009 - 13:05

Данные, генерированные приложениями, бизнес-процессами, информация блогов, статей общедоступных досок объявлений на базе веб и пр. все чаще становятся основой для принятия стратегически важных решений, в том числе и в таких известных компаниях как Associated Press, CNN, Factiva, eBay, Forbes.com, NYTimes Digital, Wolters Kluwer, Yahoo!. Вместе с тем применение современных технологий поиска к контенту, не имеющему строгой структуры, неэффективно.

SAS Content Categorization, новый продукт известного производителя решений в области бизнес-аналитики компании SAS, автоматизирует процесс систематизации информации на разных языках, выполняя разбор и анализ производимого предприятием контента по логическим категориям и событиям. Новый продукт разрабатывался подразделением SAS Teragram с использованием передовых лингвистических технологий и механизмов обработки естественного языка. Решение имеет интуитивный интерфейс, позволяет создавать и использовать собственные правила классификации документов, обеспечивает инструменты безопасного сотрудничества между разными подразделениями в масштабах отдельного проекта.

Например, внедрение таксономии в Reed Business дало возможность обработать миллиарды документов электронной биржи, в том числе данные о 14 млн компаниях, тысячах категорий продуктов, и за счет иерархической классификации объектов значительно повысить релевантность результатов поиска на веб-ресурсах компании.

Кроме того, SAS Content Categorization значительно сокращает непроизводительные издержки, связанные и процессом категоризации информации.