+11 голос |
Результаты стандартного поиска в Интернете это лишь верхушка того айсберга информации, большая часть которого скрыта в неиндексированных глубинах Веба. Исследованию этого неизведанного онлайнового мира посвящена программа Memex агентства Defense Advanced Research Projects Agency (DARPA), реализуемая при участии 17 команд, в том числе лаборатории JPL аэрокосмического агентства NASA в Пасадене (штат Калифорния).
Memex проверяет не только стандартное текстовое содержимое веб-страниц, но также картинки, видео, всплывающую рекламу, анкеты, скрипты и другие формы представления информации, выявляя возможные связи между ними. В видео анализируются даже отдельные кадры, причем один и тот же объект может идентифицироваться не только в пределах одного, но и нескольких видеороликов.
«Мы дополняем функциональность поисковых роботов, позволяя им действовать подобно браузерам – другими словами, исполнять скрипты и читать рекламу, что делаете вы находясь онлайн. Эта информация обычно не каталогизируется поисковиками», – заявил Крис Маттман (Chris Mattmann), главный исследователь со стороны JPL в проекте Memex.
Все ПО, написанное для Memex будет бесплатно и иметь открытые исходники. Эти инструменты могут быть полезны при отслеживании активности террористов и распространения эпидемических заболеваний, улучшении поиска в PDF-документах, систематизации огромных объемов научной информации, ежедневно поступающей от космических аппаратов.
Memex связана с предыдущей инициативой DARPA XDATA, нацеленной на обработку и анализ больших объемов данных в военных, гражданских и правительственных приложениях.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365
+11 голос |