Сергей Брин: «Единственный качественный показатель работы поисковика — релевантность»

15 август, 2000 - 15:17КО

Продолжая публикацию архивных материалов предлагаем вашему вниманию статью из № 33 (249) «Компьютерного Обозрения» от 15 августа 2000 г. Не исключено, что это было первое интервью Сергея Брина на русском языке. Компании Google в тот момент еще не исполнилось и двух лет.

В процессе подготовки материала нам удалось связаться с Сергеем Брином, президентом компании Google, который любезно согласился ответить на наши вопросы.

Google трудно назвать первопроходцем Сети, Вы основали свою компанию, когда существовал уже широкий выбор поисковых средств — были и AltaVista, и Lycos. И тем не менее Вы занялись именно этим бизнесом?

Сергей Брин: «Единственный качественный показатель работы поисковика — релевантность»

В то время, когда мы начинали, было несколько поисковиков, но качество их работы оставляло желать лучшего. Каждый запрос возвращал вам около тысячи результатов, отсортированных в случайном порядке, не говоря уж о том, что сегодня эти же самые поисковые машины предоставят на некоторые запросы по 100 тыс. ссылок. Кроме того, предлагаемые технологии были довольно примитивными. Мы почувствовали возможность реализовать то, чего не хватало. И Google стал первым поисковиком, который мы сделали именно для Internet, и с самого начала он мог работать с гипертекстовой информацией.

Вы создали определенный стиль, направление, моду, если хотите, — интерфейс ресурса должен быть чистым. Почему вы не преобразовали проект в портал, не предложили своим посетителям бесплатную почту, биржевые котировки, подборки новостей и т. п.?

Да, почти все крупные поисковики постепенно превратились в порталы и одновременно перестали обращать внимание на собственно поиск, на чем их инновации в этой области закончились. Мы же фокусируем свои усилия именно на поиске в Internet, только при таком подходе есть шанс стать лучшими в данной области. Поиск информации занимает первое место среди возможных применений WWW и второе среди вероятных «точек приложения» Сети [уступая только электронной почте — ред.]. Вот почему для нас чрезвычайно важно продолжать работу именно в этой сфере и только в ней — иначе мы не сможем дальше находиться в числе лидеров Internet-поиска.

Общеизвестно, что основная особенность вашей системы — учет ссылок, ведущих на сайт, концепция их популярности. Какие еще алгоритмы определения релевантности легли в основу Google?

В Google представлено множество различных технологий. К примеру, анализ гипертекста, т.е. текста, содержащегося между тегами h1 и h6, применения различных шрифтов, других структур языка HTML — все используется для того, чтобы определить релевантность Web-страницы.

Когда Google заговорит по-русски? Поисковик выдает ссылки, если ввести запрос в кириллице, но официально в Advanced Search он не поддерживается.

Мы собираемся поддерживать как можно больше языков. Сегодня пользователи Google могут делать запросы на 15 языках, и мы работаем над дальнейшим развитием «многоязычности» Google. Причиной этого является также тот факт, что почти половина наших посетителей находится за пределами США. И так было практически с тех пор, как мы запустили Google. Я персонально занимаюсь вопросами скорейшего внедрения русского языка в интерфейс Google.

Кем Вы хотели стать, когда учились в школе, в институте? Кем бы Вы стали, если бы не были сейчас президентом самой «горячей» компании Силиконовой Долины?

В институте каких-то особых планов не было, поэтому я остался в аспирантуре (graduate school). Но в какой-то момент мне пришлось сделать выбор: начать свое дело или продолжать учебу. Выбор пал на первое.

Что для Вас является решающим фактором в работе поисковика?

Единственное, что нас интересует в поиске информации, — это релевантность ссылок. Упорядоченность нашей базы данных — забота номер два, но и она напрямую связана с единственным качественным показателем работы поисковой машины — релевантностью.

Существует мнение, что Вы и Ларри Пейдж, будучи студентами, не очень-то заботились о коммерциализации своей идеи, однако сегодня Вы — президент компании. Каким Вам видится будущее Google не как поисковой машины, а как бизнеса?

Вообще-то мы настроены очень оптимистично как в плане технологий, так и в области бизнеса. Свои доходы Google получает из двух источников — реклама и лицензирование технологий другим Web-сайтам. В обоих направлениях дела у нас идут лучше некуда, и компания уже довольно долгое время получает стабильные доходы. Похоже, что среди Internet-предприятий нашего типа и размеров мы гораздо ближе к получению прибыли, чем остальные. У нас есть более 200 рекламодателей. После окончания рекламных кампаний больше половины клиентов подписывают новые контракты о размещении текстовых ссылок на страницах с результатами поиска. А что касается лицензирования, наш поисковик востребован 80 клиентами в 20 странах мира, среди которых Yahoo, Netscape, Cisco и многие другие.

Вы упомянули, что Google является единственным поисковиком, созданным специально для работы с Internet и гипертекстом. Сегодня очень много говорится о специализированном поиске, и один из ваших основных конкурентов — FAST (www.alltheweb.com) предлагает своим пользователям поиск по FTP и МР3-поиск. Планируется ли что-то в этом направлении?

Проблему поиска файлов решить гораздо труднее, чем кажется. Наш исследовательский отдел сегодня работает над этими проблемами, и в ближайшее время можно ожидать появления специализированного поисковика по файлам PDF.

Каково Ваше отношение к дистрибутивному поиску? Какое будущее ожидает Napster-подобные поисковые машины?

Дистрибутивный поиск является довольно интересной технологией, и вскоре произойдет его симбиоз с традиционными решениями для поиска. Наверняка дистрибутивные приложения станут очень популярным способом поиска DVD.

Что увидит пользователь, решивший посетить Google.com, скажем, ровно через пять лет?

Ничего. У Google будет прямая нейронная связь с человеческим мозгом. А вообще, сложно ответить на этот вопрос. Все развивается достаточно стремительно, так что поживем — увидим.