Google: путь к вершине

15 август, 2000 - 16:22Александр Москалюк

В рамках публикации архивных материалов предлагаем вашему вниманию статью из №32 (251) «Компьютерного Обозрения» от 15 августа 2000 г. 20 лет назад наше издание опубликовало первую развернутую статью про Google.

Осенью 1998 г. ваш покорный слуга в «Компьютерном Обозрении», № 45 написал: «...внимание пока стоит обратить на бета-версию поисковика Google Стэнфордского университета». Знать бы в то время, что через год с лишним Google станет одной из самых интересных разработок в области поиска и попадет в список наиболее перспективных частных компаний Силиконовой Долины, формулировку предложения, упоминающего Google, можно было бы изменить. Однако тогда трудно было предположить, что за два года компания, основанная двумя студентами Стэнфорда, войдет в число самых авторитетных, и в июне 2000 г. даже подпишет соглашение об обслуживании поисковых запросов на самом популярном сайте планеты — Yahoo.com, который также родился на свет благодаря усилиям двух студентов того же вуза.

Google: путь к вершине

В 1995 г. двое студентов докторантуры Стэнфордского университета — Ларри Пейдж (Larry Page) и Сергей Брин — занимались различными аспектами управления данными. Именно Пейдж в далеком 1996 начал активно использовать Internet для своих исследовательских проектов в области data mining — тогда Web представлял для Пейджа только лишь источник случайно подобранной информации для его разработок. Оба студента входили в рабочую группу MIDAS (Mining Data at Stanford). Немного позже под управлением Раджива Мотвани (Rajeev Motwani), доцента кафедры информатики и вычислительной техники (Computer Science), Пейдж и уроженец Москвы Брин начали разработку собственной поисковой системы. Уже в то время на Internet-рынке присутствовали различные компании, предоставляющие услуги поиска, однако для будущих докторов наук проект был сродни академической забаве — никто и не думал о быстрой капитализации и создании бизнес-плана.

Идея, которая легла в основу поисковой машины, была описана в нескольких научных работах и в то же время довольно проста для понимания — Сеть содержит огромное количество информации, и определить релевантность отдельно взятой странички большинство поисковиков пытаются по наличию в HTML-файле ключевых слов, которые пользователь ввел в форму поиска. Google же индексирует линки, исходящие со страницы, считая каждую ссылку на определенный сайт «голосом», увеличивающим ценность сайта, на который ссылаются. Логично предположить, что на сайт популярный и содержащий полезную информацию ссылаться будут чаще, чем на ресурс бесполезный и неинтересный.

Однако этим определение релевантности сайта не исчерпывается. Полученный результат — условный рейтинг популярности ресурсов — также можно использовать и как источник информации о сайтах, на которые эти самые качественные ресурсы указывают. Таким образом, одна ссылка на вашу страницу с сервера Yahoo! или About.com может оказаться более ценной, чем сотни ссылок с неизвестных домашних страничек — в этом случае Yahoo! и About.com рассматриваются как авторитетные источники и, следовательно, содержат ссылки на высококачественные сайты.

Создатели Google посчитали, что дополнительные исследования работе поисковой машины никак не помешают, и к моменту основания компании поисковый сервер на основе технологии Page Rank уже проработал больше чем два года. Еще в 1996 г. студенты отметили, что их разработка во многих случаях предоставляла более точные результаты, чем остальные поисковики, а в 1997 Google стал внутренним поисковиком Стэнфордского университета. В том же году Пейдж и Брин идут на первые расходы, связанные с дальнейшим развитием Google, — они покупают жесткие диски суммарным объемом в 1 ТВ, что обходится им в 15 тыс. долл. Все растраты пока приходится покрывать собственными кредитными карточками.

В сентябре 1998 г. становится понятно, что для того чтобы развивать технологию и дальше, а также начать лицензировать ее заинтересованным сторонам, необходимо создать компанию. Пейдж и Брин за полгода до защиты докторской диссертации уходят из Стэнфорда и забирают с собой Крега Сильверштейна (Craig Silverstein), который назначается техническим директором. В какой-то момент энтузиасты встречают одного из основателей Sun Microsystems Энди Бехтольшайма (Andy Bechtolsheim), и тот после расспросов о дальнейших планах предприятия тут же выписывает экс-студентам чек на 100 тыс. долл. Тот же 1998 г. обозначился в истории развития Internet резким ростом медиа-компаний. Все поисковые машины, которые до этого предлагали своим пользователям возможность найти необходимую информацию в Сети, внезапно решили заняться предоставлением Internet-услуг бесплатной почты, биржевых котировок, новостийных заголовков и прочих атрибутов портала. Когда Пейдж встречается с Джорджем Беллом (George Bell), генеральным директором Excite, тот не высказывает заинтересованности в уникальной поисковой технологии. «Пока наша поисковая система находится в более или менее приличном состоянии, нас это устраивает», — утверждает Белл, намекая, что собственно поиск перестает быть объектом интереса для порталов.

В 1998 г. Google запущен на сервере Стэнфордского университета, и его можно найти по адресу google.Stanford.edu. В то время когда другие стартапы получали финансирование, еще не написав бизнес-плана и не разработав собственного продукта, Google пришлось идти своим путем. Вместо того чтобы заняться агрессивным маркетингом и продвижением своего проекта, Пейдж и Брин предпочитают нанять на работу около 150 сотрудников, 20 из которых — доктора наук. Компания не рекламирует себя, закупая миллионы баннеров, не заботится о брендинге и рыночном становлении проекта, не собирается зарабатывать деньги путем показа баннерной рекламы на собственном сайте. Несмотря на такую пассивность с точки зрения маркетолога, известность поисковика продолжает расти, и многие пользователи, привыкшие к обращению к нескольким поисковым системам одновременно, выбирают Google, каждый по каким-либо своим субъективным причинам. Кому-то нравится неброский интерфейс и простота использования, кому-то — скорость работы и неперегруженность сайта рекламой, кому-то — качество результатов поиска.

Известный в США эксперт по usability Джейкоб Нильсен (Jacob Nielsen), который входит в Совет директоров Google, как-то, вспоминая о поисковике, говорит: «Их я считаю своими лучшими клиентами. У них вся компания одержима идеей удобства и простоты использования». Более того, убедившись в благосклонности пользователей к поисковикам с простым интерфейсом, компания AltaVista выпускает новую оболочку для своей поисковой машины, заявив о Raging Search (www. raging.com) как о «более быстром и эффективном механизме». Упрощенный вариант пользовательского интерфейса представила российской аудитории и Yandex (www.yandex.ru), расположив «чистый» интерфейс по адресу www.ya.com.
Что касается скорости работы, то Google использует 4 тыс. компьютеров, расположенных в collocation-центре компании Exodus. Интерес компьютерной общественности вызвал также тот факт, что компания использует купленные в обычном магазине компьютеры с предустановленной операционной системой Linux. Несколько компьютеров поддерживают работу собственно поисковика, обслуживая около 17 млн. запросов в день, остальные же работают с алгоритмами data mining, ежечасно анализируя содержание сайтов на предмет релевантности его запросам пользователя, подсчитывая исходящие гиперссылки и занося в базу данных новые сайты. Именно Google стал первым поисковиком, объявившим об увеличении базы данных до миллиарда уникальных документов. Позже доступ к базам данных аналогичных размеров открыли Inktomi и Fast Search — основные крупные игроки на рынке поиска в Сети.

Отсутствие баннеров пока восполняется рекламой в виде текстовых ссылок, однако руководство Google не считает рекламу единственным источником своих доходов. Сергей Брин также исключает возможность подтасовки результатов для поиска или продажи ссылок по аукционному принципу, как это делает, скажем, Goto.com. «Мы ничего не настраиваем сами. Это означало бы, что наши инженеры плохо поработали», — говорит он в интервью британской газете «Sunday Times», и тут же к разговору подключается Ларри Пейдж с вопросом: «Почему же тогда, когда я набираю Sergey в форме поиска, меня направляют к твоей домашней странице?». «Это просто показывает, насколько мы популярны», — отвечает Брин, имея в виду алгоритм Google, который определяет популярность сайта по количеству ссылок на него.

Именно этот факт стал причиной одного из курьезов. При запросе «Who is more evil than Satan?» (Кто представляет большее зло, чем сам Сатана?) поисковая машина Google направляла посетителей на... сайт корпорации Microsoft. Причиной тому стали многочисленные ссылки на www.microsoft.com с различных страниц, где Билл Гейтс и его творение отождествлялись с империей зла. Сегодня поисковик при получении данного запроса уже выдает ссылки на описание этого самого курьеза.

В настоящее время Google -одна из самых «горячих» компаний Силиконовой Долины. Второй раунд финансирования позволил специалистам получить 25 млн. долл, для дальнейшего развития проекта, а в Совете директоров, кроме упомянутого выше Джейкоба Нильсена, можно увидеть и других знаменитостей Internet — Джона Доуэра (John Doerr) из венчурного фонда Kleiner Perkins Caufield & Byers; Рама Шрирама (Ram Shriram), вице-президента Amazon.com и Майкла Морица (Michael Moritz) из Sequoia Capital.

Интерес для инвесторов представляет и тот факт, что компания до сих пор не котируется на бирже, и это в то время, когда о первоначальной эмиссии акций Internet-фирм ходят легенды. Пока что руководство и директорат Google ссылаются на негативные тенденции на фондовом рынке, и поэтому IPO одного из самых перспективных предприятий Сети откладывается на более поздний срок. Бизнес-модель, которой так часто не хватает многим Internet-компаниям, в случае Google довольно проста — компания лицензирует свои базы данных и механизм поиска партнерам. Кроме этого, принимаются заявки на размещение текстовой рекламы в результатах поиска (однако тут Google проводит четкую границу между результатами поиска и рекламным текстом).

Партнерские соглашения с Google на момент написания этой статьи заключили почти полсотни структур, среди которых газета «Washington Post», фирмы Caldera Systems, Cisco, RedHat, Nextel, порталы Business.com и Netscape Netcenter и, конечно же, крупнейший сайт Сети — Yahoo!. Компания также разрабатывает специализированные базы данных — желающие могут искать информацию на сайтах, принадлежащих американскому правительству (http://www.google.com/ unclesam), и ознакомиться со страницами, посвященными плат-формам Linux, BSD и Apple Macintosh. Робот-индексатор также регулярно посещает сайты крупнейших американских вузов, редактируя таким образом специализированную базу данных Google University Search (http:// www.google.com/universities.html). Уже довольно долгое время в состав поисковой машины входит и каталог Google Directory, который черпает свои данные из проекта Open Directory (http:// www.dmoz.org) с единственным лишь отличием — рейтинг сайтов в определенной категории зависит от популярности ресурса.

Компания продолжает бурно расти не в последнюю очередь благодаря усилиям руководства, направленным на поддержание в коллективе «домашней» обстановки. Каждый сотрудник Google получает возможность бесплатно питаться у одного из лучших шеф-поваров Калифорнии, который раньше готовил для известного музыканта Джерри Гарсиа. Приемная компании в Силиконовой Долине оформлена с использованием цветов логотипа Google, и сразу же при входе в офис посетители могут увидеть монитор, на который в режиме реального времени выводятся запросы, обрабатываемые поисковой машиной на данный момент.

Что касается будущего компании, то для ее руководства легче описать то, чего не случится. Google не превратится в очередной портал, а будет по-прежнему сосредоточивать усилия на улучшении поисковой машины. Персонализация также станет важным аспектом в плане дальнейшего развития молодой компании. Инженеры Google уже сегодня работают над технологиями, которые будут определять тематическую направленность термина (скажем, при запросе «мышь» поисковик, основываясь на предыдущем опыте общения с пользователем, попробует установить, что именно имеется в виду — животное-грызун или неотъемлемый атрибут домашнего компьютера). При этом будут учитываться и географические предпочтения пользователя, т. е. посетитель Google, набравший слово «пицца» в окне поиска, получит результаты, которые будут отличаться от тех, которые получит клиент, желающий найти ближайшую пиццерию в Киеве.

Продолжает Google и наращивать собственную базу данных, и в будущем можно надеяться, что поисковик оправдает свое имя — число, отображающееся единицей с сотней нолей.