10 декабря 2019 г., 12:20
В последнее время благодаря технологиями машинного обучения исследователи Google достигли заметных успехов в области понимания языка, и поисковик стал намного лучше обрабатывать запросы. Отмечается, что сделан крупнейший прорыв за последние пять лет и один из самых грандиозных успехов за всю историю Google Поиска.
В прошлом году компания в открытом доступе представила технологию предварительного обучения обработке текста на естественном языке (NLP), разработанную на базе нейронных сетей. С помощью BERT (Bidirectional Encoder Representations from Transformers) каждый может обучить собственную современную вопросно-ответную систему.
Этот прорыв произошел благодаря изучению трансформеров — моделей, которые обрабатывают слова не как последовательность разрозненных языковых единиц, а учитывают в предложении взаимодействие слов друг с другом. Поэтому модели BERT могут обрабатывать не только отдельные слова, но и понимать контекст, в котором они употребляются. Это особенно важно для понимания истинного смысла поисковых запросов.
Но для решения поставленной задачи нужны не только новые программы, компании не хватало и технической составляющей. Некоторые модели, которые можно создать с помощью BERT, настолько сложные, что имеющееся даже в распоряжении Google оборудование с ними не справлялось. Поэтому в компании впервые стали использовать тензорные процессоры (TPU), с помощью которых можно быстро подобрать для пользователя более актуальную информацию.
Теперь обрабатывая стандартные и выделенные описания с помощью моделей BERT, удается намного лучше справляться с поиском нужной информации. Если говорить о стандартных описаниях, то BERT помогает Google лучше понимать каждый 10-й англоязычный запрос в США. В основном Google Поиск станет эффективнее для длинных и разговорных запросов, а также запросов с предлогами. Теперь поисковая система будет лучше понимать контекст и показывать соответствующие результаты, а значит вы сможете использовать более естественные запросы.
Но BERT используется не только для английского, но и для других языков, в том числе и для русского. Созданные на его основе системы хороши тем, что они могут применить принципы, которым обучились на одном языке, к другим.
Сообщается, что этого месяца модели BERT станут доступны и для запросов на русском языке.
"Человеческое любопытство не знает границ. Ежедневно мы видим миллиарды поисковых запросов, и 15% из них — совершенно новые. Чтобы обрабатывать такие запросы, мы создали новые инструменты", отметил Панду Найак, вице-президент Google Поиска.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365