Презентация нового поиска запомнилась прямым включением с МКС с участием российских космонавтов и рассказом «Яндекса» о собственных достижениях в применении нейронных сетей в работе поиска.
С недавних пор «Яндекс» задает тренд использования нейронных сетей при ранжировании сайтов, в рамках которого он запустил алгоритм «Палех» в 2016 году. Представленный «Яндексом» и космонавтами алгоритм «Королев» — это модернизированный «Палех».
Представим ситуацию: пользователь не может объяснить, что он хочет найти. Яндекс в своем блоге приводит яркий пример, когда пользователь вводит запрос «картина где небо закручивается». Пользователь подразумевает картину Ван Гога, но не знает ее название. В таких случаях алгоритмы, используя нейронные сети, подбирают страницу, которая наиболее подходит по смыслу уникального запроса, а не по соответствию ключевых слов.
При «Королеве» нейросети помогают сопоставлять запросы со всем содержимым страницы, включая, тексты или изображения, а при «Палехе» — только с заголовками title веб-страниц.
При «Королеве» сопоставление смысла запроса и содержимого страницы происходит на этапе индексирования страницы — на основе данных, заранее сохраненных в поисковой базе, а не в режиме реального времени, как при «Палехе». Это позволило «Яндексу» обрабатывать большие по объему массивы данных в более короткие сроки.
«Королев» учитывает пользовательские сигналы о релевантности страниц. Откуда они берутся? Из сервиса «Яндекс.Толока». Суть в том, что реальные люди на примере простых заданий определяют соответствие того или иного веб-документа заданному запросу. Таким образом, «Яндексу» удается делать процесс саморазвития нейросетей непрерывным.
Тексты запросов преобразуются в векторы, как и семантика документа на этапе индексирования. При этом система выполняет скалярное перемножение этих двух векторов, формируя результат. Этот подход составляет основу нового алгоритма и позволяет повысить точность ответа «Яндекса» на сложные низкочастотные запросы.
C информационными запросами все понятно, но как новый алгоритм влияет на коммерческие? Нужна ли помощь нейросетей, когда пользователь ищет, где купить офисное кресло или цену на удочку для ловли карпа? Сложно трактовать подобные запросы менее конкретно.Резких изменений в нише коммерческих сайтов не наблюдается. Это ожидаемо — основа механизма реализована в поиске давно. При этом, новый алгоритм нужно держать во внимании как еще один фактор, влияющий на успешность сайта в выдаче.
Остается надеяться, что нововведения «Яндекса» не помешают ранжироваться качественным и полезным сайтам. Время покажет, что будет дальше.