Здравствуйте! Делюсь материалом, который мне и моим коллегам очень помогает в работе.


воскресенье

Алгоритм Яндекс Палех VS Google RankBrain

Сегодня речь пойдет о двух поисковых алгоритмах разных поисковых систем, но направленных на одну цель (главную цель всех поисковых систем) – понять, что именно ищет человек, задав тот или иной поисковый запрос, и предоставить релевантный исчерпывающий ответ, который удовлетворит потребности ищущего.

Представьте ситуацию – вы что-то ищете, но не знаете как точно это называется и вбиваете в поисковую строку всё, что хоть как-то может описать объект поиска.

Чаще всего в этом случае вводятся longtale-запросы (или «длиннохвостые», низкочастотные запросы, состоящие из более 3-4 слов):

Раньше поисковики выводили в результатах ответы, в которых было больше всего вхождений из запроса пользователя.

Но часто случалось, что такие результаты совсем не отвечали на запрос пользователя:

Поисковикам нужно было как-то научиться понимать, что конкретно ищет человек, вбивая ту или иную фразу в поиск, самую суть запроса. Помочь в этом поисковым системам может искусственный интеллект, или как его еще называют – машинный интеллект.

Google RankBrain

Для начала оглянемся назад в 2013 год и обратим своё внимание на блог компании Google, а именно, на новость от 14 августа: https://opensource.googleblog.com/2013/08/learning-meaning-behind-words.html

Новость с загадочным заголовком Learning the meaning behind words – «Понять смысл слов».

В двух словах: данная статья рассказывает о прогрессе в области машинного обучения и технологиях распознавания речи.

Приводится интересный эксперимент recognize cats (and many other objects) по распознаванию кошек и других объектов. Эксперимент закончился успехом – просмотрев более миллиона случайных скриншотов из YouTube алгоритм с использованием нейронных сетей смог распознать и построить лица людей и морды кошки. При том, что первоначальных параметров о том, как выглядят объекты, алгоритм не имел:

Но нас больше интересует вторая часть данной статьи, в которой рассказывается про технологию машинного обучения и обработку текстовой информации Word2Vec.

Данная технология занимается поиском связей между словами. Word2vec разбирает текст таким образом, чтобы найти сходства между понятиями.

Например, он понимает, что Париж и Франция связаны так же, как Берлин и Германия (столица и страна). На диаграмме ниже показано, насколько хорошо данная технология может разобрать города по странам, просто прочитав множество новостных статей – без участия человека.

У многих сейчас возникает вопрос, каким образом это все относится к RankBrain?

Дело в том, что RankBrain – это название системы искусственного интеллекта, созданной на базе алгоритмов машинного обучения. Своим действием RankBrain очень похож на Word2Vec.

RankBrain помогает обрабатывать результаты поиска. Смысл работы алгоритма следующий: так же, как Word2Vec, RankBrain ищет связи понятий, которые поисковый робот может распознать. Когда алгоритм встречает незнакомые для себя слова или фразы, он начинает искать и разбирать подсказки.

Таким образом, он пытается осознать, какие синонимы имеются по данному запросу. Найденные аналогии и ложатся в основу при фильтрации результатов.

Затем алгоритм сопоставляет поведенческие факторы пользователей по предложенным им результатам. И сортирует результаты, убирая неподходящие.

Возможно, это покажется непонятным и замысловатым, но чуть ниже покажем на конкретных примерах, и все встанет на свои места. А пока пару слов скажем о Яндексе.

Яндекс «Палех»

2 ноября 2016 компания Яндекс анонсировала свой новый алгоритм «Палех»:

Более подробно об Алгоритме «Палех» можете прочитать в нашей статье или в блоге Яндекса. Суть работы нового алгоритма очень схожа с RankBrain.


Чтобы не уходить в дебри теории, рассмотрим на примерах работу данных алгоритмов и оценим, кто из поисковых систем ответит лучше на наши запросы. Итак, раунд первый. Вбиваем запрос: «Кто является самым высоким млекопитающим». Видим следующие результаты выдачи:

  1. Google
  1. В выдаче видим общую информацию о крупных млекопитающих, в первом источнике видно, что это Жираф.

  2. Яндекс

    Яндекс только на 4-м месте предоставляет верный интересующий нас ответ и то только по прямому вхождению.

Безусловно, в самом источнике, который Яндекс показывает на первом месте в результате выдачи, говорится о том, что это Жираф, но в сниппете информация об этом не отражена. Плюсуем Гуглу.

Раунд второй. Запрос: «Вид спорта при котором штанга поднимается с груди спортсмена».

  1. Google
  1. На первом месте четкий ответ – тяжелая атлетика. Браво! Смотрим, что в Яндексе:

  2. Яндекс

    Выдача очень похожа. Ставим «плюс» как Яндексу, так и Google. Ответ на запрос есть на 1-м месте результатов выдачи.

Раунд третий. Усложним игру. Возьмем запрос «Жена Трампа»:

  1. Google
  1. Яндекс

Что Яндекс, что Google дали нам ответ. В выдаче Яндекса у нас отработал колдунщик, а в Гугле – быстрые ответы. Но в выдаче Гугла видим, что в сниппете на первом месте у нас выделено именно то, что мы ищем.

Теперь немного изменим запрос – следом поищем: «жена Дональда Трампа».

  1. Google
  1. Ответ был расширен, теперь мы знаем что у Американского президента было 3 жены. Чем парирует Яндекс?

  2. Яндекс

    А в Яндексе все без особых изменений. В третьем раунде получаем вновь превосходство Гугла.

Поможем Яндексу, проведем 4-й раунд, возьмем запрос, который сам Яндекс анонсировал при запуске Палеха: «Фильм про человека который выращивал картошку на другой планете». Что на этот запрос ответит Гугл?

  1. Google
  1. Ответ четкий и однозначный – Марсианин. Что насчет Яндекса?

  2. Яндекс

    Как мы видим, выдача Яндекса в данном случае «забита» новостями об алгоритме, хотя информация о фильме и представлена в блоке справа.

Раунд 5. Последний запрос возьмем коммерческий. Прикинемся блондинкой, вобьем запрос: «купить инструмент для проделывания дырок в бетоне небольшого размера»:) Итак, что скажет Гугл?

  1. Google
  1. Google на первом месте показывает статью о видах инструментов для сверления отверстий в бетоне, в общем-то – неплохо. Хотя ответ не совсем релевантен: мы всё-таки хотели купить, а не почитать о нём.

  2. Яндекс

    А в Яндексе почему-то релевантнее оказалась статья про дыроколы для кожи... Полный разгром и победа за google.

Выводы:

Хотя в нашей битве алгоритм Палех и проигрывает RankBrain, но не стоит забывать, что эти алгоритмы являются самообучающимися, а алгоритм Яндекса по времени был запущен намного позже алгоритма Google.

Возможно, в скором времени ситуация изменится.

Что с SEO?

Также хочется отметить, что запуск данных алгоритмов открывает новые реалии в области SEO. Во-первых, RankBrain является третьим по важности сигналом ранжирования.

Во-вторых, Палех и RankBrain наконец-то дают возможность владельцам сайтов писать тексты именно для людей, а не для поисковых машин, и быть в ТОПе.

Рекомендации для вебмастеров от Gary Illyes, о том как оптимизировать свой сайт под RankBrain, можно озвучить следующим образом:

«Если вы писали тексты для людей, используя язык, который вы обычно используйте при общении, то будьте уверены – ваш ресурс уже оптимизирован под RankBrain».

О том, что надо писать для людей и создавать сайты именно для них, поисковые системы говорят уже более 15 лет. Надеемся, что скоро это станет повсеместной реальностью.

Автор Дмитрий Кудинов - Руководитель отдела Технического SEO

1 комментарий:

  1. Забодали уже этими алгоритмами. Только приспособишься, как снова разбирайся.
    За статью спасибо.

    ОтветитьУдалить