Здравствуйте! Делюсь материалом, который мне и моим коллегам очень помогает в работе.


воскресенье

Микроформаты и микроданные

Старая идея «семантической паутины», которую так и не смог продвинуть консорциум W3C, в последнее время снова набирает обороты. В России «Яндекс» достаточно активно настаивает на внедрении микроформатов, а за рубежом совсем недавно образовался неожиданный союз: Google, Bing и Yahoo! (точнее, Google, Inc., Yahoo, Inc. и Microsoft Corporation) создали совместный проект schema.org. С его помощью они собираются привить вебмастерам привычку размечать страницы тегами Microdata (пока черновой стандарт HTML5). Надо отметить, что этот формат разработан без консультаций с W3C, а так как вебмастерам гораздо интереснее «радовать» Google и остальные поисковики, нежели некий туманный для многих консорциум, именно Microdata станет базовым в зарубежном интернете. В России, кстати, пока что «Яндекс» не поддержал инициативу schema.org, поэтому по Рунету распространяется другой формат семантической разметки: µF (микроформаты, http://microformats.org/wiki). Очевидно, что для успешного взаимодействия со всеми поисковиками придется дублировать семантические описания страниц. Хотя Google поддерживает микроформат hProduct, он явно будет предпочитать собственный язык.

Пара слов о Semantic Web

Веб-страница может быть простым документом без специальной разметки для поисковика. В этом случае ему приходится анализировать документ своими методами, извлекая и структурируя информацию. Какими бы совершенными ни были алгоритмы ПС, неизбежны ошибки — особенно если нужен не просто поиск по ключевым словам, а установление смысла и отношений между смыслами. Семантическая разметка страниц позволит машинному разуму извлечь данные, пригодные для прямого помещения в базу данных и для любой обработки. Семантическая паутина дает возможность поисковику предоставлять прямые и сразу сформулированные на человеческом языке ответы на вопросы пользователей. Например, на запрос «рецепт борща» поисковик сразу выдаст ответ с ингредиентами и их количеством, а на «сколько гигабайт памяти в ноутбуке Asus K73e» — цифру 4. Но поисковик не будет рисковать обмануть пользователя — такие ответы нельзя строить на основе анализа страниц! Ответы должны быть на сто процентов верными: нельзя перепутать оперативную память и объем жесткого диска, это очень сильно уменьшит лояльность пользователя к поисковой системе. Задачу правильного понимания контента машиной решает разметка специальными тегами.

Ниже мы разберем примеры описания продукта в двух главных форматах нынешнего поколения. Это только пример, здесь приведены не все возможные параметры и «типы полей».

Google — microdata (schema.org) 

Выглядить это будет так:
Микроволновая печь Samsung MW73VR
Микроволновая печь Samsung MW73VR - фото
Средняя оценка покупателей 4
на основе 11отзывов
2630 р.
В наличии
Отдельностоящая микроволновая печь объемом 20 л и мощностью 800 Вт
Отличная печка - от Иван,
1 апреля 2011
4/
5stars
Легко чистить

«Яндекс» — microformats (hProduct, пока используется ПС только для обработки отзывов об автомобилях)


Выглядить это будет так:
Ford
Focus
Ford Focus, хэтчбек 5 дв ST - фото
хэтчбек 5 дв
ST
2.5
MT
(225л. с.)
2009
года выпуска
(переднийпривод, левый руль).
Подробнее про эту конфигурацию
Приобретен
15 сентября 2010
с пробегом 15 тыс. км.

Валидация 

Инструментарий для проверки кода предоставляет «Яндекс.Вебмастер», но можно воспользоваться и сторонним сервисом Optimus.

CMS с поддержкой микроформатов

Внедрить семантическую разметку вручную можно на небольшом сайте — или на небольшом количестве страниц (например, на странице с контактной информацией). Вручную же писать код для тысяч товаров интернет-магазина абсолютно нереально. Поэтому необходимо пользоваться системами управления контентом, уже поддерживающими микроформаты — например, Drupal, Wordpress, Movable Type. Или же писать модуль с таким функционалом для используемой CMS.

Выводы

Помните, что семантической разметкой можно пользоваться только для представления в удобной поисковикам форме реального, существующего, видимого посетителям страницы контента. Все остальное (например, попытки разметки скрытых элементов) будет распознано, классифицировано как поисковый спам и пресечено жесткими пессимизационными санкциями. Разметка такого типа — это шаг в будущее, ее рекомендуется использовать везде, где только это возможно и целесообразно. Пока что — оба формата, но вполне возможно, что под давлением инициативы schema.org «Яндекс» тоже начнет поддерживать Microdata, что устранит необходимость дублирования разметки.

Комментариев нет:

Отправить комментарий